MiLO: Multi-task Learning with Localization Ambiguity Suppression for Occupancy Prediction
Authors : Thang Vu, Jung-Hee Kim, Myeongjin Kim, Seokwoo Jung, Seong- Gyun Jeong
Conference : CVPRW
Year Published : 2023
Topics : Computer Vision, 3D

Abstract


CVPR 2023에서 열린 카메라 기반 3D 점유 예측 챌린지를 위한 해결책으로 다중 작업 학습과 위치 불확실성 억제를 결합한 MiLO(Multi-task Learning with Localization Ambiguity Suppression for Occupancy Prediction)를 제시합니다. 제안된 MiLO는 두 가지 중요한 측면에서 독특합니다: (1) 다양한 깊이를 고려한 다중 작업 학습을 통해 관점 의미 예측, 깊이 추정, 점유 예측을 결합하여 더 강력한 표현을 제공하고, (2) 객체 클래스와 거리와 관련하여 카메라 기반 시스템에서 저신뢰성 위치 추정을 적응적으로 억제하는 위치 불확실성 억제입니다. 또한, 우리의 방법은 성능을 향상시키기 위해 여러 기술을 활용합니다. 최종 모델은 외부 데이터를 사용하지 않고 52.45점 mIoU를 달성하며, CVPR 2023 3D 점유 예측 챌린지에서 2위를 차지했습니다.