تخطي إلى التنقل الرئيسي تخطي إلى البحث تخطي إلى المحتوى الرئيسي

Self-Supervised Object Detection from Egocentric Videos

  • Peri Akiva
  • , Jing Huang
  • , Kevin J. Liang
  • , Rama Kovvuri
  • , Xingyu Chen
  • , Matt Feiszli
  • , Kristin Dana
  • , Tal Hassner

نتاج البحث: فصل من :كتاب / تقرير / مؤتمرمنشور من مؤتمرمراجعة النظراء

ملخص

Understanding the visual world from human perspectives has been a long-standing challenge in computer vision. Egocentric videos exhibit high scene complexity and irregular motion flows compared to typical video understanding tasks. With the egocentric domain in mind, we address the problem of self-supervised, class-agnostic object detection, aiming to locate all objects in a given view, without any annotations or pre-trained weights. Our method, self-supervised object detection from egocentric videos (DEVI), generalizes appearance-based methods to learn features end-to-end that are category-specific and invariant to viewing angle and illumination. Our approach leverages natural human behavior in egocentric perception to sample diverse views of objects for our multi-view and scale-regression losses, and our cluster residual module learns multi-category patches for complex scene understanding. DEVI results in gains up to 4.11% AP50, 0.11% AR1, 1.32% AR10, and 5.03% AR100 on recent egocentric datasets, while significantly reducing model complexity. We also demonstrate competitive performance on out-of-domain datasets without additional training or fine-tuning.

اللغة الأصليةالإنجليزيّة
عنوان منشور المضيفProceedings - 2023 IEEE/CVF International Conference on Computer Vision, ICCV 2023
ناشرInstitute of Electrical and Electronics Engineers Inc.
الصفحات5202-5214
عدد الصفحات13
رقم المعيار الدولي للكتب (الإلكتروني)9798350307184
المعرِّفات الرقمية للأشياء
حالة النشرنُشِر - 2023
منشور خارجيًانعم
الحدث2023 IEEE/CVF International Conference on Computer Vision, ICCV 2023 - Paris, فرنسا
المدة: ٢ أكتوبر ٢٠٢٣٦ أكتوبر ٢٠٢٣

سلسلة المنشورات

الاسمProceedings of the IEEE International Conference on Computer Vision
رقم المعيار الدولي للدوريات (المطبوع)1550-5499

!!Conference

!!Conference2023 IEEE/CVF International Conference on Computer Vision, ICCV 2023
الدولة/الإقليمفرنسا
المدينةParis
المدة٢/١٠/٢٣٦/١٠/٢٣

ملاحظة ببليوغرافية

Publisher Copyright:
© 2023 IEEE.

بصمة

أدرس بدقة موضوعات البحث “Self-Supervised Object Detection from Egocentric Videos'. فهما يشكلان معًا بصمة فريدة.

قم بذكر هذا