[2603.02924] HDINO: A Concise and Efficient Open-Vocabulary Detector

논문 정보

날짜: 2026-03-05
카테고리: -
우선순위 점수: 0.0

핵심 요약

HDINO는 수동 데이터 큐레이션 없이도 효율적인 오픈 보캐블러리 객체 탐지를 수행하는 모델로, DINO 구조를 기반으로 한 2단계 학습 전략을 제안합니다. 시각-언어 간 의미 정렬을 위해 노이즈 샘플을 활용한 일대다 정렬 메커니즘(O2M)과 난이도 가중치 분류 손실(DWCL)을 도입했습니다. 결과적으로 Grounding DINO 대비 적은 학습 데이터로도 COCO 벤치마크에서 더 높은 성능을 달성했습니다.

학습자 관점 포인트

우리 팀 영향: 데이터 효율성이 높은 오픈 보캐블러리 탐지 기술을 확보하여 자원 제약이 있는 환경에서의 모델 학습 및 배포 효율을 개선할 수 있습니다.
권장 액션: 도입 검토
액션 근거: 적은 데이터셋으로도 기존 SOTA 모델인 Grounding DINO의 성능을 상회하며 코드와 모델이 공개되어 있어 기술 검증이 용이합니다.

원문 링크

arXiv: https://arxiv.org/abs/2603.02924
Hugging Face Papers: https://huggingface.co/papers/2603.02924

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2603.01847] GroupEnsemble: Efficient Uncertainty Estimation for DETR-based Object Detection [2603.03756] MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크