[2602.23339] Retrieve and Segment: Are a Few Examples Enough to Bridge the Supervision Gap in Open-Vocabulary Segmentation?

논문 정보

날짜: 2026-02-28
카테고리: -
우선순위 점수: 0.133

핵심 요약

텍스트 프롬프트와 소수의 픽셀 주석 이미지를 결합하여 오픈 보캐블러리 세그멘테이션의 성능을 높이는 검색 증강 테스트 타임 어댑터를 제안합니다. 기존의 수동적인 융합 방식 대신 학습 가능한 쿼리별 융합을 통해 텍스트와 시각적 지원 기능 간의 시너지를 극대화했습니다. 이 방법은 지원 세트를 지속적으로 확장할 수 있으며 개인화된 세그멘테이션과 같은 미세한 작업에도 적용 가능합니다.

학습자 관점 포인트

우리 팀 영향: RAG 기반의 시각적 지원 세트를 활용하여 제로샷 모델의 한계를 극복하고 도메인 특화 세그멘테이션 성능을 개선할 수 있습니다.
권장 액션: 실험
액션 근거: 소수의 예시만으로 텍스트 모호성을 해결하고 세그멘테이션 정확도를 높이는 방식이 실무 적용 가능성이 높기 때문입니다.

원문 링크

arXiv: https://arxiv.org/abs/2602.23339
Hugging Face Papers: https://huggingface.co/papers/2602.23339

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2602.22437] veScale-FSDP: Flexible and High-Performance FSDP at Scale [2602.22045] DLT-Corpus: A Large-Scale Text Collection for the Distributed Ledger Technology Domain

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크