[2602.22144] NoLan: Mitigating Object Hallucinations in Large Vision-Language Models via Dynamic Suppression of Language Priors

논문 정보
핵심 요약
학습자 관점 포인트
원문 링크

논문 정보

날짜: 2026-02-26
카테고리: -
우선순위 점수: 0.033

핵심 요약

대규모 시각-언어 모델(LVLM)의 객체 환각 현상이 주로 언어 디코더의 강한 사전 지식(Language Priors)에서 기인한다는 점을 실험으로 증명했습니다. 이를 해결하기 위해 멀티모달 입력과 텍스트 전용 입력 간의 출력 분포 차이를 이용해 언어 편향을 동적으로 억제하는 NoLan 프레임워크를 제안했습니다. 별도의 추가 학습 없이도 LLaVA-1.5 및 Qwen-VL 모델에서 POPE 벤치마크 정확도를 유의미하게 향상시켰습니다.

학습자 관점 포인트

우리 팀 영향: 추가 학습 비용 없이 추론 단계에서 언어 모델의 편향을 제어하여 시각 정보에 더 충실한 답변을 생성하는 기법을 우리 모델 서비스에 적용할 수 있습니다.
권장 액션: 도입 검토
액션 근거: 학습이 필요 없는 Training-free 방식이며 기존 LVLM의 환각 문제를 효과적으로 개선할 수 있는 실용적인 방법론이기 때문입니다.

원문 링크

arXiv: https://arxiv.org/abs/2602.22144
Hugging Face Papers: https://huggingface.co/papers/2602.22144

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2602.18993] SeaCache: Spectral-Evolution-Aware Cache for Accelerating Diffusion Models [2602.20857] Functional Continuous Decomposition

00. 시작하기

01. AI IDE

02. IDE 확장/플러그인

03. CLI/멀티 플랫폼

04. 에이전트 하네스

05. AI 웹 빌더

06. 워크플로우 플랫폼

08. 일일 리뷰 리포트

07. 논문 트렌드

[2602.22144] NoLan: Mitigating Object Hallucinations in Large Vision-Language Models via Dynamic Suppression of Language Priors

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크

00. 시작하기

01. AI IDE

02. IDE 확장/플러그인

03. CLI/멀티 플랫폼

04. 에이전트 하네스

05. AI 웹 빌더

06. 워크플로우 플랫폼

08. 일일 리뷰 리포트

07. 논문 트렌드

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크