논문 정보
- 날짜:
2026-04-07
- 카테고리: -
- 우선순위 점수: 0.833
핵심 요약
고해상도 이미지의 세부 정보가 VLM의 환각이나 추론 오류를 유발할 수 있음을 지적하며, 의도적으로 이미지 품질을 낮추는 DDP 프레임워크를 제안합니다. 저해상도 다운샘플링과 구조적 시각 보조 도구를 결합하여 모델이 지엽적인 질감 대신 핵심적인 구조 정보에 집중하도록 유도합니다. 실험 결과, 시각적 노이즈를 제거함으로써 물리적 속성 판단 및 각종 착시 현상 해결에서 더 높은 추론 정확도를 달성했습니다.
학습자 관점 포인트
- 우리 팀 영향: VLM의 환각 현상을 줄이기 위해 고해상도 입력 대신 전략적인 데이터 열화와 구조적 프롬프팅을 활용하는 새로운 데이터 전처리 관점을 제시합니다.
- 권장 액션: 실험
- 액션 근거: 이미지 해상도를 낮추는 것만으로도 추론 성능이 향상될 수 있다는 가설은 비용 효율적인 성능 개선 가능성이 높으므로 내부 벤치마크 검증이 필요합니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.