논문 정보
- 날짜:
2026-04-04
- 카테고리: -
- 우선순위 점수: 1.4
핵심 요약
VideoZeroBench는 비디오 MLLM의 미세한 시공간적 이해와 추론 능력을 엄격하게 검증하기 위해 설계된 새로운 벤치마크입니다. 500개의 수동 주석 질문과 시공간적 증거를 결합한 5단계 평가 프로토콜을 통해 모델이 정답을 맞히는 것뿐만 아니라 정확한 근거를 식별하는지 측정합니다. 실험 결과, Gemini-3-Pro를 포함한 최신 모델들도 시공간적 접지 조건이 추가될 경우 성능이 급격히 하락하여 실제 근거 기반 추론 능력이 부족함을 보여주었습니다.
학습자 관점 포인트
- 우리 팀 영향: 비디오 모델의 답변이 단순 추측인지 실제 시공간적 근거에 기반한 것인지 정밀하게 검증할 수 있는 평가 체계를 확보할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 최신 모델들도 시공간적 접지(Grounding) 성능이 매우 낮다는 결과에 따라, 현재 개발 중인 비디오 모델의 실제 추론 성능을 객관적으로 진단하기 위해 도입이 필요합니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.