Skip to main content

논문 정보

  • 날짜: 2026-04-03
  • 카테고리: -
  • 우선순위 점수: 0.7

핵심 요약

MDPBench는 17개 언어와 다양한 촬영 환경을 포함한 최초의 다국어 문서 파싱 벤치마크로, 3,400개의 고품질 주석 데이터를 제공합니다. 평가 결과 Gemini-1.5-Pro와 같은 폐쇄형 모델은 비교적 견고했으나, 오픈소스 모델은 비라틴 문자 및 사진 촬영 환경에서 성능이 급격히 저하됨을 확인했습니다. 데이터 누출 방지를 위해 공개 및 비공개 평가 세트를 분리하여 공정한 비교를 보장합니다.

학습자 관점 포인트

  • 우리 팀 영향: 다양한 언어와 실제 촬영 환경에서의 문서 파싱 성능을 객관적으로 검증하고 오픈소스 모델의 한계를 파악하는 데 활용할 수 있습니다.
  • 권장 액션: 실험
  • 액션 근거: 실제 환경의 다국어 OCR 및 문서 파싱 성능 측정을 위한 신뢰도 높은 벤치마크 데이터셋이므로 내부 모델 성능 검증에 유용합니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.