논문 정보
- 날짜:
2026-03-10
- 카테고리: -
- 우선순위 점수: 1.0
핵심 요약
NLE는 기존 자동회귀 방식의 LLM 기반 ASR이 가진 높은 지연 시간을 해결하기 위해 비자동회귀 방식의 전사 편집 메커니즘을 제안합니다. 사전 학습된 음성 인코더의 초기 가설을 양방향 LLM 에디터가 병렬로 수정하며, 인터리브 패딩 전략을 통해 모델이 교정 작업에 집중하도록 설계되었습니다. 실험 결과 NLE++는 Open ASR 리더보드에서 5.67%의 WER을 기록하며 기존 AR 모델 대비 단일 발화 기준 27배의 속도 향상을 달성했습니다.
학습자 관점 포인트
- 우리 팀 영향: 실시간 음성 인식 서비스에서 LLM의 성능을 유지하면서도 추론 속도를 획기적으로 개선할 수 있는 기술적 기반을 제공합니다.
- 권장 액션: 실험
- 액션 근거: 기존 LLM 기반 ASR의 고질적인 문제인 추론 속도를 27배 개선하면서도 높은 정확도를 유지했다는 점에서 기술적 검증 가치가 높습니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.