논문 정보
- 날짜:
2026-03-05
- 카테고리: -
- 우선순위 점수: 0.633
핵심 요약
MIBURI는 실시간 대화형 에이전트를 위해 음성 및 텍스트와 동기화된 전신 제스처와 표정을 생성하는 온라인 인과적 프레임워크입니다. 신체 부위별 제스처 코덱을 통해 계층적 모션 세부 사항을 이산 토큰으로 인코딩하며, LLM 기반 임베딩을 조건으로 실시간 자동 회귀 생성을 수행합니다. 정적 포즈 수렴을 방지하고 표현의 다양성을 높이기 위한 보조 목적 함수를 도입하여 기존 방식보다 자연스러운 상호작용을 지원합니다.
학습자 관점 포인트
- 우리 팀 영향: 실시간 대화 시스템에서 지연 시간 없이 자연스러운 비언어적 표현을 생성하는 기술을 확보하여 사용자 경험을 개선할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 실시간성과 표현력을 동시에 확보한 인과적 프레임워크로서 기존 LLM 기반 에이전트의 물리적 표현 한계를 극복할 가능성이 높기 때문입니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.