논문 정보
- 날짜:
2026-04-11 - 카테고리: -
- 우선순위 점수: 1.267
핵심 요약
LPM 1.0은 비디오 기반 캐릭터의 감정, 의도, 개성을 표현하기 위해 개발된 17B 파라미터 규모의 Diffusion Transformer 모델입니다. 대화 상황에서 화자와 청자의 반응을 실시간으로 생성하며, 증류 기법을 통해 저지연 무한 길이 생성을 구현했습니다. 이를 평가하기 위해 대화형 캐릭터 성능 측정용 벤치마크인 LPM-Bench를 함께 제안합니다.학습자 관점 포인트
- 우리 팀 영향: 실시간 대화형 NPC 및 가상 캐릭터의 시각적 엔진으로서 고품질의 일관된 캐릭터 생성 기술을 확보할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 실시간 추론과 정체성 유지라는 상충 관계를 해결한 17B 규모의 모델이므로 실제 서비스 적용 가능성을 검증할 가치가 큽니다.
원문 링크
- arXiv: https://arxiv.org/abs/2604.07823
- Hugging Face Papers: https://huggingface.co/papers/2604.07823

