논문 정보
- 날짜:
2026-04-10
- 카테고리: -
- 우선순위 점수: 1.1
핵심 요약
LPM 1.0은 비디오 기반 캐릭터의 표현력, 실시간 추론, 장기적 정체성 유지를 동시에 해결하는 17B 파라미터 규모의 Diffusion Transformer 모델입니다. 대규모 멀티모달 데이터셋을 통해 학습되었으며, 증류 기법을 적용한 Online LPM을 통해 저지연 무한 길이 생성이 가능합니다. 대화형 에이전트와 게임 NPC 등을 위한 시각 엔진으로서 실시간 오디오-비디오 페어링 및 텍스트 프롬프트 제어를 지원합니다.
학습자 관점 포인트
- 우리 팀 영향: 실시간 대화형 캐릭터 생성 기술을 통해 게임 NPC 및 라이브 스트리밍 서비스의 시각적 몰입감을 크게 향상시킬 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 실시간 추론과 정체성 유지를 동시에 달성한 기술적 성과가 높으며, 제안된 LPM-Bench를 통한 성능 검증 가치가 충분합니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.