논문 정보
- 날짜:
2026-03-30 - 카테고리: -
- 우선순위 점수: 4.0
핵심 요약
본 논문은 비디오 월드 모델에서 시야를 벗어난 동적 객체의 연속성을 유지하기 위한 Hybrid Memory 패러다임을 제안합니다. 정적인 배경 보존과 동적 객체 추적을 동시에 수행하는 HM-World 데이터셋과 시공간 연관성 기반의 검색 메커니즘을 갖춘 HyDRA 아키텍처를 소개합니다. 실험 결과, 기존 모델 대비 객체의 정체성 및 운동 연속성 측면에서 우수한 성능을 입증했습니다.학습자 관점 포인트
- 우리 팀 영향: 비디오 생성 모델에서 객체가 화면 밖으로 나갔다 재등장할 때 발생하는 왜곡 문제를 해결하는 메모리 구조 설계에 참고할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 동적 객체의 일관성을 유지하는 HyDRA의 토큰 압축 및 검색 메커니즘이 기존 비디오 생성 파이프라인의 한계를 개선할 가능성이 높기 때문입니다.
원문 링크
- arXiv: https://arxiv.org/abs/2603.25716
- Hugging Face Papers: https://huggingface.co/papers/2603.25716

