논문 정보
- 날짜:
2026-03-10
- 카테고리: -
- 우선순위 점수: 1.767
핵심 요약
LoGeR는 TTT 기반 파라메트릭 메모리와 슬라이딩 윈도우 어텐션을 결합한 하이브리드 메모리 구조를 통해 수천 프레임 이상의 긴 비디오 시퀀스에서도 일관된 3D 재구성을 수행합니다. 128프레임 학습만으로도 추론 시 수만 프레임까지 일반화가 가능하며, 전역 좌표계 고정 및 스케일 드리프트 방지에 최적화되어 있습니다. KITTI 벤치마크에서 기존 피드포워드 방식 대비 ATE를 74% 이상 감소시키며 긴 시퀀스에서의 기하학적 복원 성능을 입증했습니다.
학습자 관점 포인트
- 우리 팀 영향: 긴 비디오 시퀀스에 대한 실시간성 3D 재구성 및 슬램(SLAM) 기술의 정확도를 획기적으로 개선할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 기존 순환 신경망이나 어텐션 기반 모델의 메모리 한계를 극복하고 긴 시퀀스에서 높은 정확도를 보여주어 실제 서비스 적용 가능성이 높습니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.