논문 정보
- 날짜:
2026-03-28 - 카테고리: -
- 우선순위 점수: 0.733
핵심 요약
Vega는 자연어 명령을 따르는 자율 주행을 위해 구축된 Vision-Language-World-Action 모델입니다. 10만 개의 시나리오를 포함한 InstructScene 데이터셋을 활용하며, 자동 회귀 방식과 확산 모델(Diffusion)을 결합해 미래 예측 및 궤적 생성을 수행합니다. 실험 결과, 이 모델은 우수한 계획 성능과 함께 사용자 명령에 따른 개인화된 주행 능력을 보여주었습니다.학습자 관점 포인트
- 우리 팀 영향: 자연어 기반의 정교한 제어 명령을 자율 주행 시스템에 통합하여 사용자 맞춤형 주행 인터페이스를 구축하는 데 기여할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 대규모 명령 기반 데이터셋과 확산 모델 기반의 궤적 생성 방식이 결합되어 있어 실제 제어 성능과 유연성을 검증할 가치가 높습니다.
원문 링크
- arXiv: https://arxiv.org/abs/2603.25741
- Hugging Face Papers: https://huggingface.co/papers/2603.25741

