[2603.25741] Vega: Learning to Drive with Natural Language Instructions

논문 정보

날짜: 2026-03-28
카테고리: -
우선순위 점수: 0.733

핵심 요약

Vega는 자연어 명령을 따르는 자율 주행을 위해 구축된 Vision-Language-World-Action 모델입니다. 10만 개의 시나리오를 포함한 InstructScene 데이터셋을 활용하며, 자동 회귀 방식과 확산 모델(Diffusion)을 결합해 미래 예측 및 궤적 생성을 수행합니다. 실험 결과, 이 모델은 우수한 계획 성능과 함께 사용자 명령에 따른 개인화된 주행 능력을 보여주었습니다.

학습자 관점 포인트

우리 팀 영향: 자연어 기반의 정교한 제어 명령을 자율 주행 시스템에 통합하여 사용자 맞춤형 주행 인터페이스를 구축하는 데 기여할 수 있습니다.
권장 액션: 실험
액션 근거: 대규모 명령 기반 데이터셋과 확산 모델 기반의 궤적 생성 방식이 결합되어 있어 실제 제어 성능과 유연성을 검증할 가치가 높습니다.

원문 링크

arXiv: https://arxiv.org/abs/2603.25741
Hugging Face Papers: https://huggingface.co/papers/2603.25741

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2603.25551] Voxtral TTS [2603.24844] Reaching Beyond the Mode: RL for Distributional Reasoning in Language Models

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크