[2603.25741] Vega: Learning to Drive with Natural Language Instructions

논문 정보

날짜: 2026-03-27
카테고리: -
우선순위 점수: 0.6

핵심 요약

Vega는 자연어 지침을 따르는 자율 주행을 위해 구축된 Vision-Language-World-Action 모델입니다. 약 10만 개의 시나리오를 포함한 InstructScene 데이터셋을 구축하였으며, 자동 회귀 방식과 확산 모델을 결합하여 미래 예측 및 궤적 생성을 수행합니다. 실험 결과, 이 모델은 우수한 계획 성능과 더불어 사용자 지침에 따른 개인화된 주행 능력을 보여주었습니다.

학습자 관점 포인트

우리 팀 영향: 자연어 지침 기반의 정교한 주행 제어 및 월드 모델링 기법을 통해 사용자 맞춤형 자율 주행 시스템 개발에 참고할 수 있습니다.
권장 액션: 실험
액션 근거: 대규모 지침 데이터셋과 확산 모델 기반의 궤적 생성 방식이 기존 제어 로직의 유연성을 높일 가능성이 있어 성능 검증이 필요합니다.

원문 링크

arXiv: https://arxiv.org/abs/2603.25741
Hugging Face Papers: https://huggingface.co/papers/2603.25741

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2603.24800] Calibri: Enhancing Diffusion Transformers via Parameter-Efficient Calibration [2603.16733] IQuest-Coder-V1 Technical Report

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크