[2604.02190] UniDriveVLA: Unifying Understanding, Perception, and Action Planning for Autonomous Driving

논문 정보

날짜: 2026-04-04
카테고리: -
우선순위 점수: 1.633

핵심 요약

UniDriveVLA는 자율주행에서 공간 인지 능력과 시맨틱 추론 능력 간의 충돌을 해결하기 위해 Mixture-of-Transformers 구조를 제안합니다. 이해, 인지, 계획을 담당하는 세 가지 전문가 모듈을 마스크드 조인트 어텐션으로 결합하여 각 기능의 성능 저하 없이 통합했습니다. nuScenes와 Bench2Drive 벤치마크에서 우수한 성능을 입증하며 3D 검출, 매핑, 동작 예측 등 다양한 과제를 수행합니다.

학습자 관점 포인트

우리 팀 영향: 공간 인지와 추론 능력을 분리하여 최적화하는 전문가 디커플링 구조를 통해 복합적인 자율주행 모델 설계에 영감을 줄 수 있습니다.
권장 액션: 실험
액션 근거: 기존 VLA 모델의 한계인 인지와 추론 간의 트레이드오프를 해결하는 구조적 접근 방식이 유효한지 검증이 필요합니다.

원문 링크

arXiv: https://arxiv.org/abs/2604.02190
Hugging Face Papers: https://huggingface.co/papers/2604.02190

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2604.01658] CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery [2604.01676] GPA: Learning GUI Process Automation from Demonstrations

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크