[2602.22190] GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

논문 정보

날짜: 2026-02-26
카테고리: -
우선순위 점수: 0.9

핵심 요약

GUI-Libra는 오픈소스 GUI 에이전트의 성능 향상을 위해 고품질 추론 데이터 구축 및 새로운 학습 레시피를 제안합니다. 추론과 그라운딩의 불일치를 해결하는 Action-aware SFT와 부분 검증 가능성 문제를 완화하는 RLVR 기반 강화학습 기법을 도입했습니다. 이를 통해 웹 및 모바일 벤치마크에서 단계별 정확도와 최종 작업 완료율을 모두 개선했습니다.

학습자 관점 포인트

우리 팀 영향: GUI 에이전트의 추론 능력과 실제 액션 사이의 정렬 문제를 해결하는 학습 방법론을 우리 팀의 에이전트 고도화에 적용할 수 있습니다.
권장 액션: 실험
액션 근거: 공개된 81K GUI 추론 데이터셋과 KL 정규화를 활용한 RL 학습 기법이 실질적인 성능 향상을 증명했으므로 재현 실험 가치가 높습니다.

원문 링크

arXiv: https://arxiv.org/abs/2602.22190
Hugging Face Papers: https://huggingface.co/papers/2602.22190

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2602.17602] MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models [2602.12160] DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크