[2604.04949] Learning to Retrieve from Agent Trajectories

논문 정보

날짜: 2026-04-08
카테고리: -
우선순위 점수: 3.467

핵심 요약

기존의 검색 모델은 인간의 클릭 데이터에 의존했으나, LLM 에이전트 환경에서는 에이전트의 추론 및 행동 루프에 최적화된 새로운 학습 방식이 필요합니다. 본 논문은 에이전트의 궤적 데이터에서 문서의 유용성을 추출하여 학습에 활용하는 LRAT 프레임워크를 제안합니다. 실험 결과, 다양한 에이전트 구조에서 증거 재현율과 작업 성공률이 향상됨을 입증했습니다.

학습자 관점 포인트

우리 팀 영향: 에이전트 전용 RAG 시스템 구축 시 사용자 로그 없이도 에이전트의 실행 궤적만으로 검색 모델을 고도화할 수 있는 방법론을 제공합니다.
권장 액션: 실험
액션 근거: 에이전트의 행동 패턴을 검색 모델 학습에 직접 활용하는 방식이 현재 개발 중인 에이전트 성능 개선에 실질적인 도움이 될 것으로 판단됩니다.

원문 링크

arXiv: https://arxiv.org/abs/2604.04949
Hugging Face Papers: https://huggingface.co/papers/2604.04949

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2604.06132] Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [2604.03922] ACES: Who Tests the Tests? Leave-One-Out AUC Consistency for Code Generation

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크