Skip to main content

논문 정보

  • 날짜: 2026-04-11
  • 카테고리: -
  • 우선순위 점수: 2.9

핵심 요약

Agent-as-Annotators 프레임워크를 통해 고성능 LLM의 웹 에이전트 능력을 소형 모델로 전이하는 구조적 증류 방식을 제안합니다. Gemini 3 Pro를 활용해 생성한 고품질 궤적 데이터로 9B 파라미터 모델을 학습시킨 결과, WebArena에서 Claude 3.5 Sonnet과 GPT-4o를 상회하는 성능을 기록했습니다. 특히 학습 과정에서 보지 못한 새로운 환경에서도 높은 일반화 성능을 입증하며 로컬 배포 가능한 에이전트의 가능성을 보여주었습니다.

학습자 관점 포인트

  • 우리 팀 영향: 고가의 API 의존도를 낮추면서도 상용 모델 수준의 성능을 갖춘 경량화된 웹 에이전트를 자체 구축하는 데 활용할 수 있습니다.
  • 권장 액션: 실험
  • 액션 근거: 오픈소스 모델이 특정 벤치마크에서 최신 폐쇄형 모델을 능가하는 성능을 보였으므로, 제안된 데이터 생성 및 필터링 파이프라인의 재현 실험이 가치 있다고 판단됩니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.