Skip to main content

논문 정보

  • 날짜: 2026-04-12
  • 카테고리: -
  • 우선순위 점수: 2.967

핵심 요약

Agent-as-Annotators 프레임워크를 통해 고성능 LLM의 웹 에이전트 능력을 소형 모델로 전이하는 구조적 증류 기법을 제안합니다. Gemini 3 Pro를 활용해 생성한 3,000개의 궤적 중 품질 필터링을 통과한 데이터를 9B 파라미터 모델에 학습시켜 WebArena에서 41.5%의 성능을 달성했습니다. 이는 Claude 3.5 Sonnet 및 GPT-4o와 같은 폐쇄형 모델을 상회하며 미학습 환경에서도 높은 범용성을 입증했습니다.

학습자 관점 포인트

  • 우리 팀 영향: 고비용 API 의존도를 낮추면서도 상용 모델 이상의 성능을 내는 경량화된 로컬 웹 에이전트 구축 가능성을 제시합니다.
  • 권장 액션: 실험
  • 액션 근거: 오픈 소스 모델이 특정 도메인에서 폐쇄형 SOTA 모델의 성능을 압도한 구체적인 데이터 생성 및 필터링 방법론이 포함되어 있어 재현 가치가 높습니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.