Skip to main content

논문 정보

  • 날짜: 2026-04-08
  • 카테고리: -
  • 우선순위 점수: 0.633

핵심 요약

코딩 에이전트가 도구 실행 결과 중 불필요한 정보를 반복적으로 읽는 문제를 해결하기 위해 태스크 조건부 도구 출력 프루닝 기법인 Squeez를 제안합니다. SWE-bench 기반의 벤치마크를 구축하고 Qwen 3.5 2B 모델을 미세 조정하여 입력 토큰의 92%를 제거하면서도 높은 재현율을 달성했습니다. 이 모델은 더 큰 규모의 제로샷 모델이나 휴리스틱 기반 프루닝 방식보다 우수한 성능을 보여주었습니다.

학습자 관점 포인트

  • 우리 팀 영향: 에이전트의 컨텍스트 윈도우 비용을 90% 이상 절감하면서도 추론 효율성을 크게 개선할 수 있는 기술적 근거를 제공합니다.
  • 권장 액션: 실험
  • 액션 근거: 경량 모델로도 높은 토큰 압축률과 성능 유지가 가능함을 입증했으므로 내부 코딩 에이전트 파이프라인에 적용 가능성을 검토할 가치가 있습니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.