논문 정보
- 날짜:
2026-04-08 - 카테고리: -
- 우선순위 점수: 0.633
핵심 요약
코딩 에이전트가 도구 실행 결과 중 불필요한 정보를 반복적으로 읽는 문제를 해결하기 위해 태스크 조건부 도구 출력 프루닝 기법인 Squeez를 제안합니다. SWE-bench 기반의 벤치마크를 구축하고 Qwen 3.5 2B 모델을 미세 조정하여 입력 토큰의 92%를 제거하면서도 높은 재현율을 달성했습니다. 이 모델은 더 큰 규모의 제로샷 모델이나 휴리스틱 기반 프루닝 방식보다 우수한 성능을 보여주었습니다.학습자 관점 포인트
- 우리 팀 영향: 에이전트의 컨텍스트 윈도우 비용을 90% 이상 절감하면서도 추론 효율성을 크게 개선할 수 있는 기술적 근거를 제공합니다.
- 권장 액션: 실험
- 액션 근거: 경량 모델로도 높은 토큰 압축률과 성능 유지가 가능함을 입증했으므로 내부 코딩 에이전트 파이프라인에 적용 가능성을 검토할 가치가 있습니다.
원문 링크
- arXiv: https://arxiv.org/abs/2604.04979
- Hugging Face Papers: https://huggingface.co/papers/2604.04979

