논문 정보
- 날짜:
2026-04-04
- 카테고리: -
- 우선순위 점수: 1.267
핵심 요약
소프트웨어 엔지니어링 에이전트가 불명확한 지시를 받았을 때 스스로 질문을 던져 정보를 보충하는 다중 에이전트 프레임워크를 제안합니다. OpenHands와 Claude Sonnet 4.5를 결합한 시스템은 불명확성 감지와 코드 실행을 분리하여 SWE-bench Verified에서 69.40%의 해결률을 기록했습니다. 이 시스템은 작업의 복잡도에 따라 질문 빈도를 조절하는 보정된 불확실성 측정 능력을 보여주었습니다.
학습자 관점 포인트
- 우리 팀 영향: 에이전트의 자율 실행뿐만 아니라 사용자 피드백을 유도하는 상호작용 설계가 실제 개발 환경의 문제 해결 능력을 크게 향상시킬 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 기존 단일 에이전트 대비 성능 향상이 뚜렷하며, 불확실성 기반의 질문 생성 로직을 우리 팀의 에이전트 워크플로우에 적용해 볼 가치가 있습니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.