논문 정보
- 날짜:
2026-04-05
- 카테고리: -
- 우선순위 점수: 1.333
핵심 요약
소프트웨어 엔지니어링 에이전트가 모호한 지시를 받았을 때 스스로 질문하여 정보를 보완하는 불확실성 인지 프레임워크를 제안합니다. OpenHands와 Claude 3.5 Sonnet 기반의 멀티 에이전트 시스템을 통해 SWE-bench Verified에서 기존 단일 에이전트 대비 약 8.2%p 향상된 성능을 입증했습니다. 이 시스템은 작업의 복잡도에 따라 질문 여부를 결정하는 보정된 불확실성 측정 능력을 보여주었습니다.
학습자 관점 포인트
- 우리 팀 영향: 모호한 요구사항이 빈번한 실무 환경에서 에이전트의 자율적 판단과 질문 기능을 통해 코드 생성의 정확도를 높이는 데 기여할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 기존 에이전트의 한계인 모호성 해결 능력을 멀티 에이전트 구조로 개선한 구체적인 벤치마크 결과가 존재하여 재현 가치가 높습니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.