논문 정보
- 날짜:
2026-04-02
- 카테고리: -
- 우선순위 점수: 0.767
핵심 요약
사용자의 요구를 예측하여 자율적으로 작업을 수행하는 능동형 에이전트(Proactive Agent)를 평가하기 위한 Pare 프레임워크를 제안합니다. 기존의 단순 API 호출 방식에서 벗어나 상태 기반 유한 상태 기계(FSM) 모델을 통해 현실적인 사용자 시뮬레이션 환경을 구축했습니다. 이를 바탕으로 143개의 다양한 작업으로 구성된 Pare-Bench를 통해 에이전트의 상황 관찰 및 목표 추론 능력을 측정합니다.
학습자 관점 포인트
- 우리 팀 영향: 능동형 에이전트의 성능을 정밀하게 측정할 수 있는 벤치마크와 시뮬레이션 환경을 확보하여 에이전트 고도화 전략 수립에 기여할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 기존 벤치마크보다 현실적인 사용자 상호작용 모델을 제공하므로 현재 개발 중인 에이전트의 능동성 평가에 적합하다고 판단됩니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.