Skip to main content

논문 정보

  • 날짜: 2026-04-02
  • 카테고리: -
  • 우선순위 점수: 1.233

핵심 요약

모바일 에이전트의 개인정보 보호 행동을 측정하기 위해 MyPhoneBench라는 검증 가능한 평가 프레임워크를 제안했습니다. 5개의 최신 모델을 테스트한 결과, 모든 모델이 작업 수행 중 불필요한 개인정보를 입력하는 등 데이터 최소화 원칙을 준수하지 못하는 한계를 보였습니다. 작업 성공률과 개인정보 보호 준수 능력은 별개의 역량이며, 성공률만으로 에이전트의 성능을 평가하는 것은 위험하다는 점을 시사합니다.

학습자 관점 포인트

  • 우리 팀 영향: 사용자 데이터를 직접 다루는 모바일 에이전트 개발 시, 기능적 성공뿐만 아니라 데이터 최소화 및 권한 관리 로직을 필수적으로 검증해야 함을 시사합니다.
  • 권장 액션: 실험
  • 액션 근거: 제안된 MyPhoneBench 프레임워크와 iMy 규약을 활용하여 현재 개발 중인 에이전트의 개인정보 노출 위험도를 정량적으로 측정해 볼 가치가 있습니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.