논문 정보
- 날짜:
2026-04-02
- 카테고리: -
- 우선순위 점수: 1.233
핵심 요약
모바일 에이전트의 개인정보 보호 행동을 측정하기 위해 MyPhoneBench라는 검증 가능한 평가 프레임워크를 제안했습니다. 5개의 최신 모델을 테스트한 결과, 모든 모델이 작업 수행 중 불필요한 개인정보를 입력하는 등 데이터 최소화 원칙을 준수하지 못하는 한계를 보였습니다. 작업 성공률과 개인정보 보호 준수 능력은 별개의 역량이며, 성공률만으로 에이전트의 성능을 평가하는 것은 위험하다는 점을 시사합니다.
학습자 관점 포인트
- 우리 팀 영향: 사용자 데이터를 직접 다루는 모바일 에이전트 개발 시, 기능적 성공뿐만 아니라 데이터 최소화 및 권한 관리 로직을 필수적으로 검증해야 함을 시사합니다.
- 권장 액션: 실험
- 액션 근거: 제안된 MyPhoneBench 프레임워크와 iMy 규약을 활용하여 현재 개발 중인 에이전트의 개인정보 노출 위험도를 정량적으로 측정해 볼 가치가 있습니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.