Skip to main content

논문 정보

  • 날짜: 2026-04-11
  • 카테고리: -
  • 우선순위 점수: 0.7

핵심 요약

모델의 특정 능력은 저차원 잠재 부분 공간의 방향에 대응하며, 선형 정렬을 통해 서로 다른 모델 간에 전이가 가능하다는 ‘마스터 키 가설’을 제안합니다. 이를 기반으로 훈련이나 레이블 없이 활성화 차이를 대조하여 능력을 추출하고 타겟 모델에 적용하는 UNLOCK 프레임워크를 개발했습니다. 실험 결과, Qwen 모델군 내에서 추론 능력을 전이했을 때 MATH 및 AGIEval 데이터셋에서 유의미한 성능 향상을 확인했습니다.

학습자 관점 포인트

  • 우리 팀 영향: 추가 학습 비용 없이 모델 간 선형 변환만으로 고성능 모델의 추론 능력을 소형 모델에 이식하거나 베이스 모델의 잠재 능력을 끌어올릴 수 있습니다.
  • 권장 액션: 실험
  • 액션 근거: 훈련 없이 모델의 활성화 값 조정만으로 성능을 개선할 수 있는 효율적인 방법론이므로 내부 모델에 적용 가능성을 검증할 가치가 있습니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.