[2604.06377] The Master Key Hypothesis: Unlocking Cross-Model Capability Transfer via Linear Subspace Alignment

논문 정보

날짜: 2026-04-11
카테고리: -
우선순위 점수: 0.7

핵심 요약

모델의 특정 능력은 저차원 잠재 부분 공간의 방향에 대응하며, 선형 정렬을 통해 서로 다른 모델 간에 전이가 가능하다는 ‘마스터 키 가설’을 제안합니다. 이를 기반으로 훈련이나 레이블 없이 활성화 차이를 대조하여 능력을 추출하고 타겟 모델에 적용하는 UNLOCK 프레임워크를 개발했습니다. 실험 결과, Qwen 모델군 내에서 추론 능력을 전이했을 때 MATH 및 AGIEval 데이터셋에서 유의미한 성능 향상을 확인했습니다.

학습자 관점 포인트

우리 팀 영향: 추가 학습 비용 없이 모델 간 선형 변환만으로 고성능 모델의 추론 능력을 소형 모델에 이식하거나 베이스 모델의 잠재 능력을 끌어올릴 수 있습니다.
권장 액션: 실험
액션 근거: 훈련 없이 모델의 활성화 값 조정만으로 성능을 개선할 수 있는 효율적인 방법론이므로 내부 모델에 적용 가능성을 검증할 가치가 있습니다.

원문 링크

arXiv: https://arxiv.org/abs/2604.06377
Hugging Face Papers: https://huggingface.co/papers/2604.06377

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2604.08476] Faithful GRPO: Improving Visual Spatial Reasoning in Multimodal Language Models via Constrained Policy Optimization [2604.08124] Beyond Stochastic Exploration: What Makes Training Data Valuable for Agentic Search

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크