논문 정보
- 날짜:
2026-03-29 - 카테고리: -
- 우선순위 점수: 0.267
핵심 요약
본 논문은 픽셀 공간 확산 트랜스포머(JiT)에서 기존 표현 정렬(REPA) 방식이 정보 비대칭으로 인해 성능 저하와 다양성 붕괴를 초래함을 밝혀냈습니다. 이를 해결하기 위해 정렬 대상을 변환하고 마스크드 트랜스포머 어댑터를 사용하는 PixelREPA를 제안했습니다. 실험 결과, ImageNet 256x256 환경에서 2배 빠른 수렴 속도와 함께 FID 1.81의 향상된 성능을 달성했습니다.학습자 관점 포인트
- 우리 팀 영향: 픽셀 기반 확산 모델의 학습 효율성과 생성 품질을 동시에 개선할 수 있는 새로운 정렬 기법을 확보할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 기존 REPA의 한계를 극복하고 2배 이상의 수렴 가속화와 성능 향상을 입증했으므로 내부 모델에 적용 가능성을 검토할 가치가 있습니다.
원문 링크
- arXiv: https://arxiv.org/abs/2603.14366
- Hugging Face Papers: https://huggingface.co/papers/2603.14366

