논문 정보
- 날짜:
2026-03-04
- 카테고리: -
- 우선순위 점수: 0.0
핵심 요약
T2I 모델의 유해 콘텐츠 생성을 억제하기 위해 SafeSteerDataset을 구축하고 Conditioned Activation Transport(CAT) 프레임워크를 제안했습니다. 기존 선형 활성화 스티어링이 일반 프롬프트의 이미지 품질을 저하시키는 문제를 해결하기 위해 기하학적 조건부 메커니즘과 비선형 전송 맵을 도입했습니다. 실험 결과 Z-Image와 Infinity 아키텍처에서 이미지 품질을 유지하면서도 공격 성공률을 효과적으로 낮추는 성능을 보였습니다.
학습자 관점 포인트
- 우리 팀 영향: 이미지 생성 모델의 안전성 제어 시 일반적인 프롬프트의 품질 저하 문제를 최소화하는 추론 단계 개입 기술로 활용될 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 비선형 전송 맵을 통한 조건부 활성화 방식이 기존 선형 방식의 품질 저하 한계를 극복했는지 검증이 필요합니다.
원문 링크
학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.