[2602.20423] MedCLIPSeg: Probabilistic Vision-Language Adaptation for Data-Efficient and Generalizable Medical Image Segmentation

논문 정보

날짜: 2026-03-01
카테고리: -
우선순위 점수: 0.067

핵심 요약

MedCLIPSeg은 CLIP의 패치 레벨 임베딩을 확률적 교차 모달 어텐션과 결합하여 의료 영상 분할의 데이터 효율성과 일반화 성능을 높인 프레임워크입니다. 텍스트 프롬프트와 이미지 토큰 간의 양방향 상호작용을 통해 예측 불확실성을 명시적으로 모델링하며, 소프트 패치 레벨 대조 학습을 적용했습니다. 5가지 영상 모달리티와 6개 장기를 포함한 16개 데이터셋 실험에서 기존 방식보다 높은 정확도와 견고함을 입증했습니다.

학습자 관점 포인트

우리 팀 영향: 적은 데이터로도 다양한 의료 영상 도메인에 적용 가능한 텍스트 기반 분할 모델의 성능과 신뢰성을 확보할 수 있습니다.
권장 액션: 도입 검토
액션 근거: 다양한 의료 모달리티에 대한 일반화 성능과 불확실성 맵 제공 기능이 실무적 활용 가치가 높다고 판단됩니다.

원문 링크

arXiv: https://arxiv.org/abs/2602.20423
Hugging Face Papers: https://huggingface.co/papers/2602.20423

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2602.22045] DLT-Corpus: A Large-Scale Text Collection for the Distributed Ledger Technology Domain [2602.23165] DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크