Computer Vision
컴퓨터 비전의 핵심 기술과 실습 가이드입니다. 이미지 분류, 객체 탐지, 세그멘테이션부터 멀티모달 모델까지 다룹니다.콘텐츠 준비 중입니다. 곧 업데이트됩니다.
다룰 내용
기초
- 이미지 처리 기초 (OpenCV)
- 데이터 증강 (Albumentations)
- torchvision 활용
이미지 분류
- CNN 아키텍처 (ResNet, EfficientNet, ViT)
- 전이학습 및 Feature Extraction
객체 탐지
- YOLO 시리즈 (YOLOv8, YOLOv11)
- DETR / RT-DETR
- Ultralytics 활용
세그멘테이션
- Semantic Segmentation
- Instance Segmentation (Mask R-CNN)
- SAM (Segment Anything Model)
멀티모달
- CLIP / SigLIP
- Vision-Language Model (VLM)
- OCR (Document AI)

