Skip to main content

Computer Vision

컴퓨터 비전의 핵심 기술과 실습 가이드입니다. 이미지 분류, 객체 탐지, 세그멘테이션부터 멀티모달 모델까지 다룹니다.
콘텐츠 준비 중입니다. 곧 업데이트됩니다.

다룰 내용

기초

  • 이미지 처리 기초 (OpenCV)
  • 데이터 증강 (Albumentations)
  • torchvision 활용

이미지 분류

  • CNN 아키텍처 (ResNet, EfficientNet, ViT)
  • 전이학습 및 Feature Extraction

객체 탐지

  • YOLO 시리즈 (YOLOv8, YOLOv11)
  • DETR / RT-DETR
  • Ultralytics 활용

세그멘테이션

  • Semantic Segmentation
  • Instance Segmentation (Mask R-CNN)
  • SAM (Segment Anything Model)

멀티모달

  • CLIP / SigLIP
  • Vision-Language Model (VLM)
  • OCR (Document AI)