Skip to main content

ClearML

MLOps 플랫폼입니다. 실험 관리, 데이터 버전 관리, 파이프라인 자동화, 모델 배포까지 ML 전체 라이프사이클을 관리합니다.

어디에 쓰이나요?

  • 실험 관리: 코드 한 줄 추가로 학습 실험의 모든 정보를 자동 기록 (파라미터, 메트릭, 환경 정보, Git 커밋)
  • 데이터 관리: 학습 데이터셋의 버전 관리 및 변경 추적
  • 파이프라인: 데이터 전처리 → 학습 → 평가 → 배포까지의 워크플로우 자동화
  • 원격 실행: 로컬에서 작성한 코드를 GPU 서버에서 자동 실행
  • 모델 서빙: 학습된 모델을 API로 배포 및 모니터링
MLflow와 비교하면 자동 기록 기능이 강점입니다. 코드에 Task.init() 한 줄만 추가하면 파라미터, 메트릭, 출력, 모델 파일을 자동으로 기록합니다.

Docker Compose

ClearML 서버는 공식 저장소의 Docker Compose 파일을 사용합니다.
git clone https://github.com/allegroai/clearml-server.git
cd clearml-server/docker
cp example.env .env
.env 파일에서 필요한 설정을 수정합니다.
docker compose up -d

접속 확인

브라우저에서 http://localhost:8080으로 접속합니다. 초기 접속 시 계정을 생성합니다.

기본 정보

항목
웹 UI 포트8080
API 포트8008
파일 서버 포트8081

Python SDK 연동

from clearml import Task

task = Task.init(project_name="my-project", task_name="training-v1")

# 이후 코드에서 발생하는 모든 로그, 메트릭, 모델이 자동 기록됨

라이선스

구분내용
라이선스Apache License 2.0 (Community), 상용 라이선스 (Enterprise)
개인 사용자유롭게 사용 가능
상업적 사용Community는 자유롭게 사용 가능. Enterprise는 RBAC, SSO, 우선 지원 등 추가 기능 포함

참고