Skip to main content

Label Studio

데이터 라벨링 플랫폼입니다. 이미지, 텍스트, 오디오, 비디오 등 다양한 데이터 유형의 라벨링(어노테이션) 작업을 웹 UI에서 수행할 수 있습니다.

어디에 쓰이나요?

  • 이미지 라벨링: 객체 탐지(바운딩 박스), 이미지 분류, 세그멘테이션
  • 텍스트 라벨링: 감성 분석, 개체명 인식(NER), 텍스트 분류
  • 오디오 라벨링: 음성 인식 데이터 전사(transcription), 화자 분리
  • LLM 평가: LLM 응답의 품질을 사람이 평가하고 점수 부여 (RLHF 데이터 수집)
  • 팀 협업: 여러 라벨러가 동시에 작업하고, 관리자가 진행 상황 모니터링
머신러닝 모델을 학습시키려면 라벨링된 데이터가 필요합니다. Label Studio는 이 라벨링 작업을 체계적으로 관리할 수 있는 도구입니다.

Docker Compose

docker-compose.yml
services:
  label-studio:
    image: heartexlabs/label-studio:latest
    container_name: label-studio
    restart: unless-stopped
    ports:
      - "8080:8080"
    environment:
      - LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED=true
      - LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT=/label-studio/files
    volumes:
      - label_studio_data:/label-studio/data
      - label_studio_files:/label-studio/files

volumes:
  label_studio_data:
  label_studio_files:

실행

docker compose up -d

접속 확인

브라우저에서 http://localhost:8080으로 접속합니다. 초기 접속 시 관리자 계정을 생성합니다.

기본 정보

항목
웹 UI 포트8080
기본 데이터베이스SQLite (내장)

라이선스

구분내용
라이선스Apache License 2.0 (Community), 상용 라이선스 (Enterprise)
개인 사용자유롭게 사용 가능
상업적 사용Community는 자유롭게 사용 가능. Enterprise는 RBAC, SSO, 분석 대시보드 등 추가 기능 포함

참고