Skip to main content

Argilla

AI 데이터 피드백 플랫폼입니다. LLM 응답의 품질 평가, RLHF 데이터 수집, NLP 데이터 어노테이션에 특화되어 있습니다.

어디에 쓰이나요?

  • LLM 평가 및 피드백: LLM이 생성한 응답에 대해 사람이 좋음/나쁨, 정확도 등을 평가
  • RLHF 데이터 수집: 사람의 선호도 데이터를 수집하여 LLM 파인튜닝에 활용
  • NLP 어노테이션: 텍스트 분류, 개체명 인식, 질의응답 데이터 라벨링
  • 데이터 큐레이션: 학습 데이터셋에서 잘못된 라벨을 찾아 수정
Label Studio가 범용 데이터 라벨링 도구라면, Argilla는 NLP/LLM 데이터에 특화되어 있습니다. HuggingFace 생태계와 긴밀하게 통합되어 데이터셋을 HuggingFace Hub에 바로 업로드할 수 있습니다.

Docker Compose

docker-compose.yml
services:
  argilla:
    image: argilla/argilla-server:latest
    container_name: argilla
    restart: unless-stopped
    ports:
      - "6900:6900"
    environment:
      - ARGILLA_DATABASE_URL=postgresql+asyncpg://postgres:changeme@argilla-db:5432/argilla
      - ARGILLA_ELASTICSEARCH=http://argilla-es:9200
      - ARGILLA_AUTH_SECRET_KEY=changeme
    depends_on:
      argilla-db:
        condition: service_healthy
      argilla-es:
        condition: service_healthy

  argilla-db:
    image: postgres:17-alpine
    container_name: argilla-db
    restart: unless-stopped
    environment:
      - POSTGRES_USER=postgres
      - POSTGRES_PASSWORD=changeme
      - POSTGRES_DB=argilla
    volumes:
      - argilla_db_data:/var/lib/postgresql/data
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U postgres"]
      interval: 3s
      timeout: 3s
      retries: 10

  argilla-es:
    image: docker.elastic.co/elasticsearch/elasticsearch:8.12.2
    container_name: argilla-es
    restart: unless-stopped
    environment:
      - discovery.type=single-node
      - xpack.security.enabled=false
      - ES_JAVA_OPTS=-Xms512m -Xmx512m
    volumes:
      - argilla_es_data:/usr/share/elasticsearch/data
    healthcheck:
      test: ["CMD-SHELL", "curl -f http://localhost:9200/_cluster/health || exit 1"]
      interval: 10s
      timeout: 5s
      retries: 10

volumes:
  argilla_db_data:
  argilla_es_data:

실행

docker compose up -d

접속 확인

브라우저에서 http://localhost:6900으로 접속합니다. 기본 관리자 계정:
  • Username: argilla
  • Password: 1234

기본 정보

항목
웹 UI 포트6900
기본 사용자argilla
기본 비밀번호1234

라이선스

구분내용
라이선스Apache License 2.0
개인 사용자유롭게 사용 가능
상업적 사용자유롭게 사용 가능, 수정/재배포 제한 없음

참고