실무 프로젝트
이 섹션에서는 NLP 탭에서 학습한 내용을 실제 프로젝트로 종합합니다. 데이터 수집부터 모델 학습/API 활용, 평가, UI 배포까지의 End-to-End 흐름을 경험합니다. 각 프로젝트는 서로 다른 NLP 기술을 중점적으로 다루며, 후행 탭(RAG, Agent, Fine-Tuning)의 기초가 됩니다.
프로젝트 선택 가이드
세 가지 프로젝트는 난이도와 사용 기술이 다릅니다. 학습 목표에 따라 선택하세요.
| 항목 | 감성 분석 | 챗봇 개발 | 문서 QA 시스템 |
|---|
| 난이도 | 중급 | 중상급 | 상급 |
| 핵심 기술 | BERT Fine-tuning | LLM API, Function Calling | 임베딩, 벡터 DB, LLM |
| 사용 모델 | KoBERT / KoELECTRA | GPT-4o-mini / Claude | 임베딩 모델 + GPT-4o-mini |
| 데이터셋 | NSMC (한국어 영화 리뷰) | 직접 설계 | PDF / 텍스트 문서 |
| UI | Gradio Interface | Gradio ChatInterface | Gradio Blocks |
| 소요 시간 | 3~4시간 | 3~4시간 | 4~5시간 |
| 선행 지식 | PLM, NLP 태스크 | 프롬프팅, API 활용 | 임베딩, 유사도 검색 |
| 후행 탭 연결 | Fine-Tuning | Agent | RAG |
추천 순서: 감성 분석 → 챗봇 → 문서 QA 순서로 진행하면, Fine-tuning → API 활용 → RAG 파이프라인까지 자연스럽게 확장됩니다. 시간이 제한된 경우 관심 있는 프로젝트 하나를 선택해도 됩니다.
공통 환경 설정
모든 프로젝트에서 사용하는 공통 패키지입니다.
pip install torch transformers datasets gradio openai anthropic python-dotenv
프로젝트에서 다루는 NLP 기술 매핑
| NLP 기술 | 감성 분석 | 챗봇 | 문서 QA |
|---|
| 텍스트 전처리 | O | - | O |
| 토큰화 (HuggingFace) | O | - | O |
| PLM Fine-tuning | O | - | - |
| 프롬프트 설계 | - | O | O |
| LLM API 활용 | - | O | O |
| Function Calling | - | O | - |
| 출력 파싱 | - | O | O |
| 안전장치 | - | O | O |
| 임베딩 & 벡터 검색 | - | - | O |
| 평가 지표 | O | O | O |
| Gradio UI | O | O | O |
프로젝트 목록