Attention과 Transformer

학습 경로
사전 지식
문서 목록

Attention 메커니즘은 시퀀스 내에서 중요한 정보에 선택적으로 집중하는 기법이며, Transformer는 이를 핵심 구성요소로 활용하는 아키텍처입니다. 이 섹션에서는 Attention의 기초 개념부터 Transformer의 전체 구조, 그리고 PyTorch 구현까지 단계적으로 학습합니다.

이 콘텐츠는 기존 Deep Learning 탭에서 NLP 탭으로 이동되었습니다. Transformer는 현대 NLP의 근간이 되는 아키텍처로, 사전학습 언어모델(PLM)과 대규모 언어모델(LLM)을 이해하기 위한 필수 선행 지식입니다.

학습 경로

순서	주제	유형	핵심 내용
1	Attention 메커니즘	개념	Bahdanau/Luong Attention, 정렬 점수
2	Self-Attention	개념	Query-Key-Value, Scaled Dot-Product, Multi-Head
3	Transformer 아키텍처	아키텍처	인코더/디코더 스택, 잔차 연결, 정규화
4	위치 인코딩	개념	Sinusoidal, Learned, RoPE, ALiBi
5	인코더-디코더 구조 비교	아키텍처	Encoder-only, Decoder-only, Encoder-Decoder
6	PyTorch 구현	튜토리얼	밑바닥부터 Transformer 구현

Seq2Seq 모델의 한계를 이해하고 있다면 Attention 메커니즘부터 시작합니다. Attention에 익숙하다면 Self-Attention으로 바로 넘어가도 좋습니다.

사전 지식

이 섹션을 학습하기 위해 다음 개념에 대한 이해가 필요합니다.

시퀀스 모델링: RNN, LSTM의 기본 동작 원리
인코더-디코더 패턴: Seq2Seq 모델의 구조
PyTorch 기초: nn.Module, 텐서 연산, 자동 미분

문서 목록

Attention 메커니즘

Bahdanau/Luong Attention과 정렬 점수의 원리

Self-Attention

Query-Key-Value와 Multi-Head Attention

Transformer 아키텍처

“Attention Is All You Need” 논문의 전체 구조 분석

위치 인코딩

Sinusoidal, RoPE, ALiBi 등 위치 표현 기법

인코더-디코더 구조 비교

BERT, GPT, T5로 대표되는 세 가지 패러다임

PyTorch 구현

밑바닥부터 Transformer를 직접 구현하는 튜토리얼

텍스트 벡터화 Attention 메커니즘

00. 시작하기

01. 텍스트 전처리

02. Transformer 기초

03. 사전학습 모델과 LLM

04. NLP 핵심 태스크

05. 프롬프트 엔지니어링

06. LLM 실무 적용

07. 실무 프로젝트

학습 경로

사전 지식

문서 목록

Attention 메커니즘

Self-Attention

Transformer 아키텍처

위치 인코딩

인코더-디코더 구조 비교

PyTorch 구현

00. 시작하기

01. 텍스트 전처리

02. Transformer 기초

03. 사전학습 모델과 LLM

04. NLP 핵심 태스크

05. 프롬프트 엔지니어링

06. LLM 실무 적용

07. 실무 프로젝트

​학습 경로

​사전 지식

​문서 목록

Attention 메커니즘

Self-Attention

Transformer 아키텍처

위치 인코딩

인코더-디코더 구조 비교

PyTorch 구현

학습 경로

사전 지식

문서 목록