용어집 · 용어

트랜스포머

다른 표기: Transformer

2017년 구글이 발표한 AI 구조로, ChatGPT를 비롯한 현대 생성형 AI 대부분의 기반 기술입니다.

트랜스포머는 2017년 구글 연구진이 발표한 딥러닝 구조로, 문장 안의 모든 단어가 서로 얼마나 관련 있는지를 한꺼번에 계산하는 어텐션이라는 방식이 핵심입니다. 책을 한 줄씩 순서대로만 읽던 이전 방식과 달리, 페이지 전체를 펼쳐 놓고 중요한 부분끼리 연결해 가며 읽는 독서법에 비유할 수 있습니다.

단어를 순서대로 처리하던 기존 구조는 긴 문장에서 앞 내용을 잊는 문제와 병렬 계산이 어렵다는 한계가 있었습니다. 트랜스포머는 이를 해결해 대규모 병렬 학습을 가능하게 했고, 그 결과 GPT 계열을 비롯한 현대 LLM과 이미지, 음성 생성 AI까지 대부분이 이 구조 위에 세워졌습니다. GPT의 T가 바로 트랜스포머를 뜻합니다.

다만 입력이 길어질수록 계산량이 급격히 늘어나는 구조적 부담이 있어, 이를 개선한 변형과 대안 구조 연구가 활발히 이어지고 있습니다.

✅ 왜 중요한가 · 장점

⚠️ 한계 · 논쟁

← 용어집 전체 보기