용어집 · 용어
지도학습
정답이 달린 데이터로 AI를 가르치는 학습 방식입니다. 사진에 "고양이"라는 라벨을 붙여 학습시키는 식입니다.
지도학습은 문제와 정답을 짝지은 데이터를 대량으로 보여주며 AI를 가르치는 학습 방식입니다. 고양이 사진에는 고양이, 개 사진에는 개라고 적힌 문제집을 풀게 하고 채점을 반복하면, 나중에는 처음 보는 사진도 스스로 구분하게 되는 원리입니다.
머신러닝에서 가장 기본적이고 널리 쓰이는 방식으로, 스팸 메일 분류, 질병 진단 보조, 수요 예측처럼 정답이 명확한 문제에 강력합니다. 산업 현장의 AI 프로젝트 상당수가 여전히 지도학습 기반이며, LLM을 용도에 맞게 다듬는 파인튜닝에도 이 방식이 쓰입니다.
가장 큰 부담은 정답 라벨을 사람이 일일이 달아야 한다는 점입니다. 라벨링 비용이 크고, 라벨이 틀리거나 편향되면 그 오류를 AI가 그대로 배운다는 한계가 있습니다.
✅ 왜 중요한가 · 장점
- 정답이 명확한 문제에서 높은 정확도를 안정적으로 냅니다
- 분류, 예측 등 산업 현장의 AI 과제 대부분에 적용됩니다
- 머신러닝의 다른 방식들을 이해하는 기준점이 되는 기본 개념입니다
⚠️ 한계 · 논쟁
- 정답 라벨을 만드는 데 많은 인력과 비용이 듭니다
- 라벨의 오류와 편향을 AI가 그대로 학습합니다
- 학습한 범위를 벗어난 새로운 유형의 데이터에는 약합니다