용어집 · 용어
비지도학습
정답 없이 데이터 속 패턴을 스스로 찾게 하는 학습 방식입니다.
비지도학습은 정답 라벨이 없는 데이터만 주고, AI가 그 안에 숨은 구조와 패턴을 스스로 발견하게 하는 학습 방식입니다. 처음 보는 과일 수천 개를 이름표 없이 늘어놓아도 색과 모양이 비슷한 것끼리 무리를 지을 수 있듯, AI가 데이터를 비슷한 그룹으로 묶거나 특이한 것을 찾아냅니다.
세상 데이터의 대부분에는 정답 라벨이 없고, 라벨을 다는 데는 큰 비용이 들기 때문에 이 방식이 중요해졌습니다. 고객 유형 분류, 이상 거래 탐지, 추천 시스템 등에 쓰이며, 라벨 없는 대량 텍스트로 배우는 LLM 사전학습도 비슷한 계열인 자기지도학습에 기반해 있어 그 의의가 더 커졌습니다.
다만 정답이 없으므로 결과가 맞는지 평가하기 어렵고, AI가 찾아낸 그룹이 무엇을 의미하는지는 결국 사람이 해석해야 한다는 한계가 있습니다.
✅ 왜 중요한가 · 장점
- 라벨링 비용 없이 대량의 데이터를 활용할 수 있습니다
- 사람이 미처 몰랐던 패턴과 그룹을 발견해 줍니다
- 고객 분석, 이상 탐지 등 실무 활용 범위가 넓습니다
⚠️ 한계 · 논쟁
- 정답이 없어 결과의 옳고 그름을 평가하기 어렵습니다
- 발견된 패턴의 의미 해석은 결국 사람의 몫입니다
- 목적이 명확한 예측 문제에서는 지도학습보다 정확도가 낮은 편입니다