용어집 · 용어

지식 증류

다른 표기: distillation, 디스틸레이션

큰 모델(교사)의 능력을 작은 모델(학생)에게 옮겨 담는 기법입니다. 저비용 모델 논쟁에서 자주 등장하는 용어입니다.

지식 증류는 크고 성능 좋은 모델(교사)의 능력을 작고 가벼운 모델(학생)에게 옮겨 담는 기법입니다. 학생 모델이 교사 모델의 답변 방식을 흉내 내며 배우는 것으로, 명강사의 강의를 요약한 핵심 정리 노트로 공부하는 것에 비유할 수 있습니다.

거대 모델은 성능이 좋지만 운영 비용이 비싸고 느리기 때문에, 비슷한 실력의 작은 모델을 만들어 비용을 낮추려는 목적에서 널리 쓰입니다. 스마트폰에서 돌아가는 온디바이스 AI나 저가형 API 모델을 만들 때 핵심적인 기술입니다.

한편 다른 회사의 최상위 모델 출력을 무단으로 받아 학습해 저비용 모델을 만들었다는 의혹이 업계 논쟁으로 번지기도 했습니다. 어디까지가 정당한 학습이고 어디부터가 무임승차인지에 대한 규칙은 아직 정리되는 중입니다.

✅ 왜 중요한가 · 장점