용어집 · 용어

추론

다른 표기: inference, 인퍼런스

학습이 끝난 AI가 실제로 질문을 받아 답을 생성하는 과정입니다. AI 운영 비용의 대부분이 여기서 발생합니다.

추론은 학습을 마친 AI 모델이 실제로 질문을 받아 답을 계산해 내놓는 과정입니다. 학습이 학생이 공부하는 기간이라면, 추론은 시험장에서 실제로 문제를 푸는 순간에 해당하며, 우리가 챗봇에게 받는 모든 답변이 추론의 결과물입니다.

학습은 한 번 하고 끝나지만 추론은 이용자가 질문할 때마다 매번 일어나기 때문에, 서비스 규모가 커질수록 AI 운영 비용의 대부분이 추론에서 발생합니다. 그래서 추론 비용을 낮추는 경량화, 전용 칩, 효율화 기술이 AI 산업의 핵심 경쟁 분야가 되었고, 반도체 수요의 무게중심도 학습용에서 추론용으로 옮겨가고 있다는 분석이 나옵니다.

참고로 AI 분야에서 추론은 두 가지 의미로 쓰입니다. 여기서 말하는 모델 실행(인퍼런스)과, 문제를 논리적으로 따져 푸는 능력(리즈닝)이 한국어로 둘 다 추론으로 번역되어 혼동이 잦습니다.

✅ 왜 중요한가 · 장점

⚠️ 한계 · 논쟁

← 용어집 전체 보기