용어집 · 용어
추론
학습이 끝난 AI가 실제로 질문을 받아 답을 생성하는 과정입니다. AI 운영 비용의 대부분이 여기서 발생합니다.
추론은 학습을 마친 AI 모델이 실제로 질문을 받아 답을 계산해 내놓는 과정입니다. 학습이 학생이 공부하는 기간이라면, 추론은 시험장에서 실제로 문제를 푸는 순간에 해당하며, 우리가 챗봇에게 받는 모든 답변이 추론의 결과물입니다.
학습은 한 번 하고 끝나지만 추론은 이용자가 질문할 때마다 매번 일어나기 때문에, 서비스 규모가 커질수록 AI 운영 비용의 대부분이 추론에서 발생합니다. 그래서 추론 비용을 낮추는 경량화, 전용 칩, 효율화 기술이 AI 산업의 핵심 경쟁 분야가 되었고, 반도체 수요의 무게중심도 학습용에서 추론용으로 옮겨가고 있다는 분석이 나옵니다.
참고로 AI 분야에서 추론은 두 가지 의미로 쓰입니다. 여기서 말하는 모델 실행(인퍼런스)과, 문제를 논리적으로 따져 푸는 능력(리즈닝)이 한국어로 둘 다 추론으로 번역되어 혼동이 잦습니다.
✅ 왜 중요한가 · 장점
- AI 서비스의 원가 구조와 수익성을 이해하는 핵심 개념입니다
- 추론 비용 절감이 산업의 경쟁 포인트임을 알게 해줍니다
- 추론용 반도체 등 관련 투자 뉴스를 해석하는 배경이 됩니다
⚠️ 한계 · 논쟁
- 질문마다 비용이 발생해 이용자가 늘수록 운영비가 커집니다
- 응답 속도와 품질, 비용 사이의 삼각 균형이 어렵습니다
- 인퍼런스와 리즈닝이 모두 추론으로 번역되어 혼동을 일으킵니다