용어집 · 용어
임베딩
글의 의미를 숫자 벡터로 바꾸는 기술입니다. 의미가 비슷한 문장끼리 가까운 숫자가 되어, AI 검색의 기반이 됩니다.
임베딩은 글이나 이미지의 의미를 숫자들의 목록, 즉 벡터로 바꾸는 기술입니다. 의미가 비슷한 것끼리는 가까운 숫자가 되도록 변환하는 것이 핵심인데, 지도 위에 단어들을 배치하면 강아지와 개는 바로 옆에, 강아지와 냉장고는 멀리 놓이는 것과 같습니다.
컴퓨터는 숫자만 다룰 수 있기 때문에 의미를 계산 가능하게 만들려고 등장했습니다. 단어가 아니라 의미로 찾아주는 시맨틱 검색, 추천 시스템, 그리고 AI에게 사내 문서를 찾아 먹여주는 RAG가 모두 임베딩 위에서 작동하므로, AI 검색의 보이지 않는 기반이라고 할 수 있습니다.
임베딩의 품질에 따라 검색과 추천의 정확도가 크게 달라지며, 어떤 모델로 어떻게 변환하느냐가 실무의 핵심 선택지가 됩니다. 눈에 띄지는 않지만 AI 서비스의 성패를 좌우하는 기반 기술입니다.
✅ 왜 중요한가 · 장점
- 단어 일치가 아닌 의미 기반 검색을 가능하게 합니다
- RAG, 추천 시스템 등 실무 AI 서비스의 필수 기반 기술입니다
- 텍스트, 이미지 등 서로 다른 데이터를 같은 방식으로 다루게 해줍니다
⚠️ 한계 · 논쟁
- 변환 과정이 숫자라 왜 비슷하다고 판단했는지 설명하기 어렵습니다
- 임베딩 모델의 품질에 따라 검색 정확도가 크게 좌우됩니다
- 학습 데이터의 편향이 의미 공간에 그대로 반영될 수 있습니다