용어집 · 용어
벡터 데이터베이스
임베딩(의미 벡터)을 저장하고 비슷한 것을 빠르게 찾아주는 데이터베이스입니다. RAG 구축의 핵심 부품입니다.
벡터 데이터베이스는 텍스트나 이미지의 의미를 숫자 목록(벡터)으로 바꾼 임베딩을 저장해 두고, 의미가 비슷한 것을 빠르게 찾아주는 특수한 데이터베이스입니다. 도서관에서 제목의 가나다순이 아니라 내용이 비슷한 책끼리 가까이 꽂아두어, 한 권을 찾으면 유사한 책들이 바로 옆에 있는 배치 방식에 비유할 수 있습니다.
기존 데이터베이스는 단어가 정확히 일치해야 찾을 수 있지만, 벡터 검색은 환불 규정과 돈을 돌려받는 방법처럼 표현이 달라도 의미가 통하면 찾아냅니다. 이 특성 덕분에 AI에게 관련 문서를 찾아 먹여주는 RAG 시스템의 핵심 부품이 되었고, 추천 시스템과 유사 이미지 검색에도 널리 쓰입니다.
다만 검색 품질은 임베딩 모델의 성능과 문서를 자르는 방식에 크게 좌우되므로, 벡터 DB 도입만으로 좋은 검색이 보장되지는 않습니다.
✅ 왜 중요한가 · 장점
- 단어가 달라도 의미가 통하는 검색을 가능하게 합니다
- RAG 구축의 핵심 부품으로 기업 AI 도입에 필수적입니다
- 텍스트, 이미지 등 다양한 데이터의 유사도 검색에 활용됩니다
⚠️ 한계 · 논쟁
- 검색 품질이 임베딩 모델과 문서 분할 방식에 크게 좌우됩니다
- 데이터가 커지면 저장과 검색 비용이 상당해집니다
- 정확한 키워드나 조건 검색은 기존 데이터베이스가 더 나을 수 있습니다