용어집 · 용어

벡터 데이터베이스

다른 표기: vector DB, 벡터DB

임베딩(의미 벡터)을 저장하고 비슷한 것을 빠르게 찾아주는 데이터베이스입니다. RAG 구축의 핵심 부품입니다.

벡터 데이터베이스는 텍스트나 이미지의 의미를 숫자 목록(벡터)으로 바꾼 임베딩을 저장해 두고, 의미가 비슷한 것을 빠르게 찾아주는 특수한 데이터베이스입니다. 도서관에서 제목의 가나다순이 아니라 내용이 비슷한 책끼리 가까이 꽂아두어, 한 권을 찾으면 유사한 책들이 바로 옆에 있는 배치 방식에 비유할 수 있습니다.

기존 데이터베이스는 단어가 정확히 일치해야 찾을 수 있지만, 벡터 검색은 환불 규정과 돈을 돌려받는 방법처럼 표현이 달라도 의미가 통하면 찾아냅니다. 이 특성 덕분에 AI에게 관련 문서를 찾아 먹여주는 RAG 시스템의 핵심 부품이 되었고, 추천 시스템과 유사 이미지 검색에도 널리 쓰입니다.

다만 검색 품질은 임베딩 모델의 성능과 문서를 자르는 방식에 크게 좌우되므로, 벡터 DB 도입만으로 좋은 검색이 보장되지는 않습니다.

✅ 왜 중요한가 · 장점

⚠️ 한계 · 논쟁

← 용어집 전체 보기