용어집 · 용어
OCR
이미지 속 글자를 읽어 텍스트로 바꾸는 기술입니다. 영수증·문서 스캔 처리의 기반입니다.
OCR(광학 문자 인식)은 사진이나 스캔 이미지에 찍힌 글자를 컴퓨터가 편집하고 검색할 수 있는 텍스트 데이터로 바꿔주는 기술입니다. 종이 영수증을 카메라로 찍으면 가게 이름과 금액이 자동으로 가계부에 입력되는 것이 대표적인 예입니다.
종이 문서에 갇힌 정보를 검색하고 분석할 수 있는 데이터로 만들려는 수요에서 발전했으며, 은행의 신분증 확인, 기업의 문서 전산화, 번역 앱의 카메라 번역 등에 폭넓게 쓰입니다. 최근에는 딥러닝과 멀티모달 AI 덕분에 손글씨나 복잡한 양식의 인식률도 크게 좋아졌습니다.
다만 인식 결과가 항상 완벽하지는 않아서, 숫자 하나가 틀리면 안 되는 금융이나 의료 문서에서는 사람의 최종 확인 절차를 함께 두는 것이 일반적입니다.
✅ 왜 중요한가 · 장점
- 종이 문서를 검색 가능한 데이터로 바꿔 업무 효율을 높입니다
- 영수증 처리, 신분증 확인 등 반복 입력 업무를 자동화합니다
- RAG 등 문서 기반 AI 시스템의 데이터 입구 역할을 합니다
⚠️ 한계 · 논쟁
- 흐릿한 이미지, 복잡한 표, 손글씨에서는 오인식이 발생합니다
- 숫자나 이름 오류는 치명적일 수 있어 검수 절차가 필요합니다
- 문서에 담긴 개인정보 처리에 대한 보안 관리가 요구됩니다