용어집 · 서비스
Whisper
OpenAI가 공개한 음성 인식 모델입니다. 무료로 공개되어 자막 생성 도구들의 기반이 됐습니다.
OpenAI가 무료로 공개한 음성 인식 모델로, 다양한 언어의 음성을 텍스트로 변환합니다. 공개 모델이어서 누구나 내려받아 쓸 수 있고, 수많은 자막 생성 도구와 받아쓰기 서비스의 기반 기술이 됐습니다.
자막 제작, 회의 녹취, 인터뷰 정리를 자동화하려는 개발자와 크리에이터에게 유용합니다. 직접 설치해 쓰거나, 이 모델을 내장한 여러 서비스를 통해 간접적으로 쓸 수 있습니다.
그 자체로 완성된 앱이 아니라 모델이라는 점이 특징으로, 일반 사용자는 보통 Whisper 기반의 앱을 통해 혜택을 받습니다.
✅ 장점
- 무료 공개 모델로 누구나 활용할 수 있습니다
- 다국어 인식 능력이 뛰어납니다
- 로컬 실행이 가능해 민감한 녹음 파일도 외부 유출 없이 처리할 수 있습니다
⚠️ 단점 · 한계
- 그대로 쓰려면 설치와 실행에 기술 지식이 필요합니다
- 고유명사나 전문 용어에서 오인식이 발생할 수 있습니다
- 긴 파일 처리는 컴퓨터 성능에 따라 시간이 걸립니다