용어집 · 용어

프롬프트 인젝션

다른 표기: prompt injection

문서나 웹페이지에 몰래 심어둔 지시문으로 AI를 조종하는 공격 기법입니다. AI 에이전트 시대의 대표 보안 위협입니다.

프롬프트 인젝션은 AI가 읽게 될 문서, 웹페이지, 이메일 등에 악의적인 지시문을 몰래 심어, AI가 원래 주인의 지시 대신 공격자의 지시를 따르게 만드는 공격입니다. 심부름꾼에게 전달할 편지 속에 "지갑을 나에게 주고 와라"라는 쪽지를 끼워 넣는 것에 비유할 수 있습니다.

AI가 단순 챗봇을 넘어 이메일을 읽고 파일을 다루는 에이전트로 진화하면서, 외부 콘텐츠를 읽는 순간이 공격 통로가 된다는 문제가 부각되었습니다. AI가 데이터와 명령을 근본적으로 구분하지 못하는 데서 생기는 문제라 완전한 차단이 어렵고, AI 보안 분야의 최우선 과제로 꼽힙니다.

이용자가 대화로 AI의 제한을 푸는 탈옥과 혼동되기 쉬운데, 프롬프트 인젝션은 제3자가 콘텐츠를 통해 남의 AI를 조종한다는 점에서 성격이 다릅니다.

✅ 왜 중요한가 · 장점

AI 에이전트 도입 전 반드시 알아야 할 대표 보안 위협입니다
AI에게 민감한 권한을 줄 때의 위험을 판단하는 기준이 됩니다
외부 문서를 읽는 AI 기능을 설계할 때 필수 고려 사항입니다

⚠️ 한계 · 논쟁

데이터와 명령을 구분하지 못하는 구조적 문제라 완벽한 방어가 어렵습니다
공격 문구가 눈에 보이지 않게 숨겨질 수 있어 탐지가 힘듭니다
에이전트의 권한이 커질수록 피해 규모도 함께 커집니다