용어집 · 용어

데이터 라벨링

다른 표기: labeling, 어노테이션

학습 데이터에 정답 표시를 붙이는 작업입니다. AI 뒤에 있는 대규모 수작업 산업이기도 합니다.

데이터 라벨링은 AI가 공부할 데이터에 정답 표시를 붙이는 작업입니다. 고양이 사진에 고양이라고 적어 두고, 문장에 긍정과 부정을 표시하는 식으로, 문제집에 정답지를 만들어 주는 일이라고 보면 됩니다.

AI는 정답이 붙은 데이터로 배우는 경우가 많기 때문에 라벨의 품질이 곧 AI의 실력을 좌우합니다. 자율주행용 영상에 보행자와 차선을 표시하고, 챗봇 답변의 좋고 나쁨을 사람이 평가하는 것까지 모두 라벨링이며, 화려한 AI 뒤에 있는 대규모 수작업 산업이기도 합니다.

이 작업의 상당 부분이 저임금 국가의 노동자들에게 맡겨지면서 노동 조건 논란이 제기되어 왔습니다. 최근에는 AI가 라벨링을 돕는 자동화도 늘고 있지만, 사람의 검수는 여전히 필수적입니다.

✅ 왜 중요한가 · 장점

⚠️ 한계 · 논쟁

← 용어집 전체 보기