용어집 · 용어
월드 모델
물리 세계의 이치(중력, 공간, 인과)를 이해하는 AI 모델입니다. 로봇과 영상 생성 AI의 다음 단계로 꼽힙니다.
월드 모델은 언어가 아니라 물리 세계의 작동 원리, 즉 물체가 떨어지고 부딪히고 가려지는 이치를 내부적으로 이해하고 다음 상황을 예측하는 AI 모델을 말합니다. 사람이 공을 던지는 모습만 봐도 어디에 떨어질지 직감하듯, AI가 머릿속 시뮬레이터로 세상의 다음 장면을 그려보는 것에 비유할 수 있습니다.
텍스트만 배운 LLM은 물리적 상식이 약해 로봇이나 자율주행에 그대로 쓰기 어렵다는 한계가 지적되어 왔습니다. 월드 모델은 이를 넘어서려는 시도로, 로봇이 행동의 결과를 미리 시뮬레이션하게 하거나 물리적으로 자연스러운 영상을 생성하는 기반으로 주목받으며, 여러 저명 연구자들이 AI의 다음 단계로 꼽고 있습니다.
다만 아직 연구 개념과 실제 구현 사이의 거리가 있는 분야이며, 영상 생성 AI가 보여주는 그럴듯한 물리 표현이 곧 세계에 대한 진짜 이해인지에 대해서도 논쟁이 있습니다.
✅ 왜 중요한가 · 장점
- 로봇과 자율주행이 행동 결과를 미리 예측하는 기반이 됩니다
- 물리적으로 자연스러운 영상 생성 등 새 응용을 열고 있습니다
- LLM 다음의 AI 발전 방향을 이해하는 핵심 키워드입니다
⚠️ 한계 · 논쟁
- 아직 연구 단계 성격이 강해 상용화까지 거리가 있습니다
- 그럴듯한 예측이 진짜 물리 이해인지에 대한 논쟁이 있습니다
- 학습에 방대한 영상 데이터와 계산 자원이 필요합니다