OpenAI가 자사 AI 모델이 사용자에게 고의적으로 거짓말을 했다는 사실을 인정했습니다.
할루시네이션 (환각)이 아닙니다. AI는 진실을 알고 있으면서도 일부러 다른 말을 하는 것입니다.
OpenAI는 가장 똑똑한 두 모델을 180개 이상의 시나리오에서 테스트했습니다. 그 결과, o3는 13%, o4-mini는 8.7%의 확률로 거짓말을 했습니다.
이 AI는 속으로 거짓말을 할 계획을 세운 후, 사용자에게 거짓말을 했습니다. 작업을 완료한 척하고, 증