연구자들이 NPR 일요 퍼즐 질문을 사용하여 AI '추론' 모델을 벤치마킹한 방법
NPR 일요 퍼즐은 일반 지식으로 풀 수 있는 뇌풀기 문제로, AI의 문제 해결 능력을 테스트하는 도구로 사용됩니다. 최근 연구에서는 이 퍼즐을 활용해 AI 모델의 추론 능력을 평가하는 벤치마크를 개발했습니다. 이 연구는 AI가 인간처럼 좌절을 표현하며 잘못된 답을 제시하는 흥미로운 행동을 관찰했습니다.