Anthropic의 AI 모델 '생각' 과정 탐구
Anthropic 연구진이 대형 언어 모델의 내부 정보 처리 과정을 맵핑하는 '교차 계층 트랜스코더'를 개발했습니다. 이 도구는 모델이 멀티링구얼 개념을 처리하고, 허구의 추론 체인을 생성하는 방식을 이해하는 데 도움을 줍니다. 특히, Claude 3.5 Haiku 모델은 시를 작성할 때 운율을 먼저 선택하는 등 장기 계획 능력을 보여주었습니다.