구글, LLM 자가수정 알고리즘 SCoRe 발표
구글 DeepMind 연구팀이 수학이나 코딩 문제를 해결할 때 LLM의 자가수정 능력을 향상시키기 위한 '자가수정을 통한 강화 학습(SCoRe)' 기술을 발표했습니다. 이 기술은 LLM이 생성한 데이터를 사용하여 '자가수정 트레이스'를 만들고, 이를 통해 LLM을 미세 조정합니다. SCoRe는 기존 모델보다 성능이 크게 향상되었다고 합니다.