Microsoft Research, rStar-Math 공개: 소형 언어 모델의 수학적 추론 능력 향상
Microsoft Research가 rStar-Math를 발표하며 소형 언어 모델(SLM)의 수학적 추론 능력을 크게 향상시켰습니다. 이 프레임워크는 Monte Carlo Tree Search를 활용해 단계별 추론을 가능하게 하며, 자체 진화 과정을 통해 모델과 데이터 품질을 지속적으로 개선합니다. 특히, Qwen2.5-Math-7B 모델은 MATH 벤치마크에서 58.8%에서 90.0%로 정확도가 향상되었습니다. rStar-Math는 GitHub에서 오픈 소스로 제공되어 AI 시스템의 수학적 추론 능력을 강화하는 데 기여할 것입니다.