중국 기업, 단 550만 달러로 대규모 AI 모델 훈련
중국 AI 스타트업 DeepSeek가 비용 효율적인 오픈소스 언어 모델 DeepSeek V3를 공개했습니다. 이 모델은 6710억 개의 매개변수를 가지고 있으며, 코딩 작업에서 뛰어난 성능을 보입니다. 특히, 제한된 Nvidia H800 GPU를 사용해 550만 달러로 훈련되었다는 점이 주목할 만합니다. 안드레이 카르파시는 이 모델이 효율적인 데이터 사용과 알고리즘 최적화를 통해 AI 연구에 큰 발전을 가져올 수 있다고 평가했습니다.