세레브라스 인퍼런스: 세계에서 가장 빠른 AI 인퍼런스 솔루션 발표
세레브라스 인퍼런스는 Llama3.1 8B 모델에서 초당 1,800 토큰, Llama3.1 70B 모델에서는 초당 450 토큰을 처리하며, 이는 NVIDIA GPU 기반 솔루션보다 20배 빠른 속도를 자랑합니다. 또한, 가격 경쟁력도 뛰어나며, 새로운 AI 기능을 가능하게 하는 강력한 기술을 제공합니다.