IBM, 추론 효율성 높인 하이브리드 Mamba-2 아키텍처로 AI 비용 절감하는 Granite 4 모델 공개
IBM이 Granite 4.0 소형 언어 모델을 공개했습니다. 하이브리드 Mamba-2/트랜스포머 구조로 RAM 사용량 70% 절감과 빠른 추론 속도를 자랑하며, 저렴한 GPU에서도 동작합니다. 오픈소스 공개와 윤리적 AI 인증도 주목할 만해요!