read: fail

AI 성능 평가: 회전하는 도형 속에서 공 튀기기

최근 AI 커뮤니티에서는 AI 모델의 성능을 평가하기 위해 '회전하는 도형 속에서 공 튀기기'라는 비공식 벤치마크가 주목받고 있습니다. DeepSeek의 R1 모델이 OpenAI의 o1 pro 모드를 능가했다는 보고가 있는 반면, 일부 모델은 물리적 문제로 어려움을 겪었습니다. 이러한 테스트는 AI의 프로그래밍 능력을 평가하는 데 유용하지만, 일관성 있는 평가 시스템의 필요성을 강조합니다.

AI 산업의 속도에 스트레스 받는 연구자들

AI 연구자들은 높은 연봉과 수요로 부러움을 사지만, 그 이면에는 정신적 압박과 고립감이 존재합니다. 과도한 경쟁과 성과 압박으로 인해 번아웃이 빈번하며, 특히 대학원생들은 임포스터 증후군을 겪기도 합니다. 정신 건강을 중시하는 문화가 필요합니다.

샘 알트먼의 AI 에이전트와 디지털 정체성 연결

샘 알트먼의 새로운 프로젝트, World, 는 AI 에이전트를 개인의 온라인 정체성과 연결하는 도구를 개발하고 있습니다. 이 프로젝트는 AI와 인간을 구분하는 문제를 해결하고자 하며, 디지털 '인간 증명'을 통해 AI가 실제 사람을 대변할 수 있도록 합니다. 이로 인해 AI 에이전트가 사용자와 더 깊이 연결될 수 있는 기회가 열리지만, 동시에 보안 위험도 존재합니다. 알트먼의 다양한 벤처는 AI가 중심이 되는 미래를 준비하고 있습니다.

창업자들은 향후 4년을 어떻게 준비하고 있을까?

TechCrunch의 Equity 팟캐스트에서는 Elon Musk와 Mark Zuckerberg 같은 유명 인사들이 트럼프 대통령 취임식에서 정치인들과 교류하는 동안, 스타트업 창업자들이 새로운 행정부와의 연결을 모색하는 모습을 다룹니다. 새로운 행정부의 스타트업에 대한 접근성이 높아지면서 투명성 문제도 함께 논의됩니다.

마크 저커버그, 연말까지 메타에 130만 개의 GPU 확보 계획 발표

메타의 CEO 마크 저커버그는 AI 분야에서 경쟁력을 유지하기 위해 올해 자본 지출을 대폭 늘릴 계획이라고 밝혔습니다. 메타는 데이터 센터 확장과 AI 개발팀 강화를 위해 2025년까지 최대 800억 달러를 투자할 예정입니다. 연말까지 130만 개의 GPU를 확보해 AI 경쟁에서 앞서 나가려는 메타의 전략이 주목받고 있습니다.

OpenAI의 스타게이트 프로젝트, 자금 부족 문제 직면

스타게이트 프로젝트는 OpenAI가 미국 내 데이터 센터를 구축하기 위한 중요한 인프라 계획입니다. 그러나 자금 부족으로 어려움을 겪고 있습니다. 소프트뱅크와 중동 AI 펀드 MGX 등 여러 투자자들이 참여하고 있지만, 엘론 머스크는 이 프로젝트의 재정적 타당성에 의문을 제기하며 논란을 일으켰습니다.

리라이언스, 인도에 세계 최대 AI 데이터 센터 계획

무케시 암바니의 리라이언스가 인도 자만가르에 세계 최대 규모의 데이터 센터를 건설할 계획입니다. 이 센터는 3기가와트의 용량을 자랑하며, AI 수요 증가에 대응합니다. 프로젝트 비용은 약 200억~300억 달러로 추정되며, 재생 에너지로 운영될 예정입니다. 이와 함께 엔비디아와의 협력으로 AI 인프라를 강화할 계획입니다.

최고의 AI도 넘지 못한 새로운 기준

비영리단체 CAIS와 Scale AI가 최첨단 AI 시스템 평가를 위한 새로운 기준인 '인류의 마지막 시험'을 도입했습니다. 이 기준은 수학, 인문학, 자연과학 등 다양한 주제를 다루는 수천 개의 크라우드소싱 질문으로 구성되어 있습니다. 흥미롭게도, 현재 공개된 AI 시스템 중 이 시험에서 10% 이상의 점수를 받은 시스템은 없었습니다. 연구자들이 새로운 AI 모델을 평가할 수 있도록 이 기준은 연구 커뮤니티에 공개될 예정입니다.

OpenAI, 삭제된 Operator 데이터 최대 90일 보관 가능성 언급

OpenAI는 Operator 사용자의 채팅 및 스크린샷을 최대 90일 동안 보관할 수 있다고 밝혔습니다. 이는 ChatGPT의 30일 보관 기간보다 깁니다. 이 정책은 악용 방지를 위한 것으로, 사용자 데이터에 대한 통제권을 유지하면서도 사기 모니터링을 강화하기 위함입니다. Operator는 다양한 작업을 수행할 수 있는 AI 에이전트로, 사용자의 온라인 활동 스크린샷을 캡처하지만, 비밀번호가 필요한 경우에는 캡처하지 않습니다. 이러한 기능에도 불구하고, 일부 사용자는 데이터 보관에 대한 우려를 가질 수 있습니다.

Anthropic, AI 오류 줄이기 위한 Citations 기능 출시

Anthropic이 AI 오류를 줄이기 위해 새로운 Citations 기능을 발표했습니다. 이 기능은 AI가 이메일 같은 출처 문서를 기반으로 답변을 제공하도록 하여 신뢰성을 높입니다. 특히 문서 요약, Q&A, 고객 지원에 유용하며, Claude 3.5 Sonnet과 Claude 3.5 Haiku 모델에서 사용할 수 있습니다.

OpenAI와 소프트뱅크, 스타게이트에 각각 190억 달러 투자

OpenAI와 소프트뱅크가 스타게이트 프로젝트에 각각 190억 달러를 투자하며, 미국 전역에 데이터 센터를 설립할 계획입니다. 이 프로젝트는 중동 AI 펀드 MGX의 지원도 받고 있으며, 총 5,000억 달러 이상이 데이터 센터에 할당될 예정입니다. 일론 머스크의 비판에도 불구하고, 샘 알트먼은 이를 부정했습니다.

Roli, 49키 교육용 키보드 및 생성 AI 출시

Roli가 새로운 교육용 제품인 Roli Piano를 발표했습니다. 이 제품은 49개의 키를 갖추고 있으며, MIDI 키와 제스처 기반 사운드를 지원합니다. 특히, 생성 AI를 활용한 Piano AI Assistant가 학습을 더욱 직관적이고 재미있게 만들어 줍니다. 음악 교육 시장에서의 큰 잠재력을 노리고 있습니다.

OpenAI, 자율 작업 수행 AI 에이전트 'Operator' 출시

OpenAI가 Operator라는 새로운 AI 에이전트를 출시했습니다. 이 에이전트는 웹 브라우저를 제어하여 여행 예약, 식당 예약, 온라인 쇼핑 등 다양한 작업을 자동화합니다. 미국에서 먼저 출시되며, 유럽은 조금 더 시간이 걸릴 예정입니다. Operator는 사용자 확인을 통해 안전성을 보장하며, 프라이버시를 중시합니다. 이 기술은 AI 에이전트의 미래를 밝히며, 일상적인 인터넷 사용 방식을 혁신할 가능성을 가지고 있습니다.

퍼플렉시티, 안드로이드용 AI 비서 출시

AI 검색 엔진 퍼플렉시티가 안드로이드용 퍼플렉시티 어시스턴트를 출시했습니다. 이 비서는 여러 앱을 통합하여 일상 업무를 돕고, 카메라를 활용해 주변 환경을 분석합니다. 15개 언어를 지원하며, 사용자 피드백을 통해 지속적인 개선을 약속하고 있습니다. 법적 문제에도 직면했지만, 퍼플렉시티는 출판사와의 수익 공유를 통해 해결을 모색하고 있습니다.

ChatGPT, 오늘 아침 큰 장애 발생, OpenAI 복구 완료

오늘 아침 ChatGPT가 큰 장애를 겪었지만, OpenAI는 빠르게 문제를 해결했습니다. 사용자들은 아침 일찍부터 접속 문제를 보고했으며, OpenAI는 신속히 원인을 파악하고 해결책을 마련했습니다. 과거에도 비슷한 문제가 있었지만, 이번에는 빠르게 복구되었습니다. AI 기술의 안정성에 대한 관심이 높아지고 있습니다.

Coval, AI 음성 및 채팅 에이전트를 자율주행차처럼 평가하다

Coval은 AI 음성 및 채팅 에이전트를 자율주행차처럼 평가하는 혁신적인 플랫폼입니다. 브룩 홉킨스가 설립한 이 스타트업은 다양한 시뮬레이션을 통해 에이전트의 성능을 테스트하며, 기업들이 에이전트의 효과성을 입증할 수 있도록 돕습니다. 최근 3.3백만 달러의 시드 펀딩을 받아 성장 중이며, AI 에이전트 시장에서 주목받고 있습니다.

메타의 얀 르쿤, 5년 내 '새로운 AI 아키텍처 패러다임' 예측 및 '로봇공학의 10년' 전망

메타의 얀 르쿤은 향후 3~5년 내에 새로운 AI 아키텍처가 등장할 것이라 예측하며, 이를 '로봇공학의 10년'으로 부를 수 있다고 말합니다. 현재 AI의 한계를 지적하며, 세계 모델과 같은 혁신이 필요하다고 강조합니다. 특히, 로봇공학이 AI 발전의 핵심이 될 것이라 전망합니다.

허깅 페이스, 가장 작은 AI 모델 발표

허깅 페이스가 새로운 AI 모델 SmolVLM-256M과 SmolVLM-500M을 공개했습니다. 이 모델들은 이미지, 짧은 비디오, 텍스트를 분석할 수 있는 가장 작은 모델로, 1GB RAM 정도의 제한된 장치에서도 사용 가능합니다. 특히 개발자들이 대량의 데이터를 비용 효율적으로 처리할 수 있도록 설계되었습니다. 이 모델들은 Apache 2.0 라이선스로 제공되어 자유롭게 사용할 수 있습니다.

Fundraise Up, AI로 비영리 기부 증대 가능성 주장

Fundraise Up는 비영리 단체들이 기부를 더 효과적으로 받을 수 있도록 돕는 AI 기반 플랫폼입니다. 이 플랫폼은 개인화된 기부 제안과 반복 기부를 유도하며, 기부 취소를 고려하는 기부자에게 다양한 옵션을 제공합니다. 최근 7천만 달러의 투자를 유치하며, 3,000개 이상의 비영리 단체가 이 플랫폼을 사용 중입니다.

OpenAI, $200 프로 플랜 사용자에게 에이전트 도구 미리보기 제공할 수도

OpenAI의 새로운 에이전트 도구 Operator가 곧 출시될 가능성이 높습니다. ChatGPT 코드 변경 사항에 따르면, 이 도구는 $200 프로 플랜 사용자에게 초기 연구 미리보기로 제공될 예정입니다. Operator는 웹 브라우저에서 다양한 작업을 수행할 수 있는 기능을 갖추고 있어, 사용자들에게 큰 관심을 끌고 있습니다.