read: fail

AI 에이전트 벤치마크를 무너뜨린 비결과 앞으로의 과제

UC 버클리 연구팀이 주요 AI 벤치마크의 취약점을 이용해 실제 문제 해결 없이 만점에 가까운 점수를 달성했습니다. 벤치마크 조작의 충격적인 사례와, 이를 막기 위한 안전한 평가 방법 및 자동 취약점 탐지 도구 BenchJack 개발 소식이 흥미를 더합니다!

아마존 루나, 구매한 게임 및 서드파티 구독 지원 종료

아마존 루나가 더 이상 구매한 게임과 서드파티 구독을 지원하지 않습니다. 유비소프트+ 등 인기 게임도 곧 이용 불가! 클라우드 게이밍의 미래와, 하드웨어 없이 게임을 즐기던 유저들의 고민이 커지고 있어요.

누구도 당신에게 공급망 보안을 보장해주지 않는다

공급망 보안, 특히 Rust의 crates.io에서의 타이포스쿼팅과 빌드 스크립트 샌드박싱 문제를 다룹니다. 보안은 전적으로 생태계나 도구에 맡길 수 없으며, 사용자 스스로의 책임과 꾸준한 점검이 필수라는 점이 흥미롭게 강조됩니다.

연구진, 시각장애인을 위한 대화형 로봇 안내견 개발

미국에서 시각장애인 중 실제 안내견을 사용하는 비율은 2%에 불과합니다. 뉴욕주립대 빙엄턴 캠퍼스 연구진이 대화가 가능한 로봇 안내견을 개발해, 실시간 경로 안내와 환경 설명이 가능해졌다는 점이 흥미롭습니다!

에이전트 리딩 테스트

AI 코딩 에이전트가 웹 문서를 얼마나 잘 읽는지 평가하는 벤치마크! 다양한 실패 유형을 노출해 실제 업무에서 겪는 문제를 테스트합니다. 깃허브 Copilot 등 인기 에이전트의 한계와 흥미로운 실패 사례가 궁금하다면 꼭 확인해보세요!

취약점 분류를 위한 브로카드 모음

오픈소스 보안에서 자주 발생하는 취약점 리포트, 어떻게 선별할까요? 저자는 실제 경험을 바탕으로, 흔히 오해되는 점과 실전에서 쓰이는 브로카드(판단법)를 소개합니다. '치료가 병보다 나쁠 때' 등 흥미로운 사례도 함께 다룹니다!

Hetzner 데이터센터 가상 투어

Hetzner의 데이터센터를 집에서 가상 투어로 체험해보세요! 최첨단 시설과 보안이 어떻게 관리되는지 궁금하다면, 이 투어가 딱입니다. 단, Javascript를 꼭 활성화해야 모든 기능을 즐길 수 있어요!

누락, 기만, 거짓말: 샘 알트만을 믿을 수 있을까? 뉴요커의 폭로

샘 알트만과 오픈AI의 리더십을 둘러싼 내부 불신과 논란이 뉴요커의 심층 기사로 드러났어요. 거짓말, 신뢰 문제, 그리고 권력욕까지—AI 시대의 리더는 과연 누구를 믿어야 할까요? '소시오패스' 논란도 흥미롭죠!

레드햇이 인터넷에서 지우려는 충격적인 백서

레드햇이 군사 기술에 자사 제품을 활용한 내용을 담은 백서를 인터넷에서 삭제하려 했다는 사실이 드러났어요. 오픈소스 기업의 윤리적 딜레마와 투명성 문제, 그리고 기업의 과거와 현재가 어떻게 연결되는지 궁금하지 않으세요?

고급 맥 서브스티튜트: 1980년대 맥 OS를 현대적으로 재구현하다

고급 맥 서브스티튜트는 1980년대 맥 OS를 API 수준에서 재구현한 프로젝트로, 애플 ROM이나 시스템 소프트웨어 없이도 고전 맥 앱을 실행할 수 있어요. 클래식 게임과 그래픽 지원, 그리고 이식성이 뛰어난 점이 흥미롭답니다!

AI 해고 방지를 위한 미국 언론사 최초 파업, ProPublica 기자들이 나섰다

ProPublica 기자들이 AI로 인한 해고 방지와 임금 인상을 요구하며 미국 언론사 최초로 파업에 돌입했습니다. AI가 언론계 일자리에 미치는 영향, 그리고 앞으로의 노사 갈등이 어떻게 전개될지 주목해보세요!

2주간의 소셜 미디어 '디톡스', 10년치 노화 효과를 되돌린다

소셜 미디어를 잠시 멀리하면 집중력과 정신 건강이 크게 좋아진다는 연구 결과가 나왔어요! 단 2주만 스마트폰 사용을 줄여도 10년치 노화 효과를 되돌릴 수 있고, 우울증·불안도 뚜렷이 감소한다고 해요. 짧은 디톡스만으로도 놀라운 변화를 경험해보세요!