read: fail

재귀적으로 생성된 데이터에 대한 훈련 시 AI 모델의 붕괴

연구자들은 재귀적으로 생성된 데이터에 대해 훈련할 때 발생하는 모델 붕괴 현상을 분석했습니다. 이들은 통계적 오류로 인해 발생하는 이 현상을 두 가지 수학적 모델을 통해 설명하며, 마르코프 체인다차원 가우시안 모델을 사용하여 이론적 근거를 제시합니다. 이 연구는 AI의 성능과 안정성에 중요한 시사점을 제공합니다.

C 및 C++ 해시 테이블에 대한 광범위한 벤치마크

이 기사는 기존의 C++ 테이블에 집중된 벤치마크와 달리 C 및 C++ 해시 테이블의 포괄적인 벤치마크를 제공합니다. 다양한 조건에서의 성능을 테스트하며, boost::unordered_flat_mapankerl::unordered_dense가 C++에서, Verstablecc_map이 C에서 뛰어난 성능을 보였습니다.

이번 주 AI 소식: 카말라 해리스가 AI 규제를 어떻게 다룰까?

조 바이든 대통령이 재선을 포기하고 카말라 해리스 부통령을 민주당 후보로 지지하면서, 미국의 AI 규제 미래에 영향을 줄 수 있습니다. 해리스는 바이든의 접근 방식을 유지할 것으로 보이지만, 일부는 그녀가 덜 상위에서 하향식의 규제 접근을 취할 수도 있다는 우려를 제기합니다.

QA에서의 테스트 자동화

테스트 자동화는 현대 소프트웨어 개발에 필수적이며, QA를 간소화하고 배포를 가속화하며 품질을 향상시킵니다. 이는 다양한 테스트 유형을 포함하며, AI, ML, 코드리스 자동화의 발전으로 더욱 효율적이고 정확해질 전망입니다.

창조적 AI 스타트업에 대한 투자는 여전히 강력하지만 도전과제가 존재

2023년 상반기 동안 225개의 창조적 AI 스타트업이 벤처캐피탈로부터 12.3억 달러를 유치했습니다. 특히 초기 단계 스타트업이 8.7억 달러를 차지하며 큰 주목을 받았습니다. 그러나 저작권 데이터 사용에 대한 법적, 규제적 도전과 고비용의 훈련 데이터 확보는 이들 기업의 미래에 불확실성을 더하고 있습니다.

T-Mobile, 메트로넷 인수로 광대역 인프라 확장

T-Mobile과 투자 회사 KKR이 합작 투자를 통해 광대역 서비스 제공업체 메트로넷을 인수합니다. 이 거래를 통해 T-Mobile은 메트로넷의 고속 광대역 인프라와 고객 기반을 확보하게 되며, 약 49억 달러를 투자할 예정입니다. 인수 후 메트로넷은 도매 서비스 제공업체로 전환되며, T-Mobile이 고객 관리를 담당하게 됩니다.

CrowdStrike, 컴퓨터 수백만 대를 마비시킨 업데이트 사과로 '우버 이츠' 10달러 상품권 제공

사이버보안 회사 CrowdStrike이 최근 소프트웨어 업데이트 실수로 전 세계 수백만 대의 컴퓨터가 '블루 스크린 오류'에 빠진 사건에 대해 사과하며 파트너들에게 10달러 상당의 우버 이츠 상품권을 제공합니다. 이 사건으로 인해 공항과 병원에서 큰 혼란이 발생했습니다.

Reddit, 주요 검색 엔진 및 AI 봇 차단 — 단, 비용을 지불하는 경우 제외

Reddit이 최근 게시물과 댓글을 검색 엔진이 표시하지 못하도록 차단하기 시작했습니다. Google만이 $60백만 계약을 통해 Reddit 콘텐츠로 AI 모델을 훈련시키기 때문에 최근 결과를 보여줍니다. 이로 인해 Bing과 DuckDuckGo 같은 다른 검색 엔진은 제외되었습니다. 이는 Reddit이 새로운 수익원을 개발하고 투자자를 만족시키기 위한 전략의 일환입니다.

엘론 머스크, '세계에서 가장 강력한 AI' 훈련 시작 주장

엘론 머스크가 테네시주 멤피스에 위치한 xAI의 새로운 슈퍼컴퓨터 시설에서 '세계에서 가장 강력한 AI 훈련 클러스터'의 훈련을 시작했다고 발표했습니다. 이 프로젝트는 지역 전력망에 미칠 영향에 대한 우려를 낳고 있으며, xAI의 목표가 현실과 부합할지에 대한 의문이 제기되고 있습니다.

데이터 민주화를 위한 그래프 RAG: 개념, 기능, 평가 방법

그래프 RAG는 정보 검색텍스트 생성을 결합한 고급 AI 기술로, 대규모 언어 모델이 지식 소스에서 관련 정보를 검색하여 생성된 텍스트에 통합할 수 있게 합니다. 이 기술은 데이터를 노드와 관계로 구성하여 효율적이고 정확한 정보 검색을 가능하게 하며, 이를 통해 언어 모델에 더 나은 맥락을 제공합니다.

영국 고등학교, 생체 인식 얼굴 스캔 사용으로 프라이버시 우려 직면

에식스 외곽의 한 고등학교에서 생체 인식 얼굴 인식 기술 사용이 GDPR(일반 데이터 보호 규정)을 위반하여 논란이 되고 있습니다. 학생들은 식사 결제를 위해 얼굴 스캔을 사용할 수 있으나, 이는 부모가 자녀의 시스템 사용을 거부할 수 있는 '옵트아웃' 방식만을 허용하고 있습니다. 이는 학생들의 프라이버시 보호와 학교의 안전 문제 사이에서 균형을 찾아야 한다는 필요성을 강조합니다.

CrowdStrike, 컴퓨터 대란 사과로 '10달러 상품권' 제공

사이버보안 회사 CrowdStrike이 지난주 전 세계 수백만 대의 컴퓨터를 마비시킨 업데이트 실수에 대해 사과하며 파트너들에게 10달러 Uber Eats 상품권을 제공합니다. 일부 사용자는 상품권 활성화에 문제를 겪고 있으며, 이는 발행 측에서 취소된 것으로 나타났습니다.

미스트랄 AI의 새로운 언어 모델, 미스트랄 라지 2

미스트랄 AI의 최신 대형 언어 모델인 미스트랄 라지 2는 128k 컨텍스트 윈도우와 수십 개 언어 지원을 제공합니다. 이 모델은 단일 노드 추론과 긴 컨텍스트 애플리케이션에 최적화되어 있으며, 1230억 개의 파라미터를 자랑합니다. 또한, 다양한 언어 작업에서 뛰어난 성능을 보여주며, 복잡한 비즈니스 애플리케이션을 위한 강력한 엔진 역할을 합니다.

시각-언어 모델과 음성 변환 기술의 통합 (1부)

이 기사는 시각 장애인을 위해 이미지를 음성으로 설명할 수 있는 앱을 만드는 방법에 대해 설명합니다. 시각 언어 모델(VLM)음성 변환 기술(TTS)을 활용하여, 이미지를 텍스트로 변환하고 이를 자연스러운 음성으로 출력하는 과정을 다룹니다. 또한, BLIP VLM과 VITS TTS 모델을 사용한 데모 앱 구축 과정을 소개하며, 이는 접근성 향상에 유용할 수 있습니다.

콜린 캐퍼닉, 창작자의 이야기 소유권을 돕기 위한 AI 스토리텔링 플랫폼 '루미' 출시

전 NFL 쿼터백이자 시민권 운동가인 콜린 캐퍼닉이 AI 스토리텔링 플랫폼 '루미'를 출시했습니다. 이 플랫폼은 창작자가 자신의 작품을 소유하고 통제할 수 있도록 돕기 위해 만들어졌으며, 게이트키핑, 제작 비용 문제를 해결하고, 다양한 스토리텔러와 창작자에게 더 나은 기회를 제공합니다.

타입을 활용한 더 나은 API 구축

이 기사는 모듈화된 설계의 중요성과 복잡성을 관리하는 정의된 인터페이스의 역할에 대해 설명합니다. 정적 타입 검사, 널 안전성, 태그된 유니온을 통해 컴파일러가 많은 오류를 적은 노력으로 잡아낼 수 있는 방법을 강조하며, 이는 프로그램이 성장하고 진화할 때 발생할 수 있는 문제를 예방할 수 있습니다.

미국, 스타트업과 벤처캐피탈에 외국 투자 경계 경고

미국 정부는 외국 투자가 적대 국가들의 감시 수단일 수 있다고 경고하며, 테크 스타트업과 벤처캐피탈 회사들에게 각별한 주의를 요구하고 있습니다. 이러한 투자는 미국의 경제적 및 국가 안보에 위협이 될 수 있으며, 기업 실패로 이어질 수도 있습니다. 특히 중국과 같은 적대적인 국가들로부터의 투자가 주목받고 있습니다.

연구 결과가 없어도 출판될 수 있을까?

진화생물학자 나탈리 필라쿠타의 연구에서 어류의 선호도에 대한 결론을 내리지 못했지만, 이는 학계의 '서랍 속 문제'를 부각시킵니다. 이 문제는 연구 결과가 부정적이거나 없을 때 출판되지 않는 경향이 있어, 과학 기록의 왜곡과 자원 낭비를 초래합니다. 이에 대응하기 위해 일부 저널은 연구 계획의 사전 등록을 장려하고 있습니다.

구글, AI 계약 덕분에 이제 Reddit에서 유일하게 작동하는 검색 엔진

Reddit의 사용자 생성 콘텐츠를 독점적으로 검색할 수 있는 구글만이 이제 Reddit에서 결과를 제공할 수 있습니다. Bing, DuckDuckGo 등 다른 검색 엔진은 더 이상 새로운 결과를 보여줄 수 없게 되었습니다. 이는 구글의 거의 독점적인 검색 시장 지배가 다른 회사들의 경쟁을 어렵게 만들고 있음을 보여줍니다.

Rust가 CrowdStrike 장애를 해결하지 못한 이유

Rust는 메모리 안전성을 제공하지만, CrowdStrike의 최근 장애는 로직 버그 때문이었습니다. 이는 Rust가 해결할 수 있는 문제가 아니며, 실제 문제는 배포 관행테스트 부족에 있었습니다. 따라서 Rust만으로는 이러한 종류의 문제를 완전히 방지할 수 없습니다.