read: fail

Karpathy: GPT-2 (1.5B) 모델 훈련하기

Karpathy가 GPT-2 (1.5B) 모델을 llm.c에서 훈련한 과정을 상세히 설명합니다. 24시간 동안 32,000단계를 거쳐 훈련된 이 모델은 GPT-2와 비슷한 수준의 일관성을 보여주며, HellaSwag 데이터셋에서의 성능도 평가되었습니다. 또한, 메모리 최적화 전략과 다중 노드 훈련 지원에 대해서도 논의되었습니다.

고등학생, 모델 로켓으로 스페이스X 스타일 수직 착륙 성공

고등학생 아르얀 카푸어는 JRD Propulsion에서 3년간의 프로젝트 끝에 스페이스X 스타일의 수직 착륙을 모델 로켓으로 성공적으로 달성했습니다. 이 프로젝트는 추력 벡터 제어 기술을 중심으로 진행되었으며, 카푸어의 창의적인 접근과 엔지니어링 능력이 돋보이는 성과입니다.

FlashAttention-3: 호퍼 GPU에서 더 빠르고 정확한 주의력 구현

FlashAttention-3은 호퍼 GPU의 기능을 최대한 활용하여 주의력 계산을 가속화하는 새로운 알고리즘입니다. 이는 비동기성, 블록 단위 행렬 곱셈과 소프트맥스 연산의 중첩, 그리고 FP8 저정밀도 하드웨어 지원을 통해 이전 모델보다 1.5-2배 빠른 성능을 제공합니다. 이로 인해 대규모 언어 모델에서 더 긴 맥락을 사용할 수 있게 되었습니다.

바이낸스, Quickwit을 이용해 100PB 로그 서비스 구축 성공

세계 최대의 암호화폐 거래소인 바이낸스가 Elasticsearch에서 Quickwit으로 로그 서비스를 성공적으로 이전했습니다. 이로 인해 연간 수백만 달러의 비용을 절감하고, 하루에 1.6PB까지 인덱싱을 확장하는 등의 중요 성과를 달성했습니다.

AI 제품의 심각한 오류 문제

AI 제품이 명백히 잘못된 결과를 내놓는 것에 대한 우려가 커지고 있습니다. 전통적인 소프트웨어에서는 받아들여지지 않을 버그들이 AI에서는 종종 간과되고, 이러한 문제들이 결국 해결될 것이라는 가정 하에 제품이 출시되고 있습니다. 이에 대한 책임감과 엄격함이 필요하다는 목소리가 높아지고 있습니다.

2023년, Zola, JSON Resume, Weasyprint, 그리고 Nix를 활용한 과도한 이력서 제작

이력서 데이터를 YAML 형식으로 표현한 JSON Resume 표준과 Zola 정적 사이트 생성기를 사용하여 HTML로 변환하고, Weasyprint으로 PDF 이력서를 렌더링했습니다. Nix와 direnv를 이용한 개발 환경 설정과 GitHub Actions를 통한 자동 렌더링으로, 매우 체계적이고 자동화된 이력서 제작 과정을 구축하였습니다.

SMS 이중 인증: 평판보다 나쁜가?

SMS를 통한 이중 인증(2FA-SMS)은 비밀번호만 사용하는 것보다 더 안전하다고 알려져 있지만, SIM 스와핑, SS7 취약점, 피싱 공격에 취약하다. 2013년부터 카오스 컴퓨터 클럽은 SMS 사용을 권장하지 않았으며, 최근에는 200개 이상의 회사에서 1억 9800만 개의 SMS가 유출되었다. 앱이나 하드웨어 토큰을 사용하는 것이 더 안전하다.

스마트폰을 일찍 접한 아이들이 성인이 되었을 때 정신 건강이 더 나빠진다 (2023)

새로운 글로벌 연구에 따르면, 스마트폰을 일찍 접한 사람들이 성인이 되었을 때 정신 건강이 더 나빠지는 경향이 있으며, 이는 특히 여성에게 더 강하게 나타납니다. 이 연구는 부모, 학교, 정책 입안자에게 중요한 시사점을 제공하며, 청소년의 스마트폰 및 소셜 미디어 사용 제한을 지지하는 증거를 더합니다.

NYT 도서 리뷰, 도서 비평이 지향하지 말아야 할 모든 것

NYT 도서 리뷰는 문학적 취향과 품질의 영향력 있는 잣대로 여겨져 왔지만, 실제로는 도서 및 출판 산업에 대해 진지하게 다루지 못한다고 비판받고 있습니다. 리뷰는 비판적인 의견을 표현하는 데 소극적이며, 비백인 작가를 상징적으로 다루고, 출판 산업의 경제적 조건을 제대로 다루지 않는다는 지적을 받습니다. 이러한 문제를 해결하기 위해, 팟캐스트나 다른 출판물이 대안으로 제시되고 있습니다.

월-E (2018)의 타이포그래피 분석

이 글은 픽사의 영화 월-E에서 사용된 타이포그래피, 디자인, 그리고 미래적 요소들에 대해 자세히 다룹니다. 특히 월-E 이름에 사용된 interpunct의 의미, 로봇 표지판에 쓰인 Gunship 글꼴의 기원 등이 흥미롭게 설명되어 있습니다.

마이크로소프트, 가자 지구 통화 후 온라인 생활 '종료'

해외에 거주하는 팔레스타인인들이 가자 지구에 있는 가족과 통화한 후 마이크로소프트 이메일 계정이 예고 없이 정지되었습니다. 약 20명이 계정 폐쇄를 보고했으며, 실제 피해자는 훨씬 많을 것으로 추정됩니다. 이로 인해 이들은 이메일, 연락처 등 중요한 정보에 접근할 수 없게 되어 업무 및 가족과의 연결에 차질을 빚고 있습니다.

AI 챗봇의 미래, 정말 이래도 되는 걸까?

AT&T 파이버 인터넷 사용자가 겪은 속도 저하 문제와 AI 챗봇의 부적절한 대응에 대한 경험담입니다. 원래 1Gbps이던 속도가 8Mbps까지 떨어졌고, AI 챗봇은 문제를 WiFi 탓으로 돌렸습니다. 결국 사람과의 대화를 통해야만 문제 해결의 실마리를 찾을 수 있었습니다.

GitHub Copilot, 저작권 침해가 아니다

GitHub의 AI 보조 도구 Copilot 출시로 자유 소프트웨어 커뮤니티에서 논란이 일고 있습니다. Copilot이 저작권을 침해한다는 주장에도 불구하고, 이는 저작권 예외에 따라 허용되며, Copilot을 제한하려는 시도는 오히려 오픈 문화를 해칠 수 있습니다.

베이비 네이밍의 게임 이론: '캐서린의 풍요'

이 논문에서 저자들은 베이비 네이밍이라는 경쟁적인 영역을 연구합니다. 부모가 독특한 이름을 선택하는 데에만 초점을 맞춘 완벽하게 지식이 있는 행위자라는 가정 하에, 현실 세계를 완벽하게 포착하는 모델을 만들었습니다. 또한, 대규모 언어 모델 도구를 사용한 분석을 통해 미래 연구의 방향을 제시합니다.

다수의 웹사이트와 앱에서 구독 마케팅에 '다크 패턴' 사용

전 세계적인 조사에 따르면, 642개의 온라인 트레이더 중 75.7%가 최소한 하나 이상의 '다크 패턴'을 사용하고 있으며, 66.8%는 두 개 이상을 사용하고 있습니다. 이러한 다크 패턴은 사용자가 자신의 이익에 반하는 선택을 하도록 유도하거나 속이는 온라인 인터페이스 관행을 말합니다. 이 조사는 국제 소비자 보호 및 집행 네트워크(ICPEN)와 글로벌 개인정보 보호 집행 네트워크(GPEN)가 협력하여 진행되었습니다.

Fly.io에서 내 앱을 삭제했어요, 통보도 없이

자동 사기 탐지 알고리즘에 의해 계정이 플래그 처리된 사용자는 앱 복구 없이 계정을 다시 활성화했습니다. $500의 크레딧이 있었고 1년간 활동해온 계정이었음에도 불구하고, 사용자는 사전 통보 없이 계정 접근을 잃었습니다. 이 문제를 겪은 다른 사람이 있는지 궁금해하고 있습니다.

금융 시스템 구축을 위한 엔지니어링 원칙

금융 시스템은 정확성, 감사 가능성, 그리고 시기 적절성을 필요로 합니다. 데이터는 불변성과 내구성을 가져야 하며, 가장 세밀한 단위로 표현되어야 합니다. 또한, 금융 기록 생성 코드는 멱등성을 가져야 중복 입력을 방지할 수 있습니다. 이러한 원칙들은 정확하고 감사 가능하며 시기적절한 금융 시스템을 구축하는 데 중요합니다.

물리적 신경망 훈련

물리적 신경망 훈련에 대한 요약입니다. BibTeX 형식은 학술 논문과 문서에서 참조를 인용하는 데 널리 사용되는 표준입니다. 이 형식은 저자 이름, 출판물 제목, 저널 이름, 권호, 페이지 범위 등의 서지 정보를 구조화된 방식으로 저장합니다. BibTeX는 LaTeX와 함께 사용되어 학술 문서의 인용 관리와 서식을 쉽게 할 수 있습니다.

빅 볼 오브 머드 (1999)

1999년 논문 '빅 볼 오브 머드'는 구조가 느슨하고 임시방편적인 소프트웨어 시스템을 다룹니다. 이 논문은 시간, 비용, 경험 등의 요소가 아키텍처를 뒷전으로 밀어내고, 즉각적인 필요를 충족시키는 방식을 선택하게 만드는 원인을 탐구합니다. 또한, 점진적 성장이나 작동 유지 같은 전략을 통해 시스템을 개선할 방법을 제안합니다.

HN 소개: Dut, 빠른 리눅스 디스크 사용량 계산기

Dut는 리눅스용 디스크 사용량을 계산하는 도구로, 하드 링크의 정확한 계산과 순수 ASCII 출력을 지원합니다. 사용자가 출력 형식을 설정할 수 있으며, 디렉토리의 크기와 하드 링크로 인한 공유 크기를 보여줍니다. 간단한 gcc 명령으로 빌드할 수 있으며, 대부분의 경우 다른 도구보다 빠른 성능을 자랑합니다.