read: fail

Qcon 런던에서 배우는 대규모 언어 모델(LLM) 배포 방법

QCon 런던에서 Meryem Arik이 공유한 대규모 언어 모델(LLM) 배포에 관한 팁과 기술은 초기 증명 개념에는 호스팅 솔루션이 유용하지만, 확장 시 자체 호스팅이 비용 절감, 성능 향상, 그리고 개인 정보 보호 및 보안 요구사항을 충족시키는 데 필수적임을 강조합니다. 자체 호스팅은 모델 크기, GPU 인프라, 기술 발전의 빠른 속도 등의 도전과제를 안고 있으며, 효율적인 배포를 위해 모델을 정량화하고, 추론을 최적화하는 등의 전략이 필요합니다.

자바 뉴스 요약: 새로운 JEP 후보, 프로젝트 비즈번, Ktor 플러그인 저장소, JDKUpdater

최근 OpenJDK에서는 Vector API, Stream Gatherers, ZGC: Generational Mode가 후보 상태로 승격되었고, 프로젝트 비즈번이 제안되었습니다. JDK 23, GlassFish, Spring Framework, Quarkus, Helidon, Grails, JBang에서는 새로운 빌드와 버전이 출시되었으며, JDKUpdater와 Ktor 플러그인 저장소가 새롭게 소개되었습니다. 이러한 업데이트는 자바 개발자들에게 중요한 변화와 기회를 제공합니다.

InfoQ 기사 콘테스트: 기사를 작성하고 Qcon 또는 Dev Summit 티켓을 받아가세요

InfoQ는 개발자들이 새로운 기술과 실천을 배우고 채택할 수 있도록 돕기 위해 고품질 기사를 발행합니다. 소프트웨어 전문가들은 교육적이고 실용적인 기사를 제출하여 지식을 공유할 수 있는 기회를 가질 수 있으며, 상위 3개 기사에는 QCon 이벤트 또는 InfoQ Dev Summit 티켓이 주어집니다. 제안서 제출 마감일은 2024년 5월 10일이며, 우승자는 2024년 7월 8일에 발표됩니다.

팟캐스트: 아키텍처는 저절로 나타나지 않는다 - 트레이시 배넌과의 대화

트레이시 배넌은 열정적인 소프트웨어 아키텍트로, 아키텍처가 기술, 비즈니스, 인간 요소의 균형을 필요로 하는 장인정신이라고 강조합니다. 그녀는 멘토링, 위험 관리, 인지 다양성의 중요성을 강조하며, 아키텍처를 창의적이고 기술적인 혼합으로 보는 흥미로운 관점을 제공합니다.

C++가 Rust처럼 안전한 언어가 될 수 있을까?

C++ 전문가이자 ISO C++ 위원회 의장인 Herb Sutter는 C++을 더 안전한 언어로 만드는 방법을 제시했습니다. 그는 기존의 안전 규칙을 기본적으로 엄격히 적용하고, 안전한 코드 작성을 위한 기능을 더욱 부각시키며, 메모리 안전 관련 취약점을 크게 줄이는 것(예: 98% 감소)을 목표로 합니다. 또한, C++이 Rust만큼의 복잡성 없이 안전할 수 있다고 주장하는 Bjarne Stroustrup의 의견도 소개합니다.

AWS, 데드라인 클라우드로 렌더링을 간소화하다

AWS가 미디어 & 엔터테인먼트(M&E) 및 건축, 엔지니어링, 건설(AEC) 산업을 위한 렌더링 작업 관리를 효율적으로 돕기 위해 데드라인 클라우드를 소개했습니다. 이 서비스는 렌더 팜 설정을 간단하게 하고, 여러 프로젝트를 동시에 처리할 수 있으며, 비용 관리 기능을 통해 예산을 효과적으로 관리할 수 있습니다. 또한, 기존 온프레미스 렌더 팜과의 원활한 통합을 지원하며, 데이터 보안 및 준수를 보장합니다.

Visual Studio 17.10 프리뷰 2: GitHub Copilot이 지원하는 풀 리퀘스트 및 ARM64용 SSDT 지원

Visual Studio 17.10 프리뷰 2에서는 GitHub Copilot을 활용한 풀 리퀘스트 설명 자동 생성, 커밋 세부 정보에서의 변경 사항 요약, Visual Studio 내에서 GitHub 및 Azure DevOps 풀 리퀘스트 코멘트에 직접 접근할 수 있는 기능, ARM64 기기에서의 SQL 서버 개발 도구(SSDT) 지원, 그리고 애플리케이션 성능에 대한 인사이트를 제공하는 가비지 컬렉션 인사이트 등 다양한 신기능이 소개되었습니다. 이 모든 업데이트는 마이크로소프트 기술 전문가인 로버트 크작진스키에 의해 개발되었습니다.

소프트웨어 플랫폼 채택을 위한 자가 서비스 및 사용자 참여 활성화

QCon 런던 2023에서 올가 서먼이 플랫폼 팀이 인프라 작업을 직접 수행하는 것에서 다른 이들이 인프라와 작업할 수 있도록 하는 것으로 전환하는 과정을 공유했습니다. 이는 팀에게 더 적은 수고와 더 많은 창의적 작업을 의미했습니다. 사용자 참여 프로그램을 통해 개발자 생산성과 팀 속도를 높일 수 있는 새 도구의 이점을 설명하고, 인프라 플랫폼을 제품처럼 만들기 위해 자가 서비스, 유연성, 사용자 선택권을 강조했습니다.

클라우드플레어, D1 및 워커스 분석 엔진, 하이퍼드라이브 출시: 리타 코즐로브와 매트 실버록과의 Q&A

클라우드플레어가 서버리스 SQL 데이터베이스 D1, 워커스 분석 엔진, 그리고 하이퍼드라이브를 '생산 준비 완료'로 전환했습니다. 이들 제품은 데이터베이스 관리, 분석, 성능 최적화를 혁신적으로 개선하며, 개발자들에게 무료 티어와 새로운 데이터 수출 기능 등을 제공합니다. 특히, 하이퍼드라이브는 전 세계적으로 데이터베이스 성능을 최적화하는 데 중점을 두고 있습니다.

마이크로소프트, 새 오픈소스 캐시 스토어 '가넷' 발표: 레디스 대안으로 주목

마이크로소프트 리서치가 가넷을 발표했습니다. 이는 기존 레디스 클라이언트와 호환되는 새로운 오픈소스 캐시 스토어로, 레디스와 비교해 더 나은 확장성, 높은 처리량, 낮은 클라이언트 지연 시간을 제공합니다. 가넷은 GitHub에서 MIT 라이선스로 이용 가능합니다.

대화의 기술: 조직 내 커뮤니케이션 패턴을 통해 본 회복력 이해 및 개선 방법

Nora Jones가 설립한 Jeli.io에서는 사건 분석을 통해 조직의 운영 방식을 깊이 이해하고, 이를 통해 회복력을 높일 수 있는 방법을 모색합니다. 사건 후기를 통해 기술적인 세부사항뿐만 아니라, 커뮤니케이션과 협업의 패턴을 분석함으로써 조직의 실제 작동 방식을 파악하고, 이를 통해 조직의 전문성과 회복력을 강화할 수 있음을 강조합니다.

엔비디아, 로봇 지향 AI 기초 모델 발표

엔비디아가 최근 GTC 2024 이벤트에서 GR00T라는 새로운 기초 모델을 발표했습니다. 이 모델은 자연어 이해, 인간 행동 관찰, 인간 움직임 모방이 가능한 지능형 휴머노이드 로봇을 가능하게 합니다. GR00T는 다양한 입력을 받아 로봇이 실행할 행동을 생성하며, 이를 위해 엔비디아는 Jetson Thor 시스템과 Isaac Sim 플랫폼을 개발했습니다.

Microsoft, AI 기반 보안 도구 'Copilot for Security' 정식 출시

Microsoft가 보안 및 IT 팀이 디지털 자산을 보호할 수 있도록 돕는 AI 보안 제품인 'Copilot for Security'의 정식 출시를 발표했습니다. 이 제품은 맞춤형 프롬프트북, 지식 베이스 통합, 다국어 지원 등 새로운 기능을 제공하며, Microsoft Defender 및 Entra와의 연결, 사용 보고서 등을 포함한 개선 사항이 있습니다. 또한, 소비 기반 가격 모델을 도입하여 고객이 요구 사항과 예산에 따라 사용량을 조정할 수 있습니다. 하지만 일부 고객은 SCU(보안 컴퓨트 유닛) 필요성을 추정하는 복잡성과 초기 비용에 대해 우려를 표현했습니다.

팟캐스트: 2024년 아키텍처 및 디자인 트렌드

2024년 소프트웨어 아키텍처와 디자인 트렌드에 대한 토론에서 데이터 중심 아키텍처, 대규모 언어 모델(LLMs), 셀 기반 아키텍처, 마이크로서비스 대 모놀리스, 플랫폼 아키텍처, 그리고 클래식 소프트웨어 개념의 중요성이 강조되었습니다. 아키텍트는 기술 트렌드를 학습하면서도 소프트웨어 설계의 고전적인 원칙을 이해하고 적용해야 한다는 점이 강조되었습니다.

InfoQ 소프트웨어 아키텍처 및 디자인 트렌드 보고서 - 2024년 4월

2024년 4월의 InfoQ 보고서는 셀 기반 아키텍처, 프라이버시 엔지니어링, 데이터 및 복잡한 분석 플랫폼, 대규모 언어 모델(LLMs), 그리고 사회-기술적 요소에 대한 고려가 증가하고 있음을 강조합니다. 이러한 트렌드들은 소프트웨어 아키텍처와 디자인 실천에 혁신적인 변화를 가져오고 있습니다.

스무디 아키텍처에서 내구성 있는 실행을 위한 레이어 케이크로의 전환

내구성 있는 실행은 비즈니스 로직, 상태 관리, 그리고 외부 시스템과의 통합을 명확히 분리하는 프로그래밍 모델입니다. 이는 워크플로우와 액티비티 개념을 사용하여 달성되며, 내결함성, 확장성, 그리고 코드베이스의 용이한 진화와 같은 이점을 제공합니다.

소프트웨어 팀에서의 테스팅의 영향

소프트웨어 개발 팀에서 테스팅의 중요성에 대해 다룬 이 기사는, 테스팅이 소프트웨어 프로젝트의 품질과 성공에 큰 영향을 미친다고 강조합니다. 전체 소프트웨어 팀의 협력적 노력이 필요하며, 개발 과정 전반에 걸쳐 테스팅을 통합하는 것이 중요하다는 점을 지적합니다. 자동화 테스트와 수동 테스트의 중요성, 그리고 테스팅 인프라에 대한 투자가 장기적으로 큰 이득을 가져온다는 점도 언급됩니다.

Microsoft Azure, 클라우드 네이티브 컨테이너 네트워킹 관찰 플랫폼 Retina 소개

Microsoft Azure가 클라우드 네이티브 컨테이너 네트워킹 관찰 플랫폼인 Retina를 출시했습니다. 이 플랫폼은 컨테이너 네트워킹 트래픽의 가시성을 제공하며, 사용자가 클라우드 네이티브 애플리케이션을 모니터링하고, 문제를 해결하며, 보안을 강화할 수 있도록 돕습니다. 현재 Azure 고객을 대상으로 프리뷰 버전이 제공되고 있습니다.

KubeCon EU 기조연설: 책임감 있는 혁신을 위한 생성형 AI 활용 촉구

KubeCon EU에서는 생성형 AI를 책임감 있게 사용할 것을 강조했습니다. 연사들은 윤리적 고려, 잠재적 해악, 투명성, 그리고 책임감 있는 AI 실천 방안 개발에 대한 커뮤니티의 리더십을 촉구했습니다. 생성형 AI의 잠재적 위험을 적극적으로 해결하고 이점을 활용하기 위한 노력이 강조되었습니다.

엣지에서의 관계형 데이터: 프레젠테이션

애플에서 소프트웨어 엔지니어링 인턴으로 일하는 저스틴이 Cloudflare의 고가용성 데이터베이스 아키텍처 설계 및 운영 방법을 소개합니다. Cloudflare는 네트워크 보안과 엣지 컴퓨팅 분야의 선두주자로, 초당 46백만 HTTP 요청과 55백만 행 연산을 처리합니다. 이 프레젠테이션은 고가용성, 읽기 중심의 워크로드, 장애 허용 등에 초점을 맞춘 데이터베이스 아키텍처와, 2020년 주요 장애 대응 방안, 그리고 데이터 지역화를 위한 논리 복제 같은 미래 추세를 탐색합니다.