read: fail

젬마이니의 힘을 발휘하다: LlamaIndex를 활용하기

Google의 대형 언어 모델인 젬마이니가 정보 상호작용을 혁신하고 있습니다. LlamaIndex는 젬마이니 같은 모델을 자체 애플리케이션에서 활용할 수 있는 프레임워크를 제공합니다. 이 글에서는 API 설정부터 챗봇 확장까지, 젬마이니를 활용하는 방법을 단계별로 소개합니다.

변경 가능 vs. 불변: 클라우드 시대의 인프라 모델

변경 가능 인프라는 기존 자원에 직접 변경 및 업데이트를 적용할 수 있지만, 불변 인프라는 업데이트를 위해 전체 인프라를 교체해야 합니다. 변경 가능 인프라는 유연성을 제공하지만 설정 이탈과 불일치의 위험이 있으며, 불변 인프라는 일관성을 보장하지만 업데이트 중 다운타임이 발생할 수 있습니다. 하이브리드 접근법은 각 모델의 장점을 활용할 수 있습니다.

LLM을 위한 사고 과정 프롬프팅

사고 과정 프롬프팅은 수학 및 추론 문제를 해결하는 데 큰 도움이 되는 기술입니다. 이 기술은 LLM이 문제를 분해하고 단계별로 작업을 보여주도록 요청합니다. 연구에 따르면, 이 방법은 PaLM, LaMDA, GPT-3와 같은 모델의 성능을 향상시키는 데 효과적입니다.

TCPCopy 초보자를 위한 개요

TCPCopy는 대기업에서 서버 측 테스트를 위해 널리 사용되는 오픈 소스 트래픽 재생 도구입니다. 이 도구는 실시간 트래픽을 캡처하고 테스트 서버로 전송하는 'tcpcopy'와 응답 정보를 중계하는 'intercept' 두 가지 주요 구성 요소로 이루어져 있습니다. TCPCopy는 실시간 및 오프라인 모드에서 작동하며, TCP 상태 기계 시뮬레이션과 성능 최적화를 위한 단일 스레드, 이벤트 주도 아키텍처를 사용합니다.

테스트 주도 생성: 이번엔 인공지능과 함께하는 TDD

테스트 주도 생성(TDG)은 테스트 주도 개발(TDD), 페어 프로그래밍, 그리고 생성적 인공지능을 결합한 새로운 접근 방식입니다. TDG는 개발자가 고수준의 사양을 제공하면 AI가 해당 테스트 케이스와 코드를 생성합니다. 이는 코드 품질을 높이고 개발자의 인지 부담을 줄여줍니다.

네트워크 수호자: 스프링 부트 기반 이상 감지 시스템 개발

이 기사에서는 스프링 부트 프로젝트 설정부터 시작하여, 네트워크 트래픽 정보를 담는 NetworkData 모델을 정의하고, 주요 이상 감지 로직을 구현합니다. 또한, 실시간으로 네트워크를 모니터링하고, REST API를 통해 이상 현상을 시뮬레이션하는 방법을 소개합니다. 이 시스템은 네트워크 보안을 강화하는 데 중요한 역할을 합니다.

n8n 자동화를 통한 PMO 회의 자동화

PMO(프로젝트 관리 사무소) 회의 준비는 Asana와 Jira에서 업데이트를 수집하고 보고서를 작성하는 등 시간이 많이 소요되는 작업이었습니다. 하지만 n8n 저코드 자동화 도구를 사용하여 이 과정을 자동화하여 회의 준비 시간을 1시간 이상에서 45분 미만으로 단축시켰습니다. 이로 인해 회의는 정보 수집보다는 의사 결정에 더 집중할 수 있게 되었습니다.

MariaDB 벡터 에디션: AI를 위해 설계되다

MariaDB의 새로운 벡터 에디션은 AI 데이터 도전을 해결하기 위해 전통적인 데이터베이스 설정에 AI 기능을 직접 통합합니다. 이를 통해 사용자는 유사성 검색을 빠르게 수행할 수 있으며, HNSW 인덱스는 대규모 데이터셋의 검색 성능을 향상시킵니다. 이 기술은 AI 중심 아키텍처를 단순화하는 데 도움이 될 것입니다.

클라이언트 확장을 위한 HTMX 활용

이 글은 사용자 인터페이스를 향상시키기 위해 비동기 요청을 구현하는 다양한 방법을 비교하는 시리즈의 일부입니다. HTMX를 사용하여 HTML 조각을 반환하고 클라이언트 측 DOM을 대체하는 방식에 초점을 맞추고 있습니다. HTMX는 복잡한 자바스크립트 코드 없이 클라이언트 상호작용을 구현할 수 있는 새롭고 간단한 방법을 제공합니다.

LLMOps 원칙과 모범 사례를 통한 확장 가능한 AI 운영화

LLMOps는 대규모 언어 모델의 효율적 개발과 배포를 위해 특화된 MLOps의 한 분야입니다. 이는 프롬프트 엔지니어링, 검색 강화 생성(RAG), 미세 조정, 대규모 언어 모델의 사전 훈련과 같은 새로운 개념을 도입합니다. LLMOps는 기본 모델의 최소 변경과 고급 언어 모델 활용이라는 장점이 있지만, 인간 피드백의 필요성과 LLM API의 제한과 같은 단점도 있습니다.

Heroku에서 HTTP/2를 위한 사용자 정의 도메인 설정하기

Heroku가 HTTP/2를 지원한다고 발표했습니다! 이 기능은 멀티플렉싱과 스트림 우선순위 지정 같은 혜택을 제공하지만, 사용자 정의 도메인에서만 지원됩니다. 이 글은 Heroku에서 HTTPS를 사용하여 사용자 정의 도메인을 설정하고 HTTP/2를 활성화하는 방법을 단계별로 안내합니다.

OCI 탐색 가능 기술과 AWS Fargate를 활용한 컨테이너화된 마이크로서비스

AWS Fargate는 서버를 관리하지 않고도 Docker 컨테이너를 실행할 수 있는 서버리스 컴퓨팅 엔진입니다. 자동 스케일링, 비용 최적화 전략, 그리고 SOCI 기술을 통해 컨테이너 이미지를 느리게 로딩하여 시작 시간을 단축시키고 확장성 성능을 향상시킵니다. 이러한 기능은 마이크로서비스, 배치 처리, 이벤트 주도 애플리케이션에 적합합니다.

브라우저 관찰 가능성에 대한 이해

브라우저 관찰 가능성은 싱글 페이지 애플리케이션(SPA) 및 전통적인 멀티 페이지 사이트에서 중요합니다. 이를 위해 경량화 및 모듈식 설계, 비동기 및 논블로킹 작업, 그리고 효율적인 상태 관리가 필요합니다. 또한, 모바일 브라우저의 제한된 리소스를 고려한 데이터 구조 최적화와 현대 웹 API의 활용이 강조됩니다.

마이크로서비스의 과잉: 너무 많은 마이크로서비스

마이크로서비스의 과잉은 종종 건축적 계획과 관리 부족으로 인해 애플리케이션 내 마이크로서비스 수가 통제 불능으로 증가하는 현상을 말합니다. 이로 인해 아키텍처 복잡성 증가, 성능 저하, 자원 활용 비효율 등 다양한 문제가 발생할 수 있습니다. 이를 해결하기 위한 전략으로는 서비스 경계 명확화, 자동화된 배포, 서비스 메쉬 구현 등이 있습니다.

GitHub 환경의 보안 제어 검증의 중요성

소스 코드는 강력한 보안 보호가 필요한 중요 자산입니다. GitHub 데이터를 보호하는 것은 많은 도전을 포함하며, 백업, 자격 증명 관리, 저장소 스캔, 접근 제어 평가 등을 포함한 신뢰할 수 있는 보안 전략이 필요합니다. 또한, GDPR, SOX, HIPAA와 같은 보안 준수 규정을 충족시키기 위해서는 철저한 검증이 요구됩니다.

LLM 매개변수 해석, 2부: Top-P (핵심 샘플링)

이번 글에서는 LLM(대규모 언어 모델)의 다양한 매개변수가 생성된 텍스트의 다양성을 어떻게 조절하는지, 특히 Top-P (핵심 샘플링)가 모델 출력의 창의성과 정확성에 미치는 영향을 살펴봅니다. Top-P 값이 낮을수록 출력이 반복적이고 다양성이 떨어지며, 높을수록 더 창의적이지만 원래의 프롬프트에서 벗어날 수 있습니다.

Postgres 및 Hibernate 6에서 JSON 데이터 수정하기

이 기사는 Postgres 데이터베이스에 저장된 JSON 데이터를 Hibernate 6 프레임워크를 사용하여 수정하는 방법에 대해 설명합니다. jsonb_set, ||, #- 등의 Postgres 함수와 Posjsonhelper 라이브러리를 통한 통합 방법, 그리고 Hibernate6JsonUpdateStatementBuilder를 소개하며, JSON 데이터의 구조와 내용을 최대한 보존하는 것에 중점을 둡니다.

다양한 팀을 아우르는 제로 투 원 소프트웨어 프로젝트 관리

소프트웨어 프로젝트를 성공적으로 이끄는 '글루' 역할의 중요성을 강조합니다. 팀 간 의존성 관리, 정기적인 데모 스케줄링, 팀 간 일치 구축, 그리고 사용자 중심의 접근 방식을 통해 변화에 능동적으로 대응하는 전략이 소개되어 있습니다. 이러한 전략들은 프로젝트의 효율성을 극대화하고, 모든 팀이 하나의 목표를 향해 나아갈 수 있도록 돕습니다.

DocAI: PDF 및 스캔된 문서를 구조화된 데이터로 변환

DocAI는 OCR과 LLM을 활용하여 스캔된 문서나 혼합된 비구조화된 문서에서 중요 정보를 추출하고 구조화된 신뢰할 수 있는 정보를 얻는 솔루션입니다. 사용자는 PDF나 스캔된 문서를 업로드하고 AI 모델과 상호작용하여 필요한 데이터를 질의할 수 있습니다. 이 기술은 서명, 손으로 쓴 날짜 및 텍스트 등을 읽는 데 사용될 수 있습니다.

새로운 Dapr 작업 API 및 스케줄러 서비스 소개

Dapr 1.14 버전에서는 작업 관리를 위한 새로운 Jobs API와 스케줄러 컨트롤 플레인 서비스가 도입되었습니다. 이 서비스는 미래 시점이나 반복 일정에 따라 작업을 예약할 수 있으며, 성능과 확장성 향상에 크게 기여합니다.