본문 바로가기

데이터 과학/데이터 엔지니어링12

노무라 도모키, 깃허브 액션으로 구현하는 실전 CI/CD 설계와 운영 - 워크플로 설계에서 릴리스 자동화, 배포, 보안까지 실무 흐름으로 익히는 깃허브 액션 가이드, 제이펍 🚀 깃허브 액션으로 구현하는 실전 CI/CD 설계와 운영릴리스 자동화부터 배포, 보안까지 실무 흐름을 완벽하게 익히는 실전 가이드소프트웨어 개발 환경이 급변하는 오늘날, ‘빠른 배포’, ‘효율적인 협업’, ‘신속한 피드백’은 더 이상 선택이 아닌 필수입니다. DevOps 문화가 자리 잡으면서, 개발자와 운영자가 유기적으로 협력하는 구조는 일상이 되었고, 이 모든 흐름의 중심에는 **CI/CD(지속적 통합 및 지속적 배포)**가 자리 잡고 있습니다.그렇다면 이 복잡하고도 필수적인 CI/CD를 어떻게 하면 쉽게, 그리고 효율적으로 실무에 도입할 수 있을까요? 그 해답이 바로 이 책에 담겨 있습니다. 『깃허브 액션으로 구현하는 실전 CI/CD 설계와 운영』(노무라 도모키 저, 제이펍 출판) 은 CI/CD 도.. 2025. 6. 27.
노아 기프트, 알프레도 데자, MLOps 실전 가이드 - DevOps와 MLOps의 이론과 실습부터 클라우드 컴퓨팅, AutoML, 엣지 컴퓨팅까지, 한빛미디어 📌 “좋은 모델만으로는 부족하다”머신러닝 모델을 개발하는 것만으로는 실제 업무에 전혀 도움이 되지 않는다는 사실, 알고 계셨나요?지금 이 순간에도 수많은 개발자와 데이터 사이언티스트들이 성능 높은 머신러닝 모델을 만들고 있지만, 그 중 상당수는 배포조차 되지 못하고 파일 형태로 어딘가에 방치되고 있습니다. 왜일까요? 정답은 바로 “운영”에 있습니다.바로 이 지점에서 오늘 소개할 책 『MLOps 실전 가이드』가 등장합니다. 이 책은 머신러닝 모델을 실제 서비스로 지속 가능하게 운영하고 개선하는 일련의 과정, 즉 MLOps(Machine Learning Operations)에 대한 매우 실용적이고도 깊이 있는 안내서입니다.🧠 MLOps란 무엇인가?MLOps는 머신러닝 모델의 개발에서 끝나는 것이 아니라,.. 2025. 6. 23.
니샨트 가르그, 아파치 Kafka 따라잡기 - 확장성과 고가용성을 지닌 메시지 브로커, 에이콘출판 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다. "아파치 Kafka 따라잡기"는 아파치 카프카의 실전 활용을 위한 필수 가이드로, 카프카의 기본 개념부터 클러스터 설정, 생산자와 소비자 구현, 그리고 하둡 및 스톰과의 연동까지 다양한 내용을 포함하고 있습니다. 저자 니샨트 가르그는 13년 이상의 경력을 가진 테크니컬 아키텍트로, 자바 및 빅데이터 관련 기술에 대한 깊은 이해를 바탕으로 이 책을 집필하였습니다. 이 책은 카프카의 설치 방법과 클러스터 설정을 단계별로 안내하며, 초보자도 쉽게 따라할 수 있도록 구성되어 있습니다. 각 장에서는 카프카의 기본 구조와 기능을 설명하고, 실제 예제를 통해 독자가 카프카의 기능을 직접 체험할 수 있도록 돕습니다. 특히, 생산자와 소비자를 작성하는 방.. 2025. 5. 25.
앤톤 츄바킨 , 케빈 슈미트 , 크리스토퍼 필립스, 실전 LOG 분석과 체계적인 관리 가이드 - 개발자와 운영자의 트러블슈팅과 보안 담당자의 이상행위 탐지를 위한, 에이콘출판 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다. 『실전 LOG 분석과 체계적인 관리 가이드』는 로그 관리의 중요성과 그 활용 방법에 대해 깊이 있는 통찰을 제공하는 책입니다. 저자 앤톤 츄바킨은 보안 전문가로서 로그 데이터의 분석과 관리에 대한 방대한 경험을 바탕으로 이 책을 집필하였습니다. 로그는 IT 환경에서 발생하는 다양한 사건과 활동을 기록하는 중요한 도구로, 이를 통해 시스템의 상태를 점검하고 보안 위협을 탐지할 수 있습니다. 이 책은 로그의 정의부터 시작하여, 로그 메시지의 종류, 사례 연구, 분석 기법, 도구 활용법, 법규 컴플라이언스까지 폭넓은 내용을 다룹니다. 특히, 로그를 효과적으로 분석하고 관리하기 위한 실전 가이드를 제공하며, 이를 통해 독자는 실무에서 로그를 적극.. 2025. 5. 24.
미카엘 메종 , 케이트 스탠리, 카프카 커넥트 - 유연하고 확장 가능한 실시간 데이터 파이프라인 구축, 책만 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다. 카프카 커넥트(Kafka Connect)는 아파치 카프카의 핵심 구성 요소로, 다양한 데이터 소스와 싱크 시스템을 연결하여 실시간 데이터 파이프라인을 구축하는 데 필수적인 도구입니다. 이 책은 카프카 커넥트를 활용하여 강력하고 유연한 데이터 파이프라인을 설계하고 운영하는 방법을 다룹니다. 저자 미카엘 메종은 아파치 카프카 프로젝트 관리 위원회(PMC)의 커미터이자, 레드햇의 카프카 팀에서 수석 소프트웨어 엔지니어로 활동하며, 카프카의 생태계에 기여해온 전문가입니다. 이 책은 데이터 엔지니어, 개발자, 사이트 신뢰성 엔지니어(SRE)를 위한 실용적인 가이드를 제공하며, 카프카 커넥트를 통해 데이터 흐름을 최적화하는 방법을 심도 있게 설명합.. 2025. 4. 22.
그웬 샤피라 , 토드 팔리노 , 라지니 시바람 , 크리트 페티, 카프카 핵심 가이드 - 대규모 실시간 데이터와 스트림 처리, 제이펍 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다. "카프카 핵심 가이드"는 아파치 카프카의 모든 기능과 활용 방법을 심도 있게 다룬 필독서입니다. 이 책은 카프카의 창시자들과 한국인 개발자가 직접 참여하여, 최신 버전의 카프카에 대한 정보를 제공합니다. 데이터의 이동은 현대 애플리케이션에서 매우 중요한 요소이며, 이 책은 카프카를 통해 데이터를 효과적으로 관리하는 방법을 제시합니다. 특히, 이 가이드는 카프카의 AdminClient API, 트랜잭션, 보안 기능 등 최신 기능을 포함한 개정증보판으로, 초보자부터 전문가까지 모두에게 유용한 정보를 제공합니다. 카프카 클러스터를 프로덕션 환경에 설치하는 방법, 신뢰성 있는 이벤트 주도 마이크로서비스 개발, 그리고 규모 가변적인 스트림 처리 .. 2025. 4. 21.
제임스 댄스모어, 데이터 파이프라인 핵심 가이드 - 성공적인 데이터 분석을 위한 인프라 설계와 구축, 위키북스 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다.  제임스 댄스모어의 "데이터 파이프라인 핵심 가이드"는 데이터 분석의 기초부터 심화까지 체계적으로 다루고 있는 책입니다. 데이터 파이프라인은 데이터 분석의 성공을 위해 필수적인 요소로, 다양한 데이터 소스에서 데이터를 이동하고 변환하는 과정을 통해 가치를 창출하는 데 큰 역할을 합니다. 이 책은 데이터 파이프라인의 정의와 작동 방식을 명확히 설명하며, 최신 데이터 스택에서의 활용 방법을 안내합니다. 책의 주요 내용은 데이터 파이프라인 구축에 필요한 기본 개념과 고려사항을 포함합니다. 일괄 처리와 스트리밍 데이터 수집, 데이터 엔지니어가 사용하는 공통 도구와 제품, 그리고 파이프라인이 분석 및 보고 요구사항을 어떻게 지원하는지를 심도 있게 .. 2025. 4. 17.
랄프 킴벌 , 마기 로스, 랄프 킴벌의 데이터 웨어하우스 툴킷 - DW/BI와 빅데이터 분석을 위한 다차원 모델링 완벽 가이드 | 3 판, 비제이퍼블릭 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다.  현대의 기업 환경에서는 데이터의 중요성이 점점 더 강조되고 있습니다. 방대한 양의 데이터를 효과적으로 분석하고 활용하기 위해서는 체계적인 데이터 저장 및 관리 시스템이 필요합니다. 바로 이곳에서 데이터 웨어하우스(Data Warehouse)가 중요한 역할을 합니다. 오늘 소개할 책은 데이터 웨어하우스 구축에 필요한 핵심 지식과 기법을 제공하는 The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling입니다. 1. 저자 및 책의 배경 이 책은 데이터 웨어하우스 분야에서 권위자로 인정받는 Ralph Kimball과 Margy Ross가 공동 저술한 작품입니다. Ralph.. 2025. 4. 16.
마틴 클레프만, 데이터 중심 애플리케이션 설계 - 신뢰할 수 있고 확장 가능하며 유지보수하기 쉬운 시스템을 지탱하는 핵심 아이디어, 위키북스 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다.  "데이터 중심 애플리케이션 설계"는 현대 소프트웨어 개발에서 데이터의 중요성을 강조하는 필독서입니다. 저자 마틴 클레프만은 데이터 시스템의 설계와 구현에 대한 깊이 있는 통찰을 제공합니다. 이 책은 데이터베이스, NoSQL 데이터스토어, 스트림 처리 등 다양한 기술의 장단점을 분석하여, 개발자들이 상황에 맞는 최적의 선택을 할 수 있도록 돕습니다.책은 크게 세 부분으로 나뉘어 있으며, 첫 번째 부분에서는 데이터 시스템의 기초를 설명합니다. 신뢰성, 확장성, 유지보수성 등의 개념을 통해 기본적인 데이터 시스템의 설계 원칙을 이해할 수 있습니다. 두 번째 부분에서는 분산 데이터 시스템의 복잡한 문제를 다루며, 복제와 파티셔닝에 대한 깊이 있.. 2025. 4. 15.
바스 하렌슬락 , 율리안 더라위터르, Apache Airflow 기반의 데이터 파이프라인, 제이펍 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다.  Apache Airflow 기반의 데이터 파이프라인은 데이터 엔지니어링, 머신러닝, 그리고 시스템 관리 분야에서 필수적인 도구로 자리 잡고 있습니다. 바스 하렌슬락의 저서 "Apache Airflow 기반의 데이터 파이프라인"은 이 분야에 대한 깊이 있는 통찰을 제공하며, 데이터 파이프라인 구축에 대한 체계적이고 실용적인 접근 방식을 제시합니다. 이 책은 Airflow의 설치부터 시작하여 파이프라인 작성, 테스트, 분석, 백필, 배포 및 관리까지 모든 과정을 포괄적으로 다룹니다. 특히, 데이터 이동 및 변환 자동화 방법에 대한 상세한 설명은 데이터 엔지니어와 데브옵스 엔지니어들에게 큰 도움이 될 것입니다. 또한, 다양한 운영 환경에서의 .. 2025. 2. 28.
조 라이스 , 맷 하우슬리, 견고한 데이터 엔지니어링 - 데이터 파이프라인 설계와 구축의 핵심 원칙, 한빛미디어 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다.  "견고한 데이터 엔지니어링"은 데이터 엔지니어링 분야의 필수적인 지식을 제공하는 책으로, 데이터 환경의 기초부터 고급 개념까지 폭넓게 다루고 있습니다. 이 책은 데이터 엔지니어링 수명 주기의 프레임워크를 통해 데이터를 생성, 수집, 오케스트레이션, 변환, 저장 및 거버넌스하는 방법을 체계적으로 설명합니다. 데이터 엔지니어링의 기본 개념을 이해하고자 하는 분들에게 적합하며, 특히 데이터 과학자, 분석가, 소프트웨어 엔지니어 등 데이터 관련 직종에 종사하는 분들에게 유용한 정보가 가득합니다. 저자인 조 라이스와 맷 하우슬리는 각각 데이터 엔지니어링과 클라우드 전문가로, 이 책을 통해 데이터 엔지니어링의 핵심 원칙과 실무적인 접근 방식을 제시.. 2025. 1. 31.
니시다 케이스케, 빅데이터를 지탱하는 기술 - 시시각각 변하는 데이터를 파악하는 자동화의 세계, 제이펍 #광고 - 링크로 구매 시 글쓴이에게 소정의 수수료가 제공됩니다.  빅데이터의 중요성이 날로 커지고 있는 현대 사회에서, 데이터를 효과적으로 수집하고 처리하는 능력은 기업의 성패를 좌우하는 중요한 요소가 되었습니다. "빅데이터를 지탱하는 기술"은 이러한 필요성을 충족시키기 위해 필수적인 실무적 가이드를 제공합니다. 이 책은 데이터 처리의 시스템화에 중점을 두며, 빅데이터 기술을 배우고자 하는 이들에게 기본적인 데이터 처리 개념을 확실히 다집니다. 이 책은 데이터 처리의 효율성을 높이는 다양한 방법을 소개합니다. '워크플로 관리'와 '스트림 처리'와 같은 데이터 처리 자동화 기술을 통해, 데이터를 보다 효율적으로 관리하고 분석할 수 있는 방법을 제시합니다. 또한, 빅데이터의 확장성 있는 구성에 대해 설명하.. 2025. 1. 30.