데이터 과학 51

문건웅, 의료인을 위한 R 생존분석, 한나래아카데미

"의료인을 위한 R 생존분석"은 생존분석에 대한 이해가 부족한 의료인들을 위해 저자 문건웅이 집필한 실용적인 안내서입니다. 이 책은 생존분석의 기본 개념과 필요한 수학 지식을 간단하고 명확하게 설명하여, 통계적 전문 지식이 없는 의료인들도 쉽게 접근할 수 있도록 돕습니다. 생존분석은 질병, 치료, 사망 등의 시간적 변수를 다루는 중요한 통계적 방법으로, 의학 연구에서 필수적으로 사용됩니다. 그러나 많은 의료인들이 이 개념을 어렵게 느끼는 경우가 많습니다. 저자는 이러한 점을 고려하여, 복잡한 이론보다는 실질적인 분석 수행 능력을 기르는 데 중점을 두었습니다. 책의 구성은 1장에서 생존분석에 필요한 최소한의 수학 지식을 살펴보며 시작합니다. 이후 2장에서는 생존분석의 개념과 용어를 친절하게 설명하고, 3장..

Alan Agresti, 범주형 자료분석 개론 - 제3판, 자유아카데미

"범주형 자료분석 개론"은 Alan Agresti의 저서로, 범주형 자료를 분석하는 기초부터 심화까지 폭넓은 내용을 다루고 있습니다. 이 책은 통계학을 전공하는 학생들뿐만 아니라 비전공자도 쉽게 이해할 수 있도록 구성되어 있어, 통계학의 기초 지식을 쌓고자 하는 이들에게 적합한 교재입니다. 책의 주요 내용은 범주형 반응자료, 분할표, 일반화선형모형, 로지스틱 회귀모형 등 다양한 통계적 기법을 포함하고 있으며, 각 장에서는 이론적 설명과 함께 실제 사례를 통한 적용 방법을 제시합니다. 또한, R 소프트웨어를 활용한 분석 과정을 상세히 담고 있어, 독자가 실습을 통해 직접 데이터를 다룰 수 있는 기회를 제공합니다. 특히, 이번 3판에서는 데이터마이닝 기법을 추가하여 현대 통계학의 흐름을 반영하고 있으며, 베..

박한슬, 숫자 한국 - 오늘의 데이터에서 내일의 대한민국, 사이언스북스

"숫자 한국"은 박한슬 작가가 한국 사회의 현재와 미래를 통계와 데이터를 통해 심층적으로 분석한 데이터 사이언스 에세이입니다. 이 책은 미세 먼지 지수, 노조 조직률, 합계 출산율 등 20개의 핵심 숫자를 통해 대한민국이 직면한 다양한 사회적 문제를 조명합니다. 저자는 통계학을 전공한 약사로서, 사회 연구의 전문성을 바탕으로 독자들에게 숫자의 의미와 맥락을 명확히 전달하고자 합니다. 책은 크게 네 개의 부문으로 나뉘어 있습니다. 첫 번째 부문에서는 인구 변화와 사회적 현상을 다루며, 평균 수명, 가구 소득별 산후 조리 기간 등의 데이터를 통해 한국 사회의 구조적 문제를 진단합니다. 두 번째 부문에서는 인공지능과 경제의 관계를 탐구하며, AI 기술이 노동 시장에 미치는 영향을 수치적으로 분석합니다. 세 번..

바스 하렌슬락 , 율리안 더라위터르, Apache Airflow 기반의 데이터 파이프라인, 제이펍

Apache Airflow 기반의 데이터 파이프라인은 데이터 엔지니어링, 머신러닝, 그리고 시스템 관리 분야에서 필수적인 도구로 자리 잡고 있습니다. 바스 하렌슬락의 저서 "Apache Airflow 기반의 데이터 파이프라인"은 이 분야에 대한 깊이 있는 통찰을 제공하며, 데이터 파이프라인 구축에 대한 체계적이고 실용적인 접근 방식을 제시합니다. 이 책은 Airflow의 설치부터 시작하여 파이프라인 작성, 테스트, 분석, 백필, 배포 및 관리까지 모든 과정을 포괄적으로 다룹니다. 특히, 데이터 이동 및 변환 자동화 방법에 대한 상세한 설명은 데이터 엔지니어와 데브옵스 엔지니어들에게 큰 도움이 될 것입니다. 또한, 다양한 운영 환경에서의 Airflow 구성 방법에 대한 정보는 실제 업무에 즉시 활용할 수 ..

론 코하비 , 다이앤 탕 , 야 쉬, A/B 테스트 - 신뢰할 수 있는 온라인 종합 대조 실험, 에이콘출판

"론 코하비"의 "A/B 테스트"는 온라인 실험을 설계하고 실행하는 데 필요한 신뢰할 수 있는 가이드를 제공합니다. 이 책은 구글, 링크드인, 마이크로소프트 등 세계적인 빅테크 기업에서의 경험을 바탕으로, 실험의 이론적 기초부터 실제 적용 시 발생할 수 있는 다양한 상황에 대한 조언까지 폭넓게 다루고 있습니다. 책의 전반부는 A/B 테스트의 기본 개념과 원리를 설명하며, 실험의 신뢰도를 높이기 위한 다양한 방법론을 소개합니다. 후반부에서는 실제 사례를 통해 실험을 설계하고 분석하는 과정에서 직면할 수 있는 여러 도전 과제를 다루고 있습니다. 특히, 메타버스와 같은 최신 디지털 환경에서의 실험 가능성을 강조하며, 온라인 서비스 기획자, 데이터 과학자, 기업 대표 등 다양한 독자층을 대상으로 유용한 정보를 ..

케이트 스트라치니, 컬러와이즈(ColorWise) - 데이터 시각화와 스토리텔링을 완성하는 현명한 색 사용 가이드, 책만

"컬러와이즈(ColorWise)"는 데이터 시각화와 스토리텔링을 효과적으로 수행하기 위한 색상 활용 방법을 다룬 책으로, 저자 케이트 스트라치니의 깊이 있는 통찰이 담겨 있습니다. 이 책은 데이터 분석가, 비즈니스 분석가, 데이터 과학자 등 데이터와 관련된 다양한 분야의 전문가들에게 매우 유용한 자료가 될 것입니다. 책은 색채 이론과 역사부터 시작하여, 데이터 시각화에서 색이 어떻게 사용되는지를 체계적으로 설명합니다. 색상 휠, 데이터 시각화 예시, 그리고 색깔의 역사와 문화적 의미까지 폭넓은 내용을 포함하고 있어, 독자들은 색의 중요성을 깊이 이해할 수 있습니다. 또한, 색의 심리적 효과와 이를 데이터 시각화에 어떻게 적용할 수 있는지에 대한 팁과 요령도 제공합니다. 특히, 이 책은 단순히 색을 예쁘게..

권정민, 데이터 분석가의 숫자유감, 골든래빗(주)

"데이터 분석가의 숫자유감"은 권정민 작가가 집필한 책으로, 데이터 문해력을 기르기 위한 흥미로운 접근을 제공합니다. 이 책은 데이터 시대에 살아가는 직장인들이 꼭 알아야 할 기본적인 데이터 분석 지식을 만화 형식으로 재미있게 풀어내고 있습니다. 책의 주요 내용은 데이터 오해에 대한 에피소드를 중심으로 구성되어 있으며, 인과관계와 상관관계, A/B 테스트, 평균값 등 다양한 주제를 다룹니다. 이러한 주제들은 데이터 활용이 필수적인 현대 사회에서 직장인들이 꼭 알아야 할 필수 지식으로, 단 2시간의 투자로 업무에 큰 도움이 될 수 있습니다. 만화 형식의 장면들은 다양한 캐릭터들이 대화하는 모습을 통해 독자들에게 이해를 돕고, 지루할 틈 없이 재미있게 읽을 수 있는 요소를 제공합니다. 또한, 책의 하단부에는..

김재희, R을 이용한 통계적 실험설계와 분석 - 제3판, 자유아카데미

"R을 이용한 통계적 실험설계와 분석"은 통계학을 공부하는 학생이나 연구자들에게 필수적인 참고서로, 저자 김재희가 집필하였습니다. 이 책은 기초부터 고급 수준의 실험설계 방법을 다루며, 각 장마다 R 코드를 제공하여 이론과 실습을 동시에 익힐 수 있도록 구성되어 있습니다. 책의 첫 번째 장에서는 실험설계의 기본 개념과 필요성을 설명하고, 이어지는 장에서는 기초 통계 이론과 R을 활용한 확률 계산 방법을 소개합니다. 특히, 실험설계의 핵심인 완전확률화설계와 확률화블록설계, 라틴정방설계 등 다양한 설계 방법을 상세히 다루며, 각 방법에 대한 통계적 분석을 R을 통해 실습할 수 있도록 안내합니다. 이 책의 가장 큰 장점은 각 장마다 연습문제를 통해 독자가 직접 문제를 풀어보며 학습할 수 있는 기회를 제공한다는..

리찌엔 , 하이언, 통계의 아름다움 - 인공지능 시대에 필요한 과학적 사고, 제이펍

『통계의 아름다움』은 리찌엔 저자가 쓴 통계 및 인공지능 분야의 베스트셀러로, 96가지의 흥미로운 통계 이야기를 통해 독자들에게 통계의 매력을 전달합니다. 이 책은 통계학의 고전부터 최신 이론까지 아우르며, 데이터와 수학, 데이터 시각화까지 다양한 주제를 다루고 있습니다. 특히, 중학교 수학 수준의 기초 지식만으로도 접근할 수 있도록 구성되어 있어, 통계에 대한 이해가 부족한 독자들에게도 적합합니다. 이 책의 가장 큰 특징은 각 장마다 재미있고 유익한 사례를 통해 통계학의 다양한 개념을 설명한다는 점입니다. 예를 들어, 통계적 사고와 모델링, 데이터 시각화의 중요성을 다양한 역사적 사건과 일상적인 예시를 통해 쉽고 흥미롭게 풀어냅니다. 또한, QR 코드를 통해 제공되는 그래프와 통계 관련 이미지는 독자들..

Richard L. Scheaffer , William Mendenhall lll , R. Lyman Ott , Kenneth G. Gerow, 표본조사의 이해와 활용 - 7판, 교우사

"표본조사의 이해와 활용"은 통계학의 기초부터 심화까지 아우르는 중요한 자료로, Richard L. Scheaffer를 비롯한 여러 저자들이 집필한 이론서입니다. 이 책은 표본조사의 기본 개념과 설계, 그리고 실제 활용 방법에 대해 깊이 있는 내용을 제공합니다. 통계학을 처음 접하는 학생이나 관련 분야에 종사하는 전문가 모두에게 유용한 지침서가 될 것입니다. 책의 주요 내용은 표본 설계의 기본 요소와 통계 개념을 다루며, 단순 확률 추출법, 증화 확률 추출법, 계통 표집, 집락 추출법 등 다양한 표본 추출 기법을 상세히 설명하고 있습니다. 이러한 기법들은 실제 연구나 조사에서 데이터를 수집하고 분석하는 데 필수적인 요소로, 이론뿐 아니라 실용적인 측면에서도 큰 도움이 될 것입니다. 404쪽에 걸쳐 구성된..