데이터 과학/통계학, 머신러닝

개러스 제임스 , 다니엘라 위튼 , 트레버 헤이스티 , 로버트 팁시라니 , 조너선 테일러, 기초부터 다지는 통계학 교과서 with 파이썬, 인사이트

booksworld 2025. 1. 10. 20:01

 

 

'기초부터 다지는 통계학 교과서 with 파이썬'은 통계학의 기초부터 고급 주제까지 폭넓게 다루며, 파이썬을 활용한 실습을 통해 이론과 실무를 연결하는 완벽한 가이드입니다. 이 책은 통계적 학습의 기본 개념에서부터 시작하여 선형회귀, 분류, 재표집법, 선형모형 선택과 규제, 비선형모형, 나무 기반의 방법, 서포트 벡터 머신, 딥러닝, 생존분석, 비지도학습, 다중검정까지 다양한 주제를 체계적으로 설명합니다.

 

각 장은 이론적인 설명과 함께 파이썬을 활용한 실습을 포함하고 있어 독자가 직접 코드를 작성하고 결과를 확인하면서 학습할 수 있도록 구성되어 있습니다. 특히, 통계적 모형의 정확도 평가, 교차검증, 부트스트랩과 같은 실용적인 기법을 다루며, 실제 데이터를 분석하는 능력을 키울 수 있도록 돕습니다.

 

선형회귀와 K-최근접이웃의 비교, 로지스틱 회귀와 일반화선형모형, 배깅, 랜덤 포레스트, 부스팅 등의 다양한 기법을 비교 분석하며, 각 방법의 장단점을 명확히 이해할 수 있도록 설명합니다. 또한, 딥러닝의 기초부터 합성곱 신경망, 순환 신경망까지 심도 깊게 탐구하며, 최신 기술 트렌드도 놓치지 않습니다.

 

생존분석과 중도절단자료, 비지도학습, 다중검정 등의 고급 주제는 연구자나 데이터 과학자들에게 특히 유용할 것입니다. 각 장의 끝에는 연습문제가 포함되어 있어, 배운 내용을 복습하고 자신의 이해도를 점검할 수 있습니다.

 

이 책은 통계학을 처음 접하는 학생부터 실무에서 통계분석을 필요로 하는 전문가까지 모두에게 유익한 자료가 될 것입니다. 통계학의 기본을 다지고, 파이썬을 통해 실습하며, 이론과 실무를 아우르는 통계학의 세계로 안내합니다.

 

 

 

목차

1장 도입

 

2장 통계적 학습

2.1 통계적 학습이란 무엇인가?

2.2 모형의 정확도 평가

2.3 실습: 파이썬 기초

2.4 연습문제

 

3장 선형회귀

3.1 단순선형회귀

3.2 다중선형회귀

3.3 회귀모형에서 생각할 다른 문제들

3.4 마케팅 계획

3.5 선형회귀와 K-최근접이웃의 비교

3.6 실습: 선형회귀

3.7 연습문제

 

4장 분류

4.1 분류의 개요

4.2 왜 선형회귀를 사용하지 않는가

4.3 로지스틱 회귀

4.4 생성모형을 이용한 분류

4.5 분류 방법 비교

4.6 일반화선형모형

4.7 실습: 로지스틱 회귀, LDA, QDA, KNN

4.8 연습문제

 

5장 재표집법

5.1 교차검증

5.2 부트스트랩

5.3 실습: 교차검증과 부트스트랩

5.4 연습문제

 

6장 선형모형선택과 규제

6.1 부분집합선택

6.2 축소 방법

6.3 차원축소법

6.4 고차원에서 생각할 점

6.5 실습: 선형모형과 규제 방법들

6.6 연습문제

 

7장 선형을 넘어서

7.1 다항회귀

7.2 계단함수

7.3 기저함수

7.4 회귀 스플라인

7.5 평활 스플라인

7.6 국소회귀

7.7 일반화가법모형

7.8 실습: 비선형모형

7.9 연습문제

 

8장 나무-기반의 방법

8.1 의사결정나무의 기초

8.2 배깅, 랜덤 포레스트, 부스팅 및 베이즈 가법회귀나무

8.3 실습: 나무-기반의 방법

8.4 연습문제

 

9장 서포트 벡터 머신

9.1 최대 마진 분류기

9.2 서포트 벡터 분류기

9.3 서포트 벡터 머신

9.4 2개 이상의 부류가 있는 SVM

9.5 로지스틱 회귀와의 관련성

9.6 실습: 서포트 벡터 머신

9.7 연습문제

 

10장 딥러닝

10.1 단층 신경망

10.2 다층 신경망

10.3 합성곱 신경망

10.4 문서 분류

10.5 순환 신경망

10.6 딥러닝을 사용할 때

10.7 신경망 적합

10.8 보간과 이중 하강

10.9 실습: 딥러닝

10.10 연습문제

 

11장 생존분석과 중도절단자료

11.1 생존시간과 중도절단시간

11.2 중도절단 좀 더 자세히 살펴보기

11.3 카플란-마이어 생존곡선

11.4 로그 순위검정

11.5 생존분석 회귀모형

11.6 콕스 모형을 위한 축소

11.7 추가 주제

11.8 실습: 생존분석

11.9 연습문제

 

12장 비지도학습

12.1 비지도학습의 도전

12.2 주성분분석

12.3 결측값 및 행렬 완성

12.4 군집화 방법

12.5 실습: 비지도학습

12.6 연습문제

 

13장 다중검정

13.1 가설검정에 대한 간략한 재검토

13.2 다중검정의 어려움

13.3 집단별 오류율

13.4 거짓발견율

13.5 재표집법을 통한 p-값과 거짓발견율

13.6 실습: 다중검정

13.7 연습문제