이 책은 베이즈 방법론의 기초부터 고급 응용까지 폭넓게 다루며, 학부생, 대학원생, 연구자 모두에게 유용한 가이드를 제공합니다.
베이즈 데이터 분석의 교과서
이 책은 국제 베이즈 분석 학회(ISBA)에서 2016년 De Groot Prize를 수상하며 그 가치를 인정받았습니다. 저자인 앤드루 겔만(Andrew Gelman)과 그의 공동 저자들은 데이터 분석적 관점에서 개념을 쉽게 설명하며, 실용적인 접근 방식을 강조합니다. 이론적인 내용뿐만 아니라 다양한 실제 데이터 분석 사례를 제공하여 독자들이 실무에 적용할 수 있도록 돕습니다.
제3판의 주요 특징
이번 개정판에서는 최신 베이즈 기법과 컴퓨팅 방법이 추가되었습니다. 특히 다음과 같은 내용이 새롭게 포함되었습니다.
- 비모수 모델링을 다룬 4개의 신규 챕터
- **약정보 사전 분포(Weakly informative priors)**와 경계 회피 사전 분포(Boundary-avoiding priors) 설명 추가
- 교차 검증 및 예측 정보 기준에 대한 논의 강화
- 해밀턴 몬테카를로(Hamiltonian Monte Carlo), 변분 베이즈(Variational Bayes), 기댓값 전파(Expectation Propagation) 기법 소개
- 개선된 수렴 모니터링 및 반복 시뮬레이션 샘플 크기 계산 방법
독자를 위한 맞춤형 구성
이 책은 독자의 수준과 관심사에 따라 다르게 활용될 수 있습니다.
- 학부생: 베이즈 추론의 기초 개념 학습
- 대학원생: 베이즈 모델링과 컴퓨팅 기법 익히기
- 연구자: 실무에 적용 가능한 다양한 베이즈 분석 방법 활용
또한, 책의 웹사이트에서 예제 데이터와 연습문제 해답, 소프트웨어 코드 등을 추가로 제공하여 학습을 더욱 효과적으로 할 수 있도록 지원합니다.
베이즈 분석을 배우고 싶은가?
베이즈 통계는 점점 더 많은 분야에서 활용되며, 데이터 과학, 머신러닝, 의학, 경제학 등 다양한 영역에서 강력한 도구로 자리 잡고 있습니다. 『베이즈 데이터 분석(제3판)』은 이러한 흐름 속에서 베이즈 방법론을 깊이 있게 배우고 싶은 이들에게 필수적인 참고서가 될 것입니다. 베이즈 통계를 이해하고 실전에서 활용하고 싶다면, 이 책을 추천합니다.
목차
1부: 베이즈 추론의 기초
제1장: 확률과 추론
1.1 베이즈 데이터 분석의 세 단계
1.2 통계적 추론의 일반적 표기법
1.3 베이즈 추론
1.4 이산 확률 예: 유전학과 철자 검사
1.5 불확실성의 척도로서의 확률
1.6 확률 할당 예: 축구 포인트 스프레드
1.7 예: 기록 연결의 정확도 추정
1.8 확률론의 몇 가지 유용한 결과들
1.9 계산 및 소프트웨어
1.10 응용 통계에서의 베이즈 추론
1.11 참고문헌
1.12 연습문제
제2장: 단일 모수 모델
2.1 이항 데이터로부터 확률 추정
2.2 데이터와 사전 정보로 사후분포 도출
2.3 사후 추론의 요약
2.4 정보적 사전 분포
2.5 모분산이 알려진 경우 정규 평균의 추정
2.6 기타 표준 단일 모수 모델
2.7 예: 암 발병률에 대한 정보적 사전 분포
2.8 무정보 사전 분포
2.9 약정보 사전 분포
2.10 참고문헌
2.11 연습문제
제3장: 다중모수 모델 소개
3.1 '장애모수'의 평균화
3.2 무정보적 사전 분포의 정규 데이터
3.3 켤레 사전 분포와 정규 데이터
3.4 범주형 데이터의 다항 모델
3.5 알려진 변수를 포함한 다변수 정규 모델
3.6 미지 평균 및 분산과 다변수 정규 모델
3.7 예: 생물 검정 실험 분석
3.8 기초 모델링과 계산 요약
3.9 참고문헌
3.10 연습문제
제4장: 점근성과 비베이즈 접근과의 관련성
4.1 사후 분포의 정규 근사
4.2 대표본 이론
4.3 정리의 반례
4.4 베이즈 추론의 빈도 평가
4.5 다른 통계적 방법들의 베이즈 해석
4.6 참고문헌
4.7 연습문제
제5장: 계층 모델
5.1 모수화된 사전분포 구성하기
5.2 교환가능성과 계층 모델 설정
5.3 켤레 계층 모델의 완전 베이즈 해석
5.4 정규 모델에서 교환가능한 모수의 추정
5.5 예제: 8개 학교의 병렬적 실험
5.6 메타 분석에 적용된 계층 모델
5.7 계층 분산 모수에 대한 약정보적 사전 분포
5.8 참고문헌
5.9 연습문제
2부: 베이즈 데이터 분석의 기초
제6장: 모델 점검
6.1 응용 베이즈 통계에서 모델 점검의 위치
6.2 모델로부터의 추론이 합리적일까?
6.3 사후예측 점검
6.4 그래프 사후예측 점검
6.5 교육 시험 예제에서의 모델 점검
6.6 참고문헌
6.7 연습문제
제7장: 모델의 평가, 비교, 확장
7.1 예측 정확도의 척도
7.2 정보 기준과 교차검정
7.3 예측 성능에 기반한 모델 비교
7.4 베이즈 인자를 이용한 모델 비교
7.5 연속적 모델 확장
7.6 내재적 가정과 모델 확장: 예제
7.7 참고문헌
7.8 연습문제
제8장: 데이터 수집 방법을 고려한 모델링
8.1 데이터 분석을 위한 모델이 필요한 베이즈 추론
8.2 데이터 수집 모델과 무시가능성
8.3 표본 조사
8.4 실험계획
8.5 랜덤화의 역할과 민감도
8.6 관측연구
8.7 검열과 절단
8.8 논의
8.9 참고문헌
8.10 연습문제
제9장: 결정 분석
9.1 서로 다른 맥락에서의 베이즈 결정 이론
9.2 회귀예측 이용하기: 전화 설문조사의 인센티브
9.3 다단계 의사 결정: 의료 검진
9.4 라돈 측정의 계층적 데이터 분석
9.5 개인 vs. 집단의 데이터 분석
9.6 참고문헌
9.7 연습문제
3부: 계산의 심화
제10장: 베이즈 계산 소개
10.1 수치 적분
10.2 분포 근사
10.3 직접적 시뮬레이션과 불합격 추출법
10.4 중요도 추출법
10.5 얼마나 많은 추출이 필요한가?
10.6 계산 환경
10.7 베이즈 계산 디버깅
10.8 참고문헌
10.9 연습문제
제11장: 마코브 체인 시뮬레이션의 기본
11.1 깁스 추출
11.2 메트로폴리스와 메트로폴리스 헤이스팅스 알고리즘
11.3 깁스와 메트로폴리스를 기초 블록으로 이용하기
11.4 수렴성 추론과 평가
11.5 시뮬레이션 추출과 유효숫자
11.6 예제: 계층적 정규 모델
11.7 참고문헌
11.8 연습문제
제12장: 계산효율적인 마코브 체인 시뮬레이션
12.1 효율적인 깁스 추출법
12.2 효율적인 메트로폴리스 점핑(jumping) 규칙
12.3 깁스와 메트로폴리스의 추가 확장
12.4 헤밀토니언 몬테 카를로
12.5 단순 계층 모델을 위한 헤밀토니안 동역학
12.6 Stan: 계산환경 개발하기
12.7 참고문헌
12.8 연습문제
제13장: 최빈과 분포적 근사
13.1 사후분포 최빈값 찾기
13.2 최빈요약을 위한 경계 회피 사전분포
13.3 정규 관련 혼합 근사
13.4 EM을 이용한 주변부 사후분포 찾기
13.5 조건부와 주변부 사후 밀도함수 근사
13.6 예제: 계층적 정규 모델(continued)
13.7 변분 추론
13.8 기댓값 전파
13.9 다른 근사
13.10 미지의 정규 인자
13.11 참고문헌
13.12 연습문제
4부: 회귀 모델
제14장: 회귀 모델 소개
14.1 조건적 모델링
14.2 고전 회귀 모델의 베이즈 분석
14.3 인과적 추론을 위한 베이즈 분석
14.4 회귀 분석의 목표
14.5 설명변수 행렬 모으기
14.6 다중 예측을 위한 정규화 및 차원 축소
14.7 동일하지 않은 분산과 상관계수
14.8 수치적 사전정보 포함하기
14.9 참고문헌
14.10 연습문제
제15장: 계층적 선형모델
15.1 묶음 형태로 교환 가능한 회귀계수
15.2 예제: 미국 대통령 선거 예측
15.3 추가 데이터로서의 정규 사전분포 해석
15.4 달라지는 절편과 기울기
15.5 계산: 배치과 변환
15.6 분산분석과 계수의 배치화
15.7 배치 분산 성분을 위한 계층 모델
15.8 참고문헌
15.9 연습문제
제16장: 일반화 선형모델
16.1 표준적 일반화 선형 모델의 가능도
16.2 일반화 선형 모델을 사용하는 법
16.3 로지스틱 회귀를 위한 약정보적 사전 분포
16.4 예제: 경찰 정지 검문을 위한 계층 포아송 회귀
16.5 예제: 정치적 의견을 위한 계층적 로지스틱 회귀
16.6 다변량 및 다항 응답을 위한 모델
16.7 다변량 이산 데이터를 위한 로그선형 모델
16.8 참고문헌
16.9 연습문제
제17장: 강건한 추론을 위한 모델
17.1 강건성의 측면
17.2 과대산포 표준 확률 모델
17.3 8개 학교의 강건 추론과 민감도 분석
17.5 t-분포 오차를 이용한 강건 회귀
17.6 참고문헌
17.7 연습문제
제18장: 결측 데이터(missing data)를 위한 모델
18.1 표기
18.2 불완전한 데이터를 가정한 시뮬레이션
18.3 다변수 정규 및 t 모델에서의 결측 데이터
18.4 예제: 일련의 여론조사에 대한 multiple imputation
18.5 세어진 데이터의 결측값
18.6 예제: 슬로베니아 여론 조사
18.7 참고문헌
18.8 연습문제
5부: 비선형 및 비모수 모델
제19장: 모수 비선형 모델
19.1 예: 연속 희석 분석
19.2 예: 인구 독성동태학
19.3 참고문헌
19.4 연습문제
제20장: 기저 함수 모델
20.1 기저 함수의 스플라인 및 가중 합계
20.2 기저 선택과 계수의 수축
20.3 비정규 모델과 다변수 회귀 표면
20.4 참고문헌
20.5 연습문제
제21장: 가우스 과정 모델
21.1 가우스 과정 회귀
21.2 예: 생일과 생년월일 자료
21.3 잠재 가우스 과정 모델
21.4 함수형 자료 분석 (functional data analysis)
21.5 확률밀도 추정 및 회귀
21.6 참고문헌
21.7 연습문제
제22장: 유한 혼합 모델
22.1 혼합 모델 설정 및 해석
22.2 예제: 반응 시간과 정신 분열증
22.3 라벨 스위칭과 사후 분포 계산
22.4 불특정 개수의 혼합성분
22.5 분류와 회귀를 위한 혼합 모델
22.6 참고문헌
22.7 연습문제
제23장: 디리클레 과정 모델
23.1 베이즈 히스토그램
23.2 디리클레 과정 사전 분포
23.3 디리클레 과정 혼합 모델 (Dirichlet process mixtures)
23.4 밀도 추정 그 이후 (beyond density estimation)
23.5 계층적 의존성
23.6 확률 밀도 회귀 모델
23.7 참고문헌
23.8 연습문제
부록
부록 A: 표준적 확률 분포들
A.1 연속 분포
A.2 이산 분포
A.3 참고문헌
부록 B: 극한정리의 증명 개요
B.1 참고문헌
부록 C: R과 Stan을 통한 계산
C.1 R과 Stan 시작하기
C.2 Stan으로 계층 모델 적합시키기
C.3 R을 통한 시뮬레이션, 깁스, 그리고 메트로폴리스 알고리즘
C.4 R로 해밀토니언 몬테 카를로 프로그래밍하기
C.5 계산에 대한 추가 코멘트
C.6 참고문헌
- 북큐브: https://www.bookcube.com/detail.asp?series_num=920017346
'데이터 과학 > 통계학, 머신러닝' 카테고리의 다른 글
이안 굿펠로 , 요슈아 벤지오 , 에런 쿠빌, 심층 학습, 제이펍 (0) | 2025.02.13 |
---|---|
샤이 코헨, 베이지안으로 접근하는 자연어 처리, 에이콘출판 (0) | 2025.02.12 |
이기재 , 이재용, 베이즈 데이터 분석, 한국방송통신대학교출판문화사 (0) | 2025.02.10 |
Ali S. Hadi , Samprit Chatterjee, Chatterjee 예제를 통한 회귀분석: R 활용, 자유아카데미 (0) | 2025.01.25 |
Rovert V. Hogg, 수리통계학 개론 - 8판, Pearson (1) | 2025.01.24 |