데이터 과학/통계학, 머신러닝

전치혁 , 이혜선 , 이영록 , 이종석, 데이터마이닝의 원리와 구현: R과 함께, 자유아카데미

booksworld 2025. 3. 25. 01:00

 

 

 

"데이터마이닝의 원리와 구현: R과 함께"는 데이터마이닝의 기초부터 고급 개념까지 폭넓게 다루는 전문서입니다. 저자 전치혁을 비롯한 여러 전문가들이 함께 집필하여, 이론과 실습을 동시에 경험할 수 있는 구조로 구성되었습니다. 이 책은 데이터마이닝의 다양한 기법을 체계적으로 정리하고 있으며, 각 기법에 대한 알고리즘 원리를 상세히 설명합니다.

책의 특징 중 하나는 실제 예제를 풍부하게 포함하고 있다는 점입니다. 각 기법을 소개한 후에는 데이터 예제를 통해 독자들이 쉽게 이해할 수 있도록 돕고 있습니다. 또한, R 코드가 삽입되어 있어 독자들이 직접 기법을 구현하고 결과를 확인할 수 있는 기회를 제공합니다. 이러한 접근 방식은 이론적 학습만으로는 부족한 실무 능력을 향상시키는 데 큰 도움이 될 것입니다.

책의 내용은 예측, 분류, 군집, 연관규칙 등 데이터마이닝의 주요 분야를 포괄합니다. 회귀분석, 로지스틱 회귀분석, 서포트 벡터 머신, 랜덤 포레스트와 같은 기법을 통해 데이터 분석의 다양한 측면을 탐구할 수 있습니다. 특히, 추천 시스템과 같은 실용적인 응용 사례를 다루어 실제 비즈니스에서의 데이터 활용 방법도 제시합니다.

이 책은 데이터마이닝에 대한 깊이 있는 이해를 원하거나, R을 활용한 데이터 분석 기술을 배우고자 하는 독자들에게 적합합니다. 또한, Python 사용자들을 위한 별도의 코드 제공으로 다양한 프로그래밍 언어를 사용하는 독자들이 접근할 수 있도록 배려하고 있습니다.

"데이터마이닝의 원리와 구현: R과 함께"는 데이터 과학의 기초를 다지고 싶은 학생, 연구자, 그리고 현업에서 데이터 분석을 수행하는 전문가들에게 유용한 참고서가 될 것입니다. 데이터마이닝의 기법을 이해하고 직접 구현해보며 실력을 쌓고 싶은 분들에게 강력히 추천합니다.

 

 

 

목차


1장 데이터마이닝 개요와 활용
1.1 데이터마이닝의 정의
1.2 데이터마이닝의 기능과 기법
1.3 데이터마이닝의 활용 분야

2장 회귀분석
2.1 다중회귀모형
2.2 회귀계수의 추정
2.3 모형에 대한 추론
2.4 변수선택방법
2.5 회귀모형의 진단
2.6 반응치에 대한 추정 및 예측
2.7 다중공선성
2.8 지시변수와 회귀모형
R 코드
참고문헌
연습문제

3장 규제 회귀분석
3.1 라소(LASSO) 회귀분석
3.2 릿지(Ridge) 회귀분석
3.3 라소와 릿지 회귀의 비교
R 코드
참고문헌
연습문제

4장 차원축소 회귀분석
4.1 변수의 변동과 제곱합
4.2 주성분의 이해
4.3 행렬의 분해
4.4 주성분 스코어
4.5 주성분의 제곱합 분해
4.6 NIPALS 알고리즘
4.7 주성분 회귀분석
4.8 PLS 회귀분석의 개요
4.9 하나의 종속변수에 대한 PLS 회귀분석
4.10 다수의 종속변수에 대한 PLS 회귀분석
4.11 예측성능 평가
R 코드
참고문헌
연습문제

5장 분류분석 개요
5.1 분류 문제 및 분류기법
5.2 기본적인 분류기법
5.3 분류의 성능평가
5.4 ROC 곡선
5.5 이익도표
R 코드
참고문헌
연습문제

6장 로지스틱 회귀분석
6.1 이분 로지스틱 회귀모형
6.2 명목 로지스틱 회귀모형
6.3 서열 로지스틱 회귀모형
부록 6.1 정규분포 모수에 대한 최우추정법
부록 6.2 최우추정치에 대한 표준오차
R 코드
참고문헌
연습문제

7장 판별분석
7.1 피셔 방법
7.2 의사결정론에 의한 분류규칙
7.3 오분류비용을 고려한 분류규칙
7.4 이차 판별분석
7.5 세 범주 이상의 분류
R 코드 27
참고문헌
연습문제

8장 트리 기반 기법
8.1 CART 개요
8.2 트리의 형성
8.3 가지치기 및 최적트리 선정
8.4 기타 트리 기법
R 코드
참고문헌
연습문제

9장 서포트 벡터 머신
9.1 선형 SVM - 분리 가능의 경우
9.2 선형 SVM - 분리 불가능 경우
9.3 비선형 SVM
부록 9.1 비선형계획 문제
R 코드
참고문헌
연습문제

10장 앙상블 기법
10.1 앙상블의 개요
10.2 부트스트래핑
10.3 랜덤 포레스트
10.4 아다부스트
10.5 그래디언트 부스팅
R 코드
참고문헌
연습문제

11장 군집분석 개요
11.1 군집방법
11.2 객체 간의 유사성 척도
11.3 범주형 속성을 포함한 객체의 유사성 척도
R 코드
참고문헌
연습문제

12장 계층적 군집 방법
12.1 군집 간 거리척도 및 연결법
12.2 연결법의 군집 알고리즘
12.3 워드 방법
12.4 분리적 방법 - 다이아나
12.5 군집 수의 결정
R 코드
참고문헌
연습문제

13장 비계층적 군집 방법
13.1 K-means 알고리즘
13.2 K-medoids 군집 방법
13.3 퍼지 K-means 알고리즘
13.4 모형기반 군집 방법
13.5 밀도기반 군집 방법 - 디비스캔(DBSCAN)
R 코드
참고문헌
연습문제

14장 군집해의 평가 및 해석
14.1 군집해의 평가
14.2 군집해의 해석
R 코드
참고문헌
연습문제

15장 연관규칙
15.1 연관규칙의 개요
15.2 연관규칙의 정의 및 성능척도
15.3 연관규칙의 탐색
15.4 순차적 패턴의 탐색
15.5 항목의 선정
R 코드
참고문헌
연습문제

16장 추천시스템
16.1 내용기반 추천시스템
16.2 협업 필터링
16.3 시장바구니 데이터를 이용한 협업 필터링
R 코드
참고문헌
연습문제

 

 

 

- 교보문고: https://bitl.bz/uZduRC

- 쿠팡: https://bitl.bz/2IUNTU

- Yes24: https://bitl.bz/LKgphJ