"Do it! 쉽게 배우는 R 데이터 분석"은 데이터 분석을 처음 접하는 이들에게 최적화된 입문서입니다. 이 책은 통계나 프로그래밍에 대한 배경 지식이 없어도 R을 통해 데이터 분석을 시작할 수 있도록 돕습니다. 책은 R의 설치부터 시작하여 데이터 정제, 가공, 분석, 그리고 시각화까지의 전 과정을 체계적으로 안내합니다. 특히, 다양한 실습 예제와 함께 최신 R 패키지를 활용한 실습을 통해 독자들이 직접 손으로 익히며 배울 수 있도록 구성되어 있습니다.
이 책의 가장 큰 장점은 초보자도 쉽게 따라할 수 있는 실습 중심의 접근 방식입니다. 실제 데이터 분석 프로젝트를 수행하는 것처럼 단계별로 진행되며, 각 단계마다 실습을 통해 이해도를 높입니다. 또한, 책 말미에는 공공데이터를 활용한 실제 프로젝트를 통해 자신만의 데이터 분석을 완성할 수 있도록 독려합니다. 이는 독자들이 실무에서 바로 활용할 수 있는 실질적인 경험을 쌓는 데 큰 도움을 줍니다.
저자 김영우는 데이터 분석 분야에서 풍부한 경험을 가지고 있으며, 그의 노하우가 책 곳곳에 녹아 있습니다. 그는 다양한 분야의 데이터를 다루며 얻은 인사이트를 바탕으로, 독자들이 R을 효율적으로 활용할 수 있도록 최신의 인기 패키지를 소개하고, 그 활용법을 자세히 설명합니다. 이러한 접근은 R을 처음 접하는 사람들뿐만 아니라 중급자에게도 유용한 정보를 제공합니다.
"Do it! 쉽게 배우는 R 데이터 분석"은 R을 처음 배우는 독자에게 꼭 필요한 책입니다. 데이터 분석의 기초를 탄탄히 다지고, 실무에서 바로 활용할 수 있는 능력을 키우고자 하는 분들에게 강력히 추천합니다. 이 책을 통해 데이터 분석의 첫걸음을 순탄하게 내딛어 보세요.
목차
첫째마당 R이랑 친해지기
01 안녕, R?
01-1 R이 뭔가요? - R 이해하기
01-2 R이 강력한 이유
02 R 데이터 분석 환경 만들기
02-1 R과 R 스튜디오 설치하기
02-2 R 스튜디오와 친숙해지기
02-3 프로젝트 만들기
02-4 유용한 환경 설정
03 데이터 분석을 위한 연장 챙기기
03-1 변하는 수, ‘변수’ 이해하기
03-2 마술 상자 같은 ‘함수’ 이해하기
03-3 함수 꾸러미, ‘패키지’ 이해하기
둘째마당 본격 실습! 데이터 갖고 놀기
04 데이터 프레임의 세계로!
04-1 데이터는 어떻게 생겼나? - 데이터 프레임 이해하기
04-2 데이터 프레임 만들기 - 시험 성적 데이터를 만들어 보자!
04-3 외부 데이터 이용하기 - 축적된 시험 성적 데이터를 불러오자!
[정리하기]
05 데이터 분석 기초! - 데이터 파악하기, 다루기 쉽게 수정하기
05-1 데이터 파악하기
05-2 변수명 바꾸기
05-3 파생변수 만들기
[정리하기]
[분석 도전!]
06 자유자재로 데이터 가공하기
06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기
06-2 조건에 맞는 데이터만 추출하기
06-3 필요한 변수만 추출하기
06-4 순서대로 정렬하기
06-5 파생변수 추가하기
06-6 집단별로 요약하기
06-7 데이터 합치기
[정리하기]
[분석 도전!]
07 데이터 정제 - 빠진 데이터, 이상한 데이터 제거하기
07-1 빠진 데이터를 찾아라! - 결측치 정제하기
07-2 이상한 데이터를 찾아라! - 이상치 정제하기
[정리하기]
08 그래프 만들기
08-1 R로 만들 수 있는 그래프 살펴보기
08-2 산점도 - 변수 간 관계 표현하기
08-3 막대 그래프 - 집단 간 차이 표현하기
08-4 선 그래프 - 시간에 따라 달라지는 데이터 표현하기
08-5 상자 그림 - 집단 간 분포 차이 표현하기
[정리하기]
[꿀팁 01] 초보자가 자주 하는 실수
[꿀팁 02] 에러 메시지 이해하기
셋째마당 실전! 데이터 분석 프로젝트
09 데이터 분석 프로젝트 - ‘한국인의 삶을 파악하라!’
09-1 ‘한국복지패널데이터’ 분석 준비하기
09-2 성별에 따른 월급 차이 - “성별에 따라 월급이 다를까?”
09-3 나이와 월급의 관계 - “몇 살 때 월급을 가장 많이 받을까?”
09-4 연령대에 따른 월급 차이 - “어떤 연령대의 월급이 가장 많을까?”
09-5 연령대 및 성별 월급 차이 - “성별 월급 차이는 연령대별로 다를까?”
09-6 직업별 월급 차이 - “어떤 직업이 월급을 가장 많이 받을까?”
09-7 성별 직업 빈도 - “성별로 어떤 직업이 가장 많을까?”
09-8 종교 유무에 따른 이혼율 - “종교가 있는 사람들이 이혼을 덜 할까?”
09-9 지역별 연령대 비율 - “노년층이 많은 지역은 어디일까?”
넷째마당 R로 하는 다양한 데이터 분석의 세계
10 텍스트 마이닝
10-1 힙합 가사 텍스트 마이닝
10-2 국정원 트윗 텍스트 마이닝
11 지도 시각화
11-1 미국 주별 강력 범죄율 단계 구분도 만들기
11-2 대한민국 시도별 인구, 결핵 환자 수 단계 구분도 만들기
12 인터랙티브 그래프
12-1 plotly 패키지로 인터랙티브 그래프 만들기
12-2 dygraphs 패키지로 인터랙티브 시계열 그래프 만들기
13 통계 분석 기법을 이용한 가설 검정
13-1 통계적 가설 검정이란?
13-2 t 검정 - 두 집단의 평균 비교
13-3 상관분석 - 두 변수의 관계성 분석
14 R Markdown으로 데이터 분석 보고서 만들기
14-1 신뢰할 수 있는 데이터 분석 보고서 만들기
14-2 R 마크다운 문서 만들기
15 R 내장 함수, 변수 타입과 데이터 구조
15-1 R 내장 함수로 데이터 추출하기
15-2 변수 타입
15-3 데이터 구조
[정리하기]
16 데이터 분석 기술을 효율적으로 익히는 방법
15-1 집중할 방향 정하기
15-2 데이터 분석 기술을 효율적으로 익히는 방법
15-3 오픈 소스 생태계와 어울리기
정답
찾아보기
- 교보문고: https://bitl.bz/o0NAnN
- Yes24: https://bitl.bz/OohVov
'데이터 과학 > 데이터 과학을 위한 코딩' 카테고리의 다른 글
김철민, Do it! 공공데이터로 배우는 R 데이터 분석 with 샤이니, 이지스퍼블리싱 (2) | 2025.02.09 |
---|---|
김영우, Do it! 쉽게 배우는 R 텍스트 마이닝, 이지스퍼블리싱 (2) | 2025.02.08 |
김영우, Do it! 쉽게 배우는 파이썬 데이터 분석, 이지스퍼블리싱 (2) | 2025.02.07 |
보구밀 카민스키, 데이터 분석을 위한 줄리아 - 시계열 데이터, 예측 모델, 랭킹 등 핸즈온 프로젝트로 마스터하는 줄리아 데이터 분석, 제이펍 (2) | 2025.01.28 |
마이클 크롤리, The R Book - 2nd Edition, 에이콘출판 (2) | 2025.01.26 |