《Do it! 쉽게 배우는 파이썬 데이터 분석》은 데이터 분석의 기초부터 실전까지 아우르는 포괄적인 입문서입니다. 이 책은 데이터 분석 분야의 베스트셀러 저자인 김영우 선생님의 강의를 바탕으로 작성되어, 통계나 프로그래밍에 대한 사전 지식이 없어도 누구나 쉽게 파이썬 데이터 분석을 시작할 수 있도록 돕습니다.
파이썬은 인공지능과 빅데이터 분야에서 가장 널리 사용되는 프로그래밍 언어로, 데이터 정제, 가공, 분석을 위한 강력한 도구입니다. 이 책에서는 파이썬의 기초 문법부터 데이터 프레임, 텍스트 마이닝, 지도 시각화, 인터랙티브 그래프 등 다양한 데이터 분석 기법을 다룹니다. 특히, 실제 현업에서 데이터 분석 프로젝트를 수행하는 것과 같은 과정을 직접 실습해볼 수 있어서, 이론과 실무를 동시에 익힐 수 있습니다.
책은 초보자도 쉽게 따라할 수 있는 실습 중심으로 구성되어 있으며, 각 장마다 [혼자서 해보기] 퀴즈와 [분석 도전!] 코너를 통해 학습한 내용을 복습하고 심화할 수 있습니다. 또한, 책의 마지막에는 공공 데이터를 활용한 데이터 분석 프로젝트를 완성할 수 있는 기회가 주어져, 실질적인 데이터 분석 역량을 강화할 수 있습니다.
김영우 저자는 데이터 분석가로서 다양한 조직의 프로젝트를 진행하며 쌓은 경험을 바탕으로, 데이터 분석의 중요성과 재미를 독자에게 전달합니다. 이 책을 통해 데이터 분석에 대한 자신감을 얻고, 파이썬을 활용한 데이터 분석 전문가로 성장할 수 있는 기회를 잡아보세요. 데이터 분석 분야로의 취업이나 전환을 준비하는 분들에게도 이 책은 훌륭한 길잡이가 될 것입니다.
목차
_첫째마당 | 파이썬이랑 친해지기
__01 안녕, 파이썬?
01-1 데이터 분석과 파이썬
01-2 파이썬이 강력한 데이터 분석 도구인 이유
__02 파이썬 데이터 분석 환경 만들기
02-1 아나콘다로 파이썬과 JupyterLab 설치하기
02-2 JupyterLab과 친해지기
02-3 유용한 환경 설정
__03 데이터 분석에 필요한 연장 챙기기
03-1 변하는 수, ‘변수’ 이해하기
03-2 파이썬이 강력한 데이터 분석 도구인 이유
03-3 함수 꾸러미, ‘패키지’ 이해하기
_둘째마당 | 본격 실습! 데이터 갖고 놀기
__04 데이터 프레임의 세계로!
04-1 데이터는 어떻게 생겼나? - 데이터 프레임 이해하기
04-2 데이터 프레임 만들기 - 시험 성적 데이터를 만들어 보자!
04-3 외부 데이터 이용하기 - 축적된 시험 성적 데이터를 불러오자!
__05 데이터 분석 기초! - 데이터 파악하기, 다루기 쉽게 수정하기
05-1 데이터 파악하기
05-2 변수명 바꾸기
05-3 파생변수 만들기
__06 자유자재로 데이터 가공하기
06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기
06-2 조건에 맞는 데이터만 추출하기
06-3 필요한 변수만 추출하기
06-4 순서대로 정렬하기
06-5 파생변수 추가하기
06-6 집단별로 요약하기
06-7 데이터 합치기
__07 데이터 정제 - 빠진 데이터, 이상한 데이터 제거하기
07-1 빠진 데이터를 찾아라! - 결측치 정제하기
07-2 이상한 데이터를 찾아라! - 이상치 정제하기
__08 그래프 만들기
08-1 파이썬으로 만들 수 있는 그래프 살펴보기
08-2 산점도 - 변수 간 관계 표현하기
08-3 막대 그래프 - 집단 간 차이 표현하기
08-4 그래프 - 시간에 따라 달라지는 데이터 표현하기
08-5 상자 그림 - 집단 간 분포 차이 표현하기
_셋째마당 | 실전! 데이터 분석 프로젝트
__09 데이터 분석 프로젝트 - 한국인의 삶을 파악하라!
09-1 ‘한국복지패널 데이터’ 분석 준비하기
09-2 성별에 따른 월급 차이 - 성별에 따라 월급이 다를까?
09-3 나이와 월급의 관계 - 몇 살 때 월급을 가장 많이 받을까?
09-4 연령대에 따른 월급 차이 - 어떤 연령대의 월급이 가장 많을까?
09-5 연령대 및 성별 월급 차이 - 성별 월급 차이는 연령대별로 다를까?
09-6 직업별 월급 차이 - 어떤 직업이 월급을 가장 많이 받을까?
09-7 성별 직업 빈도 - 성별로 어떤 직업이 가장 많을까?
09-8 종교 유무에 따른 이혼율 - 종교가 있으면 이혼을 덜 할까?
09-9 지역별 연령대 비율 - 어느 지역에 노년층이 많을까?
_넷째마당 | 다양한 데이터 분석의 세계
__10 텍스트 마이닝
10-1 대통령 연설문 텍스트 마이닝
10-2 기사 댓글 텍스트 마이닝
__11 지도 시각화
11-1 시군구별 인구 단계 구분도 만들기
11-2 서울시 동별 외국인 인구 단계 구분도 만들기
__12 인터랙티브 그래프
12-1 인터랙티브 그래프 만들기
__13 마크다운으로 데이터 분석 보고서 만들기
13-1 신뢰할 수 있는 데이터 분석 보고서 만들기
13-2 마크다운 문서 만들기
_다섯째마당 | 데이터 과학의 세계
__14 통계 분석 기법을 이용한 가설 검정
14-1 가설 검정이란?
14-2 t 검정 - 두 집단의 평균 비교하기
14-3 상관분석 - 두 변수의 관계 분석하기
__15 머신러닝을 이용한 예측 분석
15-1 머신러닝 모델 알아보기
15-2 소득 예측 모델 만들기
_여섯째마당 | 한발 더 들어가기
__16 데이터를 추출하는 다양한 방법
16-1 [] 이용하기
16-2 df.loc[] 이용하기
16-3 df.iloc[] 이용하기
__17 자료 구조 다루기
17-1 자료 구조란?
17-2 스칼라
17-3 리스트
17-4 튜플
17-5 딕셔너리
17-6 시리즈
17-7 데이터 프레임
__18 데이터 분석 기술 효율적으로 익히기
18-1 집중할 방향 정하기
18-2 데이터 분석 기술을 효율적으로 익히는 방법
18-3 오픈 소스 생태계에서 어울리기
- 교보문고: https://bitl.bz/JZYBza
- Yes24: https://bitl.bz/qRo8x4
'데이터 과학 > 데이터 과학을 위한 코딩' 카테고리의 다른 글
김철민, Do it! 공공데이터로 배우는 R 데이터 분석 with 샤이니, 이지스퍼블리싱 (2) | 2025.02.09 |
---|---|
김영우, Do it! 쉽게 배우는 R 텍스트 마이닝, 이지스퍼블리싱 (2) | 2025.02.08 |
김영우, Do it! 쉽게 배우는 R 데이터 분석, 이지스퍼블리싱 (2) | 2025.02.06 |
보구밀 카민스키, 데이터 분석을 위한 줄리아 - 시계열 데이터, 예측 모델, 랭킹 등 핸즈온 프로젝트로 마스터하는 줄리아 데이터 분석, 제이펍 (2) | 2025.01.28 |
마이클 크롤리, The R Book - 2nd Edition, 에이콘출판 (2) | 2025.01.26 |