"Do it! 쉽게 배우는 R 텍스트 마이닝"은 텍스트 분석을 처음 접하는 사람들에게 최적의 입문서입니다. 이 책은 R을 활용하여 텍스트 데이터를 분석하는 과정을 체계적으로 안내하며, 기사 댓글이나 SNS 데이터를 활용한 실습을 통해 실제 사례를 분석하는 방법을 배울 수 있습니다.
텍스트 마이닝의 기본 개념부터 시작하여, 텍스트 정제, 시각화, 감정 분석, 주제 분석 등 다양한 분석 기법을 소개합니다. 특히, R 패키지를 활용한 실습 과정을 통해 독자들이 직접 손으로 분석을 진행할 수 있도록 돕고 있습니다. 단어 빈도 분석, 감정 분석 등 다양한 주제를 다루고 있어, 이론과 실습을 동시에 경험할 수 있습니다.
이 책의 가장 큰 장점은 한국 데이터를 기반으로 한 분석 사례를 제공한다는 점입니다. 30개 이상의 그래프를 통해 실무에 바로 활용 가능한 결과물을 만들어낼 수 있습니다. 이를 통해 독자들은 실제 업무에 필요한 데이터 분석 능력을 키울 수 있습니다.
또한, 이 책은 텍스트 분석의 실전 연습을 충분히 할 수 있도록 구성되어 있습니다. '대통령 연설문', '기생충 오스카상 수상 댓글', '타다 금지법 댓글', '내년 대선 후보 댓글' 등 현재 사회에서 이슈가 되는 4가지 주제를 중심으로 실습을 진행합니다. 이러한 실제 사례를 통해 복잡해 보이는 개념도 쉽게 이해할 수 있습니다.
저자 김영우는 데이터 분석 전문가로, R을 처음 접하는 독자들이 쉽게 따라올 수 있도록 친절하고 상세한 설명을 제공합니다. 이 책은 텍스트 마이닝에 대한 두려움을 없애고, 데이터를 기반으로 한 인사이트를 도출하는 능력을 길러줄 것입니다. 텍스트 마이닝에 관심 있는 모든 분들에게 강력히 추천합니다.
목차
__1장 단어 빈도 분석: 무엇을 강조했을까?
_01-1 텍스트 전처리
_01-2 토큰화하기
_01-3 단어 빈도 분석하기
__2장 형태소 분석기를 이용한 단어 빈도 분석
_02-1 형태소 분석
_02-2 명사 빈도 분석하기
_02-3 특정 단어가 사용된 문장 살펴보기
__3장 비교 분석: 무엇이 다를까?
_03-1 단어 빈도 비교하기
_03-2 오즈비 - 상대적으로 중요한 단어 비교하기
_03-3 로그 오즈비로 단어 비교하기
_03-4 TF-IDF - 여러 텍스트의 단어 비교하기
__4장 감정 분석: 어떤 마음으로 글을 썼을까?
_04-1 감정 사전 활용하기
_04-2 댓글 감정 분석하기
_04-3 감정 범주별 주요 단어 살펴보기
_04-4 감정 사전 수정하기
__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?
_05-1 동시 출현 단어 분석 - Co-occurrence analysis
_05-2 동시 출현 네트워크 - Co-occurrence network
_05-3 단어 간 상관 분석 - Phi coefficient
_05-4 연이어 사용된 단어쌍 분석 - n-gram
__6장 토픽 모델링: 어떤 주제로 글을 썼을까?
_06-1 토픽 모델링 개념 알아보기
_06-2 LDA 모델 만들기
_06-3 토픽별 주요 단어 살펴보기
_06-4 문서를 토픽별로 분류하기
_06-5 토픽 이름 짓기
_06-6 최적의 토픽 수 정하기
__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석
_07-1 주요 단어 살펴보기
_07-2 공감, 비공감 댓글 비교하기
_07-3 관심 댓글 비교하기
_07-4 단어 간 관계 살펴보기
_07-5 토픽 모델링
__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석
_08-1 SNS 언급량 추이 살펴보기
_08-2 SNS 이슈 살펴보기
_08-3 감정 단어 살펴보기
_08-4 감정 경향 살펴보기
_08-5 감정 추이 살펴보기
_08-6 긍정, 부정 트윗 단어 비교하기
__9장 텍스트를 효율적으로 분석하는 방법
_09-1 텍스트 데이터 수집하기
_09-2 텍스트 분석 품질 높이기
_09-3 완전 유용한 꿀팁
- 교보문고: https://bitl.bz/BE0AUq
- Yes24: https://bitl.bz/9QpNzO
'데이터 과학 > 데이터 과학을 위한 코딩' 카테고리의 다른 글
김철민, Do it! 공공데이터로 배우는 R 데이터 분석 with 샤이니, 이지스퍼블리싱 (2) | 2025.02.09 |
---|---|
김영우, Do it! 쉽게 배우는 파이썬 데이터 분석, 이지스퍼블리싱 (2) | 2025.02.07 |
김영우, Do it! 쉽게 배우는 R 데이터 분석, 이지스퍼블리싱 (2) | 2025.02.06 |
보구밀 카민스키, 데이터 분석을 위한 줄리아 - 시계열 데이터, 예측 모델, 랭킹 등 핸즈온 프로젝트로 마스터하는 줄리아 데이터 분석, 제이펍 (2) | 2025.01.28 |
마이클 크롤리, The R Book - 2nd Edition, 에이콘출판 (2) | 2025.01.26 |