* 띄어쓰기 없이 입력해 주십시오
  > 총 도서목록 > 분야별 도서목록 > 정보·기술 > R를 이용한 텍스트 마이닝
       
 
 

R를 이용한 텍스트 마이닝
백영민 지음
한울아카데미 / 2017-08-10 발행 / 크라운판 / 반양장 / 296면 / 29,500원
ISBN 978-89-460-7022-6 93300
분야 : 정보·기술, 실용
관련자료 : R를_이용한_텍스트마이닝_보조자료.zip
 
  사회학, 심리학, 언론학, 경제·경영학, 문화인류학, 보건의료학 등
사회과학 연구자와 학생을 위한 R 텍스트 마이닝 워크북!

이 책은 최근 가장 각광받는 프로그래밍 언어이자 오픈소스 프로그램인 R을 이용해 텍스트 마이닝’을 해내는 실제적인 방법을 안내한다. R은 각종 통계분석기법들이 패키지로 공개되어 있고, 텍스트 데이터를 직관적이고 효율적으로 처리할 수 있는 뛰어난 라이브러리들이 계속해서 추가되고 있다. 통계 결과를 그래프나 단어구름 등으로 손쉽게 시각화할 수도 있다. 그리고 이 모두가 무료다. 이런 까닭으로 R은 사회과학 연구에 텍스트 마이닝을 적용하는 데 더없이 좋은 새 도구로 사용되고 있다. 이 책은 다양한 데이터 마이닝 기법과 데이터 처리 방법을 소개하고 이를 구현하는 R 프로그래밍 코드를 첫 줄부터 마지막 줄까지 세심하게 설명했다.
이 책에서 다루는 텍스트 처리기법들은 타당한 근거 위에서 학문적 신뢰성을 획득한 방법이다. 현재 언론학, 정치학, 사회학, 컴퓨터공학, 통계학 등의 학술논문에서 소개되거나 해당 분과의 학술적 주장을 뒷받침하는 자료로서 효용을 인정받고 있다. 빠르게 변화하는 디지털시대 학문 환경 속에서 더욱 새롭고 효율적인 분석기법이 속속 제안되겠지만, 이 책에서 소개하는 기본 개념과 모형 구성의 기본 패러다임은 크게 바뀌지 않을 것으로 전망된다. 특히 수년간 R를 이용한 텍스트 분석 워크숍을 진행해왔으며 스스로 R를 연구에 이용하고 있기도 한 저자의 경험은 이 책이 사회과학 연구자와 학생들의 눈높이와 필요에 맞춤하게 서술되도록 했다. 기초 개념과 프로그래밍을 요령 있게 습득할 수 있는 이 책은 나날이 새로워지는 데이터 분석기법을 익히는 데 견고한 바탕이 될 것이다.
 
  1부 텍스트 데이터란 무엇인가?
01 텍스트를 데이터로 파악하기

2부 텍스트 데이터 사전처리
01 텍스트 분석을 위한 기초적 R 함수
02 텍스트 분석을 위한 R의 베이스 함수
03 텍스트 분석을 위한 stringr 라이브러리 함수
04 말뭉치 텍스트 데이터 사전처리
05 한국어 텍스트 데이터 처리
06 품사분석

3부 텍스트 데이터 분석 및 결과 제시
01 텍스트 데이터에 대한 기술통계분석
02 토픽모형
03 감정분석

4부 마무리
01 R를 활용한 온라인 데이터 수집 소개
02 맺음말