Statistical Machine Learning(빅데이터/R/Python)
『Statistical Machine Learning(빅데이터/R/Python)』는 정형과 비정형 자료를 분석하는 방법을 이론적으로 설명하였다. 빅데이터의 차원을 축소하는 수리적 방법을 자세히 설명하였고, supervised learning과 unsupervised learning순으로 방법들을 소개하였다. 끝 부분에 text mining 방법과 사회네트워크 분석을 설명하였다. 컴퓨터 프로그램은 빅데이터 분석에서 가장 많이 사용되는 프로그램 중에서 R과 Python프로그램을 사용하였다. 많은 경우에 같은 데이터를 두 프로그램으로 동시에 분석하였기 때문에 통계학 전공자는 R을 이용하여 Python을 이해할 수 있고, 공학 전공자는 Python을 이용하여 R을 이해할 수 있다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
이때 수집되는 데이터는 형태도 다양해지고 크기도 쉽게 이해하기 어려울 정도로 클 뿐만 아니라 생성되는 속도도 과거와 비교할 수 없을 정도로 빠르다. 이러한 현상이 생긴 가장 큰 이유는 스마트 기기의 개발과 사용이고, 또 데이터 전문가가 아닌 개개인이 데이터를 생산하는 주체가 되었기 때문이다. 이름하여 빅데이터(BigData) 시대이다. 이것이 21세기 통계학 생태환경에서의 가장 크고 중요한 변화이다.
이 빅데이터를 통계적 분석을 하기 위해서는 다양하며 세분화된 컴퓨터 알고리즘과 분석 프로그램을 필수적으로 사용하여야 한다. 또한 빅데이터 시대에는 대용량의 수치적 자료 외에 문자, 시그널, 이미지 그리고 영상들도 분석의 대상으로 자리를 잡고 있는데 이러한 형태의 자료를 비정형 자료(unstructured data)라고 한다. 이 비정형 자료를 분석하기 위해서는 비정형 자료를 분석하도록 특화된 프로그램이나 알고리즘을 사용하여야 한다.
또한 빅이터 시대의 통계자료분석에서의 변화는 분석내용만을 중요하게 여기던 과거의 분석방법에서 발전하여, 스토리텔링(storytelling)과 표현이 강조된다. 여기서 표현이라 함은 직관적인 이해를 돕는 시각화(visualization)을 의미한다. 시각화에는 다양한 형태의 테이블과 그림 및 그래프 등을 말한다. 이렇게 분석내용을 테이블, 그림 그리고 그래프들로 다양하게 형상화하고, 이들을 interactive하게 사용하여 분석내용을 이어가는 분석법을 스토리텔링 통계분석이라 한다. 이러한 스토리텔링 통계분석을 가능하게 하는 시각화를 편하게 해주는 프로그램이 R과 파이썬 Python이다.
이 책은 정형과 비정형 자료를 분석하는 방법을 이론적으로 설명하였다. 빅데이터의 차원을 축소하는 수리적 방법을 자세히 설명하였고, supervised learning과 unsupervised learning순으로 방법들을 소개하였다. 끝 부분에 text mining 방법과 사회네트워크 분석을 설명하였다. 컴퓨터 프로그램은 빅데이터 분석에서 가장 많이 사용되는 프로그램 중에서 R과 Python프로그램을 사용하였다. 많은 경우에 같은 데이터를 두 프로그램으로 동시에 분석하였기 때문에 통계학 전공자는 R을 이용하여 Python을 이해할 수 있고, 공학 전공자는 Python을 이용하여 R을 이해할 수 있다.
목차
목차
제1장 행렬
제2장 차원축소
PART Ⅱ Supervised Learning
제3장 의사 결정 나무
제4장 kNN 방법
제5장 나이브 베이즈 분류
제6장 서포트 벡터 머신
제7장 분류모형 평가
제8장 앙상블 방법
PART Ⅲ Unsupervised Learning
제9장 군집분석
제10장 연관성 분석
PART Ⅳ 텍스트 분석 및 네트워크 분석
제11장 텍스트 마이닝
제12장 사회 네트워크 분석
부록 1 R 프로그램
부록 2 파이썬(Python) 설치 및 기초
부록 3 KoNLPy 설치 방법(윈도우)
찾아보기
저자
저자
- 주요약력
미국 뉴저지 주립대학(Rutgers) 통계학 박사
미국 뉴저지 주립대학(Rutgers) 객원교수
존스 앤 존스(Johnson & Johnson) 통계 컨설턴트
동아제약 통계고문
서울지방 중소 기업청 전문위원
한국 산업인력공단 출제위원
국회 사무처 입법고시 출제위원
현 동국대학교 통계학과 교수
동국대학교 빅데이터 연구 센터장
- 주요 저서 및 공저
「생활과 통계」(자유아카데미, 2000)
「우도의 이해」(교우사, 2001)
「일반통계학」(교우사, 2006)
「진단의약품의 임상평가」(고려의학, 2007)
「의학통계전산 한꺼번에 맛보기」(이퍼블릭, 2009)
「일반통계학 및 실습」(교우사, 2017)
「확률 및 통계학 입문」(교우사, 2017)
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.

