R코딩 플러스
빅데이터 분석의 첫걸음
Regular price
$35.01
Sale price
Regular price
✈️
Estimated delivery date 예상 배송일
Standard Shipping
불러오는 중...
주문일로부터 8-12 영업일
Express Shipping
불러오는 중...
주문일로부터 6-8 영업일
4차 산업혁명으로 들면서 2016년 바둑 경기에서 컴퓨터가 이세돌을 이긴 사건은 인공지능이 세상의 주목을 다시 받는 계기가 되었다. 최근 OpenAI의 chatGPT는 인간과의 대화 문맥을 이해하고 논리적인 글을 만들어낼 정도로 더 진화하였고, DALL-E는 문자 또는 이미지로 새로운 그림을 만들어내고 있다. 이처럼 인공지능은 하루가 다르게 발전하면서 인간의 창의적인 영역까지 두각을 나타내고 있어, 앞으로 인공지능의 도움으로 우리의 생활이 더욱 풍요로워질 것으로 기대되고 있다.
인공지능은 여러 가지 기법으로 구현 가능하다. chatGPT와 DALL-E 같이 데이터를 기반으로 하는 인공지능 기법들이 크게 활용 가치를 발휘하는 가운데, 인공지능을 이해하고 구현하거나 데이터를 읽고 분석하는 데이터 리터러시 능력은 주요 경쟁력의 하나가 되고 있다.
인공지능을 구현하는 여러 도구들이 있지만, R은 우리에게 새로운 기회가 될 수 있다. 통계 패키지로 출발한 R은 SAS, MATLAB, SPSS보다 더 선호되고 있으며, 범용 프로그래밍 언어인 Java, C/C++, Python 못지 않게 인기가 높다. R은 일반적인 데이터 처리를 위한 뛰어난 기능이 있고, 간단한 코딩으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 내며, 웹을 통한 정보 추출과 인공지능 구현을 위한 손쉬운 기능 등을 제공하고 있어 배울수록 흥미가 커질 것이다.
이 책은 R을 통해 데이터 활용에 대한 흥미와 코딩에 대한 자신감을 높이는 계기가 되었으면 하는 기대로, 이전의 R로 배우는 코딩 시리즈를 최신 환경의 변화에 따라 전면 개편한 것이다. 특히, 처음 데이터를 다루는 입문자를 위해 R의 기초 문법과 여러 흥미로운 주제를 쉽게 이해할 수 있도록 내용을 구성하였다.
인공지능은 여러 가지 기법으로 구현 가능하다. chatGPT와 DALL-E 같이 데이터를 기반으로 하는 인공지능 기법들이 크게 활용 가치를 발휘하는 가운데, 인공지능을 이해하고 구현하거나 데이터를 읽고 분석하는 데이터 리터러시 능력은 주요 경쟁력의 하나가 되고 있다.
인공지능을 구현하는 여러 도구들이 있지만, R은 우리에게 새로운 기회가 될 수 있다. 통계 패키지로 출발한 R은 SAS, MATLAB, SPSS보다 더 선호되고 있으며, 범용 프로그래밍 언어인 Java, C/C++, Python 못지 않게 인기가 높다. R은 일반적인 데이터 처리를 위한 뛰어난 기능이 있고, 간단한 코딩으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 내며, 웹을 통한 정보 추출과 인공지능 구현을 위한 손쉬운 기능 등을 제공하고 있어 배울수록 흥미가 커질 것이다.
이 책은 R을 통해 데이터 활용에 대한 흥미와 코딩에 대한 자신감을 높이는 계기가 되었으면 하는 기대로, 이전의 R로 배우는 코딩 시리즈를 최신 환경의 변화에 따라 전면 개편한 것이다. 특히, 처음 데이터를 다루는 입문자를 위해 R의 기초 문법과 여러 흥미로운 주제를 쉽게 이해할 수 있도록 내용을 구성하였다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
이 책의 내용과 학습 절차
이 책은 크게 R의 시작 - 시각화 - 데이터 수집과 전처리 - 시뮬레이션과 데이터 분석의 4개 파트로 구성되어 있다. 첫 번째 파트인 R의 시작에서는 1장에서 4차 산업혁명 시대의 데이터 분석 사례를 통해 그 중요성을 이해하고, 데이터 분석 도구인 R의 개요를 살펴보자. 2장에서는 R과 RStudio 개발환경을 구축하고 시작하는 과정을, 3장에서는 R 데이터 구조와 데이터 세트, 그리고 함수를 통해 기초적인 문법을 익혀보자. 두 번째 파트인 시각화 파트는 데이터 분석 효과를 높이기 위해 그래프, 애니메이션, 지도 출력 방법을 알아보자. 4장에서 ggplot2 패키지를 이용한 고급 그래프를 출력하는 방법을 살펴보고, 5장에서는 그래프 애니메이션과 이미지 애니메이션을 제작해본다. 6장에서는 세계지도와 우리나라 행정지도를 이용한 지도의 활용 방법을 살펴본다. 세 번째 파트는 데이터 분석에 필요한 데이터 수집과 전처리 과정을 익히고, 7장~9장에서 웹스크래핑, 공공데이터와 네이버의 Open API를 이용한 실용적인 데이터를 수집하는 방법을 살펴보자. 또한, 10장에서 데이터 프로파일링, 데이터 정제, 데이터 병합 등의 데이터 전처리에 대해 살펴보자. 마지막 시뮬레이션과 데이터 분석 파트에서는 11장에서 복잡한 실세계의 문제를 컴퓨터 시뮬레이션으로 해결하는 원리를 이해하고, 12장에서 사회관계분석을 위한 네트워크 분석, 13장에서 인공신경망과 딥러닝의 원리를 살펴본다. 학습 절차는 시간적인 제약과 흥미에 따라 달리할 수 있을 것이다. 파트 1과 2는 R의 기초적인 내용으로 순서에 따라 학습하면 좋을 것이다. 한편, 파트 3과 4의 각 주제는 장별 순서대로 학습하거나 주제별로 선별해서 순서와 무관하게 학습할 수 있다. 다만, 8장의 공공 데이터 활용과 9장의 네이버 오픈 API 활용은 7장의 웹스크래핑 원리를 익힌 후에 학습하기를 권한다.
파트 3과 4의 각 주제는 개요, 원리 이해, 기초 실습, 응용 실습 단계로 기술하여, 학습자가 혼자서 또는 그룹으로 토의하면서 내용들을 이해할 수 있도록 하였다. 또한, 각 주제별 학습 후에는 연습문제와 응용문제를 통해 스스로 이해 수준을 파악하고 응용력을 키울 수 있도록 하였다.
이 책은 크게 R의 시작 - 시각화 - 데이터 수집과 전처리 - 시뮬레이션과 데이터 분석의 4개 파트로 구성되어 있다. 첫 번째 파트인 R의 시작에서는 1장에서 4차 산업혁명 시대의 데이터 분석 사례를 통해 그 중요성을 이해하고, 데이터 분석 도구인 R의 개요를 살펴보자. 2장에서는 R과 RStudio 개발환경을 구축하고 시작하는 과정을, 3장에서는 R 데이터 구조와 데이터 세트, 그리고 함수를 통해 기초적인 문법을 익혀보자. 두 번째 파트인 시각화 파트는 데이터 분석 효과를 높이기 위해 그래프, 애니메이션, 지도 출력 방법을 알아보자. 4장에서 ggplot2 패키지를 이용한 고급 그래프를 출력하는 방법을 살펴보고, 5장에서는 그래프 애니메이션과 이미지 애니메이션을 제작해본다. 6장에서는 세계지도와 우리나라 행정지도를 이용한 지도의 활용 방법을 살펴본다. 세 번째 파트는 데이터 분석에 필요한 데이터 수집과 전처리 과정을 익히고, 7장~9장에서 웹스크래핑, 공공데이터와 네이버의 Open API를 이용한 실용적인 데이터를 수집하는 방법을 살펴보자. 또한, 10장에서 데이터 프로파일링, 데이터 정제, 데이터 병합 등의 데이터 전처리에 대해 살펴보자. 마지막 시뮬레이션과 데이터 분석 파트에서는 11장에서 복잡한 실세계의 문제를 컴퓨터 시뮬레이션으로 해결하는 원리를 이해하고, 12장에서 사회관계분석을 위한 네트워크 분석, 13장에서 인공신경망과 딥러닝의 원리를 살펴본다. 학습 절차는 시간적인 제약과 흥미에 따라 달리할 수 있을 것이다. 파트 1과 2는 R의 기초적인 내용으로 순서에 따라 학습하면 좋을 것이다. 한편, 파트 3과 4의 각 주제는 장별 순서대로 학습하거나 주제별로 선별해서 순서와 무관하게 학습할 수 있다. 다만, 8장의 공공 데이터 활용과 9장의 네이버 오픈 API 활용은 7장의 웹스크래핑 원리를 익힌 후에 학습하기를 권한다.
파트 3과 4의 각 주제는 개요, 원리 이해, 기초 실습, 응용 실습 단계로 기술하여, 학습자가 혼자서 또는 그룹으로 토의하면서 내용들을 이해할 수 있도록 하였다. 또한, 각 주제별 학습 후에는 연습문제와 응용문제를 통해 스스로 이해 수준을 파악하고 응용력을 키울 수 있도록 하였다.
목차
목차
PART 1 R의 시작
CHAPTER 1 데이터 활용과 R
1.1 제4차 산업혁명과 인공지능
1.2 빅데이터의 활용과 데이터 리터러시
1.3 데이터 분석 도구: R
CHAPTER 2 R의 시작
2.1 R 개발환경
2.2 R 설치와 시작
2.3 RStudio 설치와 시작
2.4 R 패키지
CHAPTER 3 데이터 구조
3.1 데이터 구조의 이해
3.2 벡터와 연산자
3.3 요인
3.4 배열과 행렬
3.5 리스트
3.6 데이터 프레임
연습문제
PART 2 시각화
CHAPTER 4 그래프
4.1 그래프의 활용과 유형
4.2 막대 그래프
4.3 선 그래프
4.4 산포도
4.5 원 그래프
4.6 히스토그램
4.7 박스 플롯
연습문제
응용문제1: CDNow의 거래 데이터 분포 분석
응용문제2: 강의 길이에 대한 분포 분석
CHAPTER 5 애니메이션
5.1 애니메이션 개요
5.2 그래프 애니메이션: 막대 그래프
5.3 그래프 애니메이션: 산포도
5.4 그래프 애니메이션: 선 그래프
5.5 그래프 애니메이션: 시계열 데이터
5.6 그림 애니메이션: 양궁
연습문제
응용문제1: 애니메이션 그래프
응용문제2: 포물선으로 날아가는 화살
응용문제3: 당구공 굴리기
CHAPTER 6 지도
6.1 지도 개요
6.2 지형정보 지도
6.3 지형정보 지도를 이용한 지진 분포 파악
6.4 우리나라 행정경계 지도
6.5 행정경계 지도를 이용한 국내 지진 분포 파악
연습문제
응용문제1: 지역별 미세먼지 분포
응용문제2: 지역별 코로나 확진자 수 분포
PART 3 데이터 수집과 전처리
CHAPTER 7 웹스크래핑
7.1 웹스크래핑 개요
7.2 DOM의 이해
7.3 웹스크래핑의 기본원리
7.4 웹스크래핑 응용
연습문제
응용문제1: 지역별 미세먼지 추출
응용문제2: 지역별 코로나 확진자 수 추출
CHAPTER 8 공공 데이터 활용
8.1 공공데이터 포탈 개요
8.2 오픈 API 인증키 신청: 미세먼지 정보
8.3 미세먼지 농도의 시간대별 그래프 비교
8.4 지역별 미세먼지 농도의 지도 분포
연습문제
응용문제: 일별 미세먼지 발생 현황 조회
CHAPTER 9 네이버 오픈 API
9.1 네이버 오픈 API 개요
9.2 네이버 오픈 API 기본사항
9.3 네이버 정보검색 API 키 발급받기
9.4 뉴스 검색 및 데이터 정제
연습문제
응용문제: 블로그 검색
CHAPTER 10 데이터 전처리
10.1 데이터 전처리 개요
10.2 데이터 프로파일링
10.3 데이터 정제
10.4 데이터 통합
연습문제
응용문제1: adult 데이터 세트의 프로파일링
응용문제2: 시뮬레이션 데이터의 정제
PART 4 시뮬레이션과 데이터 분석
CHAPTER 11 시뮬레이션
11.1 시뮬레이션 개요
11.2 표본추출과 난수
11.3 동전 던지기
11.4 원주율 구하기
11.5 회귀선 구하기
연습문제
응용문제1: 동전 2개 던지기
응용문제2: 시행횟수에 따른 원주율의 변화
응용문제3: 회귀선 구하기
CHAPTER 12 네트워크 분석
12.1 네트워크 분석의 개요
12.2 네트워크 분석 지표
12.3 네트워크 유형별 지표 분석
12.4 페이스북 사용자의 네트워크 분석
연습문제
응용문제1: 천체물리학자의 협업네트워크 분석
응용문제2: 이메일 네트워크 분석
CHAPTER 13 인공신경망과 딥러닝의 이해
13.1 인공지능과 인공신경망 개요
13.2 인공신경망의 기본원리
13.3 선형 회귀분석의 예
13.4 비선형 회귀분석의 예
연습문제
응용문제1: 시뮬레이션 데이터를 이용한 선형 회귀분석
응용문제2: 시뮬레이션 데이터를 이용한 비선형 회귀분석
부록
부록1: R과 RStudio 설치(2장 참조)
부록2: graphics 패키지를 이용한 그래프(4장 참조)
부록3: 네트워크 분석(12장 참조)
부록4: 인공신경망을 이용한 분류문제(13장 참조)
CHAPTER 1 데이터 활용과 R
1.1 제4차 산업혁명과 인공지능
1.2 빅데이터의 활용과 데이터 리터러시
1.3 데이터 분석 도구: R
CHAPTER 2 R의 시작
2.1 R 개발환경
2.2 R 설치와 시작
2.3 RStudio 설치와 시작
2.4 R 패키지
CHAPTER 3 데이터 구조
3.1 데이터 구조의 이해
3.2 벡터와 연산자
3.3 요인
3.4 배열과 행렬
3.5 리스트
3.6 데이터 프레임
연습문제
PART 2 시각화
CHAPTER 4 그래프
4.1 그래프의 활용과 유형
4.2 막대 그래프
4.3 선 그래프
4.4 산포도
4.5 원 그래프
4.6 히스토그램
4.7 박스 플롯
연습문제
응용문제1: CDNow의 거래 데이터 분포 분석
응용문제2: 강의 길이에 대한 분포 분석
CHAPTER 5 애니메이션
5.1 애니메이션 개요
5.2 그래프 애니메이션: 막대 그래프
5.3 그래프 애니메이션: 산포도
5.4 그래프 애니메이션: 선 그래프
5.5 그래프 애니메이션: 시계열 데이터
5.6 그림 애니메이션: 양궁
연습문제
응용문제1: 애니메이션 그래프
응용문제2: 포물선으로 날아가는 화살
응용문제3: 당구공 굴리기
CHAPTER 6 지도
6.1 지도 개요
6.2 지형정보 지도
6.3 지형정보 지도를 이용한 지진 분포 파악
6.4 우리나라 행정경계 지도
6.5 행정경계 지도를 이용한 국내 지진 분포 파악
연습문제
응용문제1: 지역별 미세먼지 분포
응용문제2: 지역별 코로나 확진자 수 분포
PART 3 데이터 수집과 전처리
CHAPTER 7 웹스크래핑
7.1 웹스크래핑 개요
7.2 DOM의 이해
7.3 웹스크래핑의 기본원리
7.4 웹스크래핑 응용
연습문제
응용문제1: 지역별 미세먼지 추출
응용문제2: 지역별 코로나 확진자 수 추출
CHAPTER 8 공공 데이터 활용
8.1 공공데이터 포탈 개요
8.2 오픈 API 인증키 신청: 미세먼지 정보
8.3 미세먼지 농도의 시간대별 그래프 비교
8.4 지역별 미세먼지 농도의 지도 분포
연습문제
응용문제: 일별 미세먼지 발생 현황 조회
CHAPTER 9 네이버 오픈 API
9.1 네이버 오픈 API 개요
9.2 네이버 오픈 API 기본사항
9.3 네이버 정보검색 API 키 발급받기
9.4 뉴스 검색 및 데이터 정제
연습문제
응용문제: 블로그 검색
CHAPTER 10 데이터 전처리
10.1 데이터 전처리 개요
10.2 데이터 프로파일링
10.3 데이터 정제
10.4 데이터 통합
연습문제
응용문제1: adult 데이터 세트의 프로파일링
응용문제2: 시뮬레이션 데이터의 정제
PART 4 시뮬레이션과 데이터 분석
CHAPTER 11 시뮬레이션
11.1 시뮬레이션 개요
11.2 표본추출과 난수
11.3 동전 던지기
11.4 원주율 구하기
11.5 회귀선 구하기
연습문제
응용문제1: 동전 2개 던지기
응용문제2: 시행횟수에 따른 원주율의 변화
응용문제3: 회귀선 구하기
CHAPTER 12 네트워크 분석
12.1 네트워크 분석의 개요
12.2 네트워크 분석 지표
12.3 네트워크 유형별 지표 분석
12.4 페이스북 사용자의 네트워크 분석
연습문제
응용문제1: 천체물리학자의 협업네트워크 분석
응용문제2: 이메일 네트워크 분석
CHAPTER 13 인공신경망과 딥러닝의 이해
13.1 인공지능과 인공신경망 개요
13.2 인공신경망의 기본원리
13.3 선형 회귀분석의 예
13.4 비선형 회귀분석의 예
연습문제
응용문제1: 시뮬레이션 데이터를 이용한 선형 회귀분석
응용문제2: 시뮬레이션 데이터를 이용한 비선형 회귀분석
부록
부록1: R과 RStudio 설치(2장 참조)
부록2: graphics 패키지를 이용한 그래프(4장 참조)
부록3: 네트워크 분석(12장 참조)
부록4: 인공신경망을 이용한 분류문제(13장 참조)
저자
저자
장용식
서강대학교 이학사, POSTECH 대학원 물리학 석사, KAIST에서 경영공학 박사 학위를 취득하였고, 현재 한신대학교 IT경영학과 교수로 재직 중이다. POSCO 그룹에서 MIS 연구 및 개발 경험이 있으며, 지능정보 분야의 다수 국내외 연구논문을 발표하였고, 안드로이드 앱, JSP 웹, R과 파이썬 기반 데이터 분석 관련 저서를 출판하였다.
Payment & Security
Payment methods
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.
$99 이상 무료 배송
3% 리워드 크레딧 적립
Secure Payment

