응용데이터분석
Applied Data Analysis Using R
이 책에서 다루는 토픽은 총 20개로 메타 분석에서 R 컬러 체계까지 다양하다. R에서 데이터세트를 다루는 데 있어 효과적인 몇 개의 팩키지를 부록에 소개하였다. 이들에는 어떤 순서도 없으므로 시간 있을 때 여기저기를 뒤적이거나 필요에 따라 즉시 익힐 수 있기를 기대한다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
현대 사회는 통계전문가에게 더 많은 종류의 기법을 다루도록 요구한다. 과거에는 t-검정과 회귀분석분산분석으로도 상당히 통하였으나 이제는 기대수준이 높아진 것이다. 이런 맥락에서 응용통계전문가(applied statistician)을 위한 책을 고안하게 되었다. 이 책에서 다루는 토픽은 총 20개로 메타 분석에서 R 컬러 체계까지 다양하다. R에서 데이터세트를 다루는 데 있어 효과적인 몇 개의 팩키지를 부록에 소개하였다. 이들에는 어떤 순서도 없으므로 시간 있을 때 여기저기를 뒤적이거나 필요에 따라 즉시 익힐 수 있기를 기대한다.
실습파일이 출판사 홈페이지(http://www.freeaca.com)의 자료실에 있으므로, 보기로 제시된 R 스크립트를 필요에 따라 약간만 변형하면 코딩 작업도 별 것이 아닐 것이다. 어느 정도 방법론 하나가 이해가 되면 해당 R 팩키지의 매뉴얼과 관련 vignette (짧은 설명문서)를 웹에서 찾아 정독하면 확실한 학습이 될 것이다."
목차
목차
1. 비율의 비교
2. 출간 편향
3. 평균의 비교
4. "meta"의 다른 기능
2장. 잠재 층 분석 latent class analysis
1. 범주형 응답과 이에 대한 통계적 모형
2. values 사례와 모형 선택
3. 잠재 층 회귀 모형
4. 응용: 잠재 층에 대한 로지스틱 회귀
5. 그 밖의 혼합분포 모형
3장. 성향점수 맞추기 propensity score matching
1. 배후요인의 수준 차이
2. 성향점수 모형
3. 최근접 이웃 맞추기
4. 부구간 맞추기
5. 사례: Lalonde 자료
6. 그 밖의 맞추기 기법과 R 팩키지
4장. 최적화 알고리즘 optimization algorithm
1. 최대가능도 추정
2. 비선형 회귀
3. TSP (traveling salesman problem)
5장. 결측값 대체 missing value imputation
1. 결측값 대체
2. 대체 자료의 활용
3. 대체 방법과 손실
4. MAR 상황
6장. 다차원 척도화 multidimensional scaling
1. 거리 행렬
2. 고전적 MDS
3. 비계량형 MDS
4. iso map
5. 차원의 결정
7장. 표본크기와 검정력 sample size and power
1. 정규분포의 중심
2. t-검정
3. 비율의 검정
4. 상관의 검정
5. 그 밖의 검정
8장. 붓스트랩 방법 bootstrap method
1. 붓스트랩 방법이란?
2. 붓스트랩 사례: 상관계수
3. 붓스트랩 사례: 로지스틱 회귀
4. 붓스트랩 사례: 두 독립표본의 중심 간 차이
9장. 로버스트 회귀와 분위수 회귀 robust and quantile regression
1. 로버스트 회귀
2. 분위수 회귀
10장. 일반화선형모형 generalized linear model
1. 일반화선형모형이란?
2. 포아송 회귀
3. 로지스틱 회귀
4. 감마 회귀
5. 요약
11장. 국소적 회귀 LOESS
1. 국소 가중치
2. 국소 선형이차식의 적합
3. Engine Exhaust Emissions 사례
4. Sulfate Deposits 사례
5. 기술적 세부 사항
참고문헌
12장. 일반화가법모형 generalized additive model
1. 기본 사례와 방법론
2. 준모수적 회귀모형
3. 모의자료 사례
참고문헌
13장. R 컬러와 산점도 r colors and scatterplot
1. R의 컬러
2. 산점도 응용: 제3의 변수
3. 산점도 응용:
4. 산점도 응용: lowess 평활
14장. 통계 그래프 1 statistical graph
1. 나무 지도
2. 모자이크 플롯
3. 열 지도
15장. 통계 그래프 2 statistical graph
1. 2변량 자료의 밀도
2. 3변량 자료의 시각화
3. 다변량 자료의 시각화
16장. 행렬도와 대응분석 biplot and correspondence analysis
1. 행렬도
2. 대응분석
3. 다중대응분석
17장. SVM (Support Vector Machine)
1. 선형 SVM 분류
2. 비선형 SVM 분류
3. 선형 및 비선형 SVM 회귀
18장. 나무 알고리즘 tree algorithm
1. CART
2. 랜덤 포리스트
19장. KPCA와 LLE (kernel PCA and locally linear embedding)
1. 커널 PCA
2. LLE
20장. 예측함수의 시각화 visualizing predictive functions
1. 조건부 예측 그래프
2. 회귀모형의 경우
3. 설명변수가 많은 경우
부록 I. R에서 데이터세트 다루기 (초급) manipulating datasets in R
부록 II. R에서 데이터세트 다루기 (고급) manipulating datasets in R
참고문헌
실습파일
찾아보기
"
저자
저자
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.

