R활용 통계모델링 입문
▶ 이 책은 R활용 통계모델링 입문에 대해 다룬 도서입니다. R활용 통계모델링의 기초적이고 전반적인 내용을 학습할 수 있도록 구성했습니다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
이 책은 통계 모델링 특히 범주형 자료분석에 대한 모델링을 다루는 11개의 장으로 구성되어 있습니다. 주어진 자료를 통계패키지에 입력하고 그 결과를 단순히 해석하는 분석을 지양하고, 연구자 스스로 모델링의 개념을 이해하고 자신의 연구문제에 적절한 분석을 선택하여 최선의 결과를 얻을 수 있도록 하는 데 많은 도움이 될 것입니다.
본서는 기존의 범주형 자료의 모형을 충실히 따르면서, 요즘 통계학에서 필수적으로 요구되고 있는 무료 통계소프트웨어 R로 예제를 구현해 나가면서 통계전공자는 물론이고 비전공자가 읽어도 쉽게 이해할 수 있도록 해설되어 있습니다. 어느 정도 모델링의 배경 지식을 갖추고 있는 독자라면, 관심 있는 장만을 참고할 수도 있겠습니다.
최근 몇 년간 연구논문, 석?박사 학위 논문작성을 위해서 요구되는 통계분석의 수준이 과거와 비교하면 상당히 높아졌습니다. 예를 들어, 컴퓨터의 계산 능력의 향상으로 인해 베이지안 통계분석 방법의 구현이 수월하게 되었으며, 데이터의 모형화에도 선형회귀분석 이상의 분석이 요구되는 경우가 많습니다. 그러나 선형회귀분석 이상의 고급 이론을 전부 이해하고 데이터 분석을 하기에는 통계 전공자와 비전공자 모두에게 상당한 시간이 걸리고, 특히, 시간에 쫓기는 비전공자는 자신의 현재 데이터를 구체적으로 어떻게 통계분석해야 하는지에 더 관심이 있을 수도 있습니다.
이와 같은 요구에 맞추어 최신 통계모델링에 있어서 관련이론과 데이터분석의 실용적인 면의 균형을 잘 맞추어서 집필된 점이 책의 장점입니다. 따라서 전공자와 비전공자 모두 각자의 통계적 지식에 근거해서 내용을 해석하고 이해할 수 있습니다.
제2장부터 제6장까지는 범주형 자료분석에 있어서 기본이 되는 로지스틱회귀모형, 포아송회귀모형을 중점적으로 다루고 있습니다. 제7장부터는 요즘 관심이 높아지고 있는 고급통계 기법인 MCMC, 깁스샘플링, 베이지안을 적용한 모델링으로 확장하여 고급 분석까지 가능하게 구성되어 있습니다. 이론적인 내용은 가급적 쉬운 용어를 사용해 비전공자 이해를 도왔으며, 혼자서도 충분히 실습이 가능할 정도로 상세하고 실용적으로 기술되어 있습니다.
사용한 계산도구는 R이며, 베이지안의 모델링에는 WinBUGS를 사용하였습니다. 두 소프트웨어 모두 무료입니다. 관련 실행파일은 및 데이터는 박영사 출판사 자료실(http://www.pybook.co.kr/bbs/bbsList.asp?Code=freepds)에서 내려받을 수 있으며, 본서에 실려 있는 분석결과와 그림을 그대로 재현할 수 있습니다. 조금씩 수정하여 자신의 데이터 적용하면 유용하게 사용할 수 있을 것입니다. 출판사의 자료실에는 필요 소프트웨어의 설치매뉴얼 등도 업로드 할 예정입니다. 그 밖에 본서에 대한 문의 사항, 질문 등은 박영사 또는 역자(j-lee@biwako.shiga-u.ac.jp)에게 문의하기 바랍니다.
본서를 번역하게 된 계기는 고려대학교 의학통계학교실의 연구교수로 있던 2013년 2학기에 석박사과정생을 대상으로 "범주형 자료분석" 과목을 담당하면서였습니다. 그때까지 범주형 자료분석수업은 5학기 이상을 Alan Agresti의 "Categorical Data Analysis"교재를 사용해서 수업을 해왔지만, 한 학기 분량으로 좀 더 적절한 교재를 찾고 있던 때였습니다. 우연히 본서를 접하게 되어서 최신 이론과 실습의 균형을 갖춘 적절한 교재라는 생각이 들었습니다. 때마침 2014년 겨울방학 때 고려대학교 통계학과 어수행 박사의 권유로 북해도로 여행을 가게 된 김에 저자와 만나서 출판 허락을 받았습니다.
처음 계획에서 출간까지는 예상보다 많은 시간이 걸렸습니다. 긴 시간 동안 가장 많은 도움을 주신 박영사의 이영조 차장님, 전채린 과장님께 감사의 뜻을 전합니다.
초고의 검토에는 고려대학교 의학통계학교실 이예경, 이혜영 석사로부터 많은 도움을 받았습니다. 고려대학교 의학통계학교실 안형진 교수님, 성신여대 통계학과 박만식 교수님으로부터는 많은 통계적 조언을 받았습니다. 이 모든 분들께 감사드립니다.
시가현 시가국립대학교
이종찬
목차
목차
데이터를 이해하기 위한 통계모형의 작성
1.1 통계모형: 왜 ?통계?적인 ?모형?인가? 2
1.2 '블랙박스 같은 통계분석'의 악몽 4
1.3 이 책의 내용: 일반화선형모형의 도입과 그 베이즈적인 확장 6
1.3.1 각 장의 내용?전체의 설명의 흐름 8
1.4 이 책에 등장하는 역어?기호?표기법에 대해서 11
1.5 이 장의 정리 14
제2장
확률분포와 통계모형의 최우추정
2.1 예제: 종자수의 통계모델링 16
2.2 데이터와 확률분포의 대응 관계를 조망하다 20
2.3 포아송분포란 무엇인가? 25
2.4 포아송분포 모수의 최우추정 29
2.4.1 의사난수와 최우추정치의 오차 34
2.5 통계모형의 요점: 난수발생?추정?예측 36
2.5.1 데이터 분석에 있어서 추정?예측의 역할 39
2.6 확률분포의 선택방식 40
2.6.1 보다 더 복잡한 확률분포가 필요한 것일까? 41
2.7 이 장의 정리 42
제3장
일반화선형모형(GLM): 포아송회귀
3.1 예제: 개체마다 평균 종자수가 다른 경우 46
3.2 관측 데이터의 개요를 조사하자 48
3.3 통계모델링 전에 데이터를 도시하자 52
3.4 포아송회귀의 통계모형 54
3.4.1 선형예측식과 로그링크함수 55
3.4.2 적합과 적합의 좋음 57
3.4.3 포아송회귀 모형에 의한 예측 62
3.5 설명변수가 인자형인 통계모형 64
3.6 설명변수가 수치형+인자형 통계모형 68
3.6.1 로그링크함수의 알기 쉬움: 곱셈 연산된 효과 69
3.7 ?무조건 정규분포? ?무조건 직선?으로는 무리! 72
3.8 이 장의 정리 76
제4장
GLM의 모형선택-AIC와 모형예측의 좋음
4.1 데이터는 하나, 모형은 여러 개 82
4.2 통계모형의 나쁜 정도: 일탈도(deviance) 83
4.3 모형선택 기준 AIC 89
4.4 AIC를 설명하기 위한 별도의 예제 90
4.5 왜 AIC로 모형 선택을 하는 것일까? 92
4.5.1 통계모형의 예측의 좋음: 평균로그우도 93
4.5.2 최대로그우도의 바이어스 보정 97
4.5.3 내포된 GLM의 AIC 비교 100
4.6 이 장의 정리 105
제5장
GLM의 우도비 검정과 검정의 비대칭성
5.1 통계학인 검정의 틀 109
5.2 우도비검정의 예제: 일탈도의 차를 조사한다 111
5.3 두 종류의 오류와 통계적 검정의 비대칭성 114
5.4 귀무가설을 기각하기 위한 유의수준 116
5.4.1 방법(1) 범용성이 있는 모수적 붓스트랩법 117
5.4.2 방법(2) 분포 근사 계산법 123
5.5 ?귀무가설을 기각할 수 없다?=?차이가 없다?? 125
5.6 검정과 모형선택, 추정 모형의 해석 126
5.7 이 장의 정리 127
제6장
GLM의 응용 범위를 넓히자: 로지스틱회귀 등
6.1 다양한 종류의 데이터에 응용할 수 있는 GLM 130
6.2 예제 : 상한이 있는 카운트 데이터 131
6.3 이항분포로 표현되는 ?있음?없음? 카운트 데이터 135
6.4 로지스틱회귀와 로짓링크함수 136
6.4.1 로짓링크함수 136
6.4.2 모수 추정 139
6.4.3 로짓링크함수의 의미?해석 142
6.4.4 로지스틱회귀의 모형선택 145
6.5 교호작용항을 넣은 선형예측식 146
6.6 나눈 값의 통계모델링은 이제 그만 150
6.6.1 나눈 값 대신 오프셋항을 추가 151
6.7 정규분포와 우도 155
6.8 감마분포의 GLM 160
6.9 이 장의 정리 163
제7장
일반화선형혼합모형(GLMM) -개체차의 모델링-
7.1 예 : GLM으로는 설명할 수 없는 카운트데이터 168
7.2 과분산과 개체차 170
7.2.1 과분산: 오차가 너무 크다 171
7.2.2 관측되지 않은 개체차가 초래하는 과분산 172
7.2.3 관측되지 않은 개체차라는 것은 무엇인가? 174
7.3 일반화선형혼합모형 175
7.3.1 개체차를 나타내는 모수의 추가 175
7.3.2 개체차의 오차를 나타내는 확률분포 176
7.3.3 선형예측식의 구성 요소: 고정효과와 랜덤효과 178
7.4 일반화선형혼합모형의 최우추정 179
7.4.1 R을 사용한 GLMM의 모수 추정 184
7.5 현실의 데이터 분석에는 GLMM이 필요 186
7.5.1 반복?의사반복과 통계모형의 관계 187
7.6 여러 가지 분포의 GLMM 190
7.7 이 장의 정리 192
제8장
마코프연쇄 몬테칼로(MCMC)법과 베이즈 통계모형
8.1 예제 : 종자의 생존 확률(개체차 없음) 197
8.2 비틀비틀 시행착오에 의한 최우추정 199
8.3 MCMC 알고리즘의 하나: 메트로폴리스법 203
8.3.1 메트로폴리스법으로 샘플링해보다 204
8.3.2 마코프연쇄의 정상분포 206
8.3.3 이 정상분포는 무엇을 나타내는 분포인가? 210
8.4 MCMC 샘플링과 베이즈 통계모형 212
8.5 보충설명 216
8.5.1 메트로폴리스법과 정상분포의 관계 216
8.5.2 베이즈정리 219
8.6 이 장의 정리 221
제9장
GLM의 베이즈 모형화와 사후분포의 추정
9.1 예제: 종자수의 포아송회귀(개체차 없음) 224
9.2 GLM의 베이즈 모형화 226
9.3 무정보사전분포 227
9.4 베이즈 통계모형의 사전분포의 추정 228
9.4.1 베이즈 통계모형의 코딩 229
9.4.2 사후분포추정의 준비 233
9.4.3 어느 정도 길게 MCMC 샘플링을 해야 할까? 236
9.5 MCMC 샘플링으로부터 사후분포를 추정 240
9.5.1 사후분포의 통계량 244
9.6 다수 모수의 MCMC 샘플링 246
9.6.1 깁스샘플링: 이 장의 예제의 경우 247
9.6.2 WinBUGS의 거동은 어떻게 되어 있을까? 251
9.7 이 장의 정리 253
제10장
계층베이즈모형: GLMM의 베이즈 모형화
10.1 예제: 개체차와 생존 종자수(개체차 있음) 256
10.2 GLMM의 계층베이즈 모형화 258
10.3 계층베이즈모형의 추정?예측 261
10.3.1 계층베이즈모형의 MCMC 샘플링 261
10.3.2 계층베이즈모형의 사후분포 추정과 예측 263
10.4 베이즈 모형에서 사용하는 여러 사전분포 265
10.5 개체차+장소차의 계층베이즈모형 269
10.6 이 장의 정리 274
제11장
공간구조가 있는 계층베이즈모형
11.1 예제: 일차원 공간상의 개체수 분포 279
11.2 계층베이즈모형에 공간구조를 추가 281
11.2.1 공간구조가 없는 계층사전분포 282
11.2.2 공간구조가 있는 계층사전분포 283
11.3 공간통계모형을 데이터에 적합하다 285
11.4 공간통계모형이 만들어 내는 확률장 288
11.5 공간통계모형과 결측이 있는 관측 데이터 290
11.6 이 장의 정리 293
찾아보기 294
추천 참고문헌 300
저자
저자
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.

