통계의 이해
다변량 빅데이터 중심으로
Regular price
$28.09
Sale price
Regular price
✈️
Estimated delivery date 예상 배송일
Standard Shipping
불러오는 중...
주문일로부터 8-12 영업일
Express Shipping
불러오는 중...
주문일로부터 6-8 영업일
통계는 우리 생활에 중요한 한 부분을 차지하고 있다. 특히 요즈음 인터넷의 발달로 인하여 Big Data의 수집이 원활한 환경에서 우리가 알고자 하는 여러 현상을 파악하고자 통계 분석을 함에 있어 통계 분석 수단만 갖추어진다면 우리 생활에 유용한 정보를 얻을 수 있을 것이다. 아무리 많은 자료를 가지고 있다고 해도 자료를 정리하고 특정한 결과를 얻을 수 있는 수단이 없다면 그 자료는 효용 값어치가 없다 즉 죽은 자료이다. 다른 과학(IT)의 발전에 따라, 과거보다 손쉽게 얻어진 자료라 할지라도 우리의 미래 삶을 풍족하게 할 수 있는 정보로 활용할 수 없다면 그 의미를 잃게 된다. 그러나 통계를 이해하지 못하고 통계 분석에만 급급하여 여러 통계 방법을 적용하는 것은 크나큰 오류를 범하게 된다. 이 오류는 좋지 않은 결과로 이어지고 이는 마치 정확한 정보로 오인 되어 우리의 삶에 도움이 되지 못한다.?
최근에 통계 분석을 위한 많은 컴퓨터 프로그램(통계 패키지)들이 많이 제작되고 있다. SAS, SPSS 그리고 R 등 다양하게 존재하며 각 통계 패키지들의 특성에 따라 이용성이 다르지만 각 통계 패키지들은 거의 모든 형태의 자료에 대하여 해결 방안을 준다. 이들 통계 패키지들의 특성을 보면 SPSS는 메뉴 방식이 중심이기 때문에 첫 입문자들은 쉽게 느껴질 수 있으며, 간단한 통계에는 문제가 없지만 복잡한 분석에서는 별도의 코딩 방식을 따로 학습해야 한다. SAS 나 R은 코딩 방식이 주를 이루지만, 보다 자세하고 독특한 통계 분석을 할 수 있게 해준다. 또 SAS와 R의 비교는 같은 코딩 방식이 주를 이루지만 SAS는 사용에 비용이 많이 들고 R은 무료라는 것에 매력이 있다. 그러나 R의 코딩을 위해서는 통계 계산 과정을 잘 파악하여야 하며 만약 오류가 있는 코딩을 하였다면 통계 분석 결과에 책임 소재가 불분명하게 된다. 하지만 SAS는 이미 공인된 통계 패키지이고 SAS에서 제공하는 코딩 내용을 이용하므로 그 책임은 SAS에서 일정 부분 책임을 지게 된다. 그러한 이유로 비용이 많이 요구되더라도 SAS의 사용이 계속되고 있다.?
과학은 크게 자연 과학과 사회 과학으로 나누어지며 이러한 분야에서 만들어질 수 있는 자료는 특성에 많은 차이가 있다. 이에 통계 방법은 특정 분야에 특성화된 방법만을 적용할 수 있는 것이 아니라 어느 방법이나 수집된 자료의 특성에 따라 또, 설명하고자 하는 목적에 따라 통계 방법을 적용하여 적절하게 적용해야 한다. 이러한 이유로 각각 통계 방법에 대한 이해가 있어야 하며, 이해가 이루어지면 통계 방법을 적용하는데 자료의 특성에 따라 자료의 변환이라든지 처리 과정에서 부가되는 또 다른 절차가 있어야 함을 이해하게 된다.?
본서는 조금이나마 통계 방법의 원리를 설명하여 특정 자료에 대한 적절한 통계 방법의 적용을 위하여 노력하였다
최근에 통계 분석을 위한 많은 컴퓨터 프로그램(통계 패키지)들이 많이 제작되고 있다. SAS, SPSS 그리고 R 등 다양하게 존재하며 각 통계 패키지들의 특성에 따라 이용성이 다르지만 각 통계 패키지들은 거의 모든 형태의 자료에 대하여 해결 방안을 준다. 이들 통계 패키지들의 특성을 보면 SPSS는 메뉴 방식이 중심이기 때문에 첫 입문자들은 쉽게 느껴질 수 있으며, 간단한 통계에는 문제가 없지만 복잡한 분석에서는 별도의 코딩 방식을 따로 학습해야 한다. SAS 나 R은 코딩 방식이 주를 이루지만, 보다 자세하고 독특한 통계 분석을 할 수 있게 해준다. 또 SAS와 R의 비교는 같은 코딩 방식이 주를 이루지만 SAS는 사용에 비용이 많이 들고 R은 무료라는 것에 매력이 있다. 그러나 R의 코딩을 위해서는 통계 계산 과정을 잘 파악하여야 하며 만약 오류가 있는 코딩을 하였다면 통계 분석 결과에 책임 소재가 불분명하게 된다. 하지만 SAS는 이미 공인된 통계 패키지이고 SAS에서 제공하는 코딩 내용을 이용하므로 그 책임은 SAS에서 일정 부분 책임을 지게 된다. 그러한 이유로 비용이 많이 요구되더라도 SAS의 사용이 계속되고 있다.?
과학은 크게 자연 과학과 사회 과학으로 나누어지며 이러한 분야에서 만들어질 수 있는 자료는 특성에 많은 차이가 있다. 이에 통계 방법은 특정 분야에 특성화된 방법만을 적용할 수 있는 것이 아니라 어느 방법이나 수집된 자료의 특성에 따라 또, 설명하고자 하는 목적에 따라 통계 방법을 적용하여 적절하게 적용해야 한다. 이러한 이유로 각각 통계 방법에 대한 이해가 있어야 하며, 이해가 이루어지면 통계 방법을 적용하는데 자료의 특성에 따라 자료의 변환이라든지 처리 과정에서 부가되는 또 다른 절차가 있어야 함을 이해하게 된다.?
본서는 조금이나마 통계 방법의 원리를 설명하여 특정 자료에 대한 적절한 통계 방법의 적용을 위하여 노력하였다
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
본서는 다변량 분석을 위주로 작성되었으며, 통계분석의 과정에서 사용되는 Option들이 왜 필요한지를 이해할 수 있도록 저술하였다. 순수통계를 하시는 분들에게는 쉬운 이야기 이겠지만 우리와 같이 응용통계를 하는 사람들은 항상, 왜 이렇게 많은 Option 들이 필요한가 하는 의문이 많았을 것이다. 그러나 많은 Option은 각종 검정을 위한 것이고, 이 검정은 각 학문의 분야에 따라 사용이 다르다. 예문으로 작성된 특정 Option이 요구되지 않으면 삭제하고 실행을 하는 것이 가능하다. 또한, 작성된 Option 외에 요구된 Option이 있다면 SAS Option을 찾아 추가하여 실행하는 것도 가능하다. 세계적으로 대표되는 통계 패키지 SAS에는 요구되는 모든 것이 있다고 생각하면 될 것이다. 사용된 예문 자료는 SAS에서 제공하고 있는 자료와 본인이 접할 수 있는 자료를 사용하였다.
물론 사회과학과 자연과학으로 분야가 다를 수 있으나, 반복된 학습을 진행하면 해결될 것으로 생각된다. 최근에는 옛날과 다르게 사회과학, 자연과학의 경계가 없이 연구가 진행되는 실정이다. 특히 자연과학에서 사회과학에 많이 이용되던 형태의 자료가 많이 생성되는 실정이다.
조사하거나 실험을 하여 생성된 자료는 연구자 본인이 제일 잘 이해하고 있으므로, 본인이 통계 학습을 하여 직접 통계분석을 하는 것이 가장 좋은 분석 결과를 얻을 수 있다. 제공된 예문을 이용하여 반복되는 학습을 하고 내용을 잘 학습하면 통계라는 고비를 쉽게 넘길 수 있을 것으로 본다.
?
최근에는 인터넷의 발전으로 다변량에 대한 자료의 수집이 쉽게 되었다. 그러나 자료의 수집이 쉽게 되어도 이에 따른 통계분석이 이루어지지 않으면 설명할 수 없고, 자료의 이용이 불가능하게 된다. 또한, 최근에는 다변량 자료가 많이 제공되고 생성되기 때문에 다변량 분석 및 그에 따른 설명이 요구된다. 실험하여 자료를 얻는 자연과학에서는 예전과 다르게 실험 도구들의 발달로 다변량의 자료를 이용할 수 있게 되었다. 많은 자료를 가지고 통계분석을 통하여 그 결과에 대한 설명이 이루어질 때, 많은 신뢰성을 가지게 되는 것 또한 사실이다.?
본서는 이 SAS를 이용한 다변량 분석방법의 예문을 중심으로 한 설명과 분석 결과해석을 하고 이용 팁을 제공하였다.?
특별하게 본서를 학습하기 위해서는 기초적인 통계 개념과 SAS를 사용할 수 있는 능력을 다른 기초적인 도서를 통하여 학습을 진행한 후, 본서의 학습을 권장한다. 또한, 본서를 학습하는 방법은 예제의 내용을 충분히 이해하고 SAS를 통하여 꼭 실습이 요구된다.
?
물론 사회과학과 자연과학으로 분야가 다를 수 있으나, 반복된 학습을 진행하면 해결될 것으로 생각된다. 최근에는 옛날과 다르게 사회과학, 자연과학의 경계가 없이 연구가 진행되는 실정이다. 특히 자연과학에서 사회과학에 많이 이용되던 형태의 자료가 많이 생성되는 실정이다.
조사하거나 실험을 하여 생성된 자료는 연구자 본인이 제일 잘 이해하고 있으므로, 본인이 통계 학습을 하여 직접 통계분석을 하는 것이 가장 좋은 분석 결과를 얻을 수 있다. 제공된 예문을 이용하여 반복되는 학습을 하고 내용을 잘 학습하면 통계라는 고비를 쉽게 넘길 수 있을 것으로 본다.
?
최근에는 인터넷의 발전으로 다변량에 대한 자료의 수집이 쉽게 되었다. 그러나 자료의 수집이 쉽게 되어도 이에 따른 통계분석이 이루어지지 않으면 설명할 수 없고, 자료의 이용이 불가능하게 된다. 또한, 최근에는 다변량 자료가 많이 제공되고 생성되기 때문에 다변량 분석 및 그에 따른 설명이 요구된다. 실험하여 자료를 얻는 자연과학에서는 예전과 다르게 실험 도구들의 발달로 다변량의 자료를 이용할 수 있게 되었다. 많은 자료를 가지고 통계분석을 통하여 그 결과에 대한 설명이 이루어질 때, 많은 신뢰성을 가지게 되는 것 또한 사실이다.?
본서는 이 SAS를 이용한 다변량 분석방법의 예문을 중심으로 한 설명과 분석 결과해석을 하고 이용 팁을 제공하였다.?
특별하게 본서를 학습하기 위해서는 기초적인 통계 개념과 SAS를 사용할 수 있는 능력을 다른 기초적인 도서를 통하여 학습을 진행한 후, 본서의 학습을 권장한다. 또한, 본서를 학습하는 방법은 예제의 내용을 충분히 이해하고 SAS를 통하여 꼭 실습이 요구된다.
?
목차
목차
차례
서론 … 03
제1장 통계의 의미 … 13
1. 자료의 종류 … 14
1) 범주형 자료 … 14
2) 연속형 자료 … 14
3) Likert scale(리커트 척도) … 15
2. 하나의 변수에 대한 분석 - 기술적 통계량 … 15
3. 두 변수 사이에 대한 분석 … 16
4. 실험 설계 … 16
제2장 평균(Mean) … 18
1. 산술평균(Arithmetic mean) … 18
SAS 프로그램 2-1 … 19
결과 2-1 … 19
2. 기하평균(Geometric mean) … 19
SAS 프로그램 2-2 … 20
결과 2-2 … 20
3. 조화평균(Harmonic mean) … 20
SAS 프로그램 2-3 … 21
결과 2-3 … 21
4. 중앙값(Median) … 21
5. 최빈값(Mode) … 21
6. 대푯값(평균)들의 장단점 … 22
제3장 평균에 대한 검증 … 24
SAS 프로그램 3-1 … 25
결과 3-1 … 25
1. 표준편차와 표준오차 개념 … 26
2. 정규분포 … 27
1) 왜도(Skewness) … 27
2) 첨도(Kurtosis) … 27
SAS 프로그램 3-2 … 28
결과 3-2 … 29
SAS 프로그램 3-3 … 37
결과 3-3 … 37
?제4장 빈도 분석(Frequency analysis) … 40
1. 단일기준에 의한 적합도 검정 … 41
SAS 프로그램 4-1 … 41
결과 4-1 … 42
2. 복수기준에 의한 경우 … 44
1) 독립성 검정 … 44
SAS 프로그램 4-2-1 … 45
결과 4-2-1 … 45
2) 동질성 검정 … 46
SAS 프로그램 4-2-2 … 47
결과 4-2-2 … 48
제5장 상관분석(Correlation) … 54
SAS 프로그램 5 … 55
결과 5 … 55
제6장 T 검정(T-Test) … 60
1. 대응하고 있지 않은 경우의 T 검정 … 60
SAS 프로그램 6-1 … 60
결과 6-1 … 61
2. 대응하고 있는 T 검정 … 63
SAS 프로그램 6-2 … 63
결과 6-2 … 63
※ 자료 처리에 도움이 되는 사항 … 66
SAS 프로그램 ※ … 66
결과 ※ … 67
?제7장 분산분석 (Analysis of Variance) … 68
1. 분산분석 … 68
SAS 프로그램 7 … 69
결과 7 … 70
2. 각 사후검정 방법의 특징 … 74
1) LSD (Least Significant Difference) 검정법 … 74
2) Tukey 검정법 … 74
3) Duncan 검정법 … 75
4) Scheffe 검정법 … 75
5) 처리 평균 간에 다중비교에서 각 방법에 따른 차이 비교 … 75
6) 검정 방법에 따라 다른 최소유의범위 차이로 인한 Grouping 차이 … 77
7) 처리구의 추가, 삭제가 특정 처리 간 유의성에 미치는 영향 … 78
제8장 난괴법(Randomized block design) … 83
SAS 프로그램 8 … 83
결과 8 … 84
제9장 요인실험법(Factorial experiments)(다원 ANOVA) … 86
1. 2개 수준 처리(Two Way ANOVA) … 86
SAS 프로그램 9-1 … 87
결과 9-1 … 88
2. 3개 수준 차리(Three Way ANOVA) … 90
1) ANOVA를 이용한 분석 … 92
SAS 프로그램 9-2-1 … 92
결과 9-2-1 … 93
2) GLM을 이용한 분석 … 95
SAS 프로그램 9-2-2 … 95
결과 9-2-2 … 96
제10장 회귀분석(Regression analysis) … 101
1. 단순 회귀분석(Simple regression) … 101
SAS 프로그램 10-1 … 102
결과 10-1 … 103
※ 복합적 처리 … 105
2. 2차식 이상으로 표현되는 곡선 회귀 … 106
SAS 프로그램 10-2 … 107
결과 10-2 … 108
3. 비선형 회귀(Nonlinear regression) … 111
SAS 프로그램 10-3 … 111
결과 10-3 … 112
4. 다중회귀(Multiple regression) … 115
SAS 프로그램 10-4 … 115
결과 10-4 … 116
※ 변수선택방법 … 118
SAS 프로그램 ※ … 118
결과 ※ … 119
5. 경로 분석(PATH analysis) … 124
SAS 프로그램 10-5 … 125
결과 10-5 … 126
6. Multiple regression과 PATH analysis의 관계 … 133
1) Multiple regression 풀이 … 133
SAS 프로그램 10-6-1 … 133
결과 10-6-1 … 134
2) PATH analysis 풀이 … 134
SAS 프로그램 10-6-2 … 134
결과 10-6-2 … 134
7. 경로 분석의 직접 효과와 간접 효과 … 136
SAS 프로그램 10-7-1 … 136
결과 10-7-1 … 137
SAS 프로그램 10-7-2 … 139
결과 10-7-2 … 139
SAS 프로그램 10-7-3 … 140
결과 10-7-3 … 141
※ 경로 분석에서 유의성 검정 … 143
※ 경로 분석의 다양한 예 … 144
?제11장 군집 분석(CLUSTER analysis) … 146
SAS 프로그램 11-1 … 146
결과 11-1 … 147
1. 군집이 되어가는 과정 … 154
2. 표준화(Standardization) … 160
SAS 프로그램 11-2 … 160
결과 11-2 … 161
① 표준화하지 않은 경우의 자료 … 161
② 표준화한 경우의 자료 … 162
3. CLUSTER 사이의 유의성 검정 … 163
1) 표준화하지 않고 군집분석을 한 경우 … 163
SAS 프로그램 11-3-1 … 163
결과 11-3-1 … 165
2) 표준화한 후 군집분석을 한 경우 … 184
SAS 프로그램 11-3-2 … 184
결과 11-3-2 … 186
3) 최종 완성된 table … 206
제12장 주성분 분석 (Principal Component Analysis) … 208
SAS 프로그램 12-1 … 209
결과 12-1 … 209
1. Factor 항목의 신뢰도 분석 … 218
SAS 프로그램 12-2 … 218
결과 12-2 … 219
SAS 프로그램 12-3 … 228
결과 12-3 … 228
제13장 판별분석(Discriminant analysis) … 232
SAS 프로그램 13 … 232
결과 13 … 234
서론 … 03
제1장 통계의 의미 … 13
1. 자료의 종류 … 14
1) 범주형 자료 … 14
2) 연속형 자료 … 14
3) Likert scale(리커트 척도) … 15
2. 하나의 변수에 대한 분석 - 기술적 통계량 … 15
3. 두 변수 사이에 대한 분석 … 16
4. 실험 설계 … 16
제2장 평균(Mean) … 18
1. 산술평균(Arithmetic mean) … 18
SAS 프로그램 2-1 … 19
결과 2-1 … 19
2. 기하평균(Geometric mean) … 19
SAS 프로그램 2-2 … 20
결과 2-2 … 20
3. 조화평균(Harmonic mean) … 20
SAS 프로그램 2-3 … 21
결과 2-3 … 21
4. 중앙값(Median) … 21
5. 최빈값(Mode) … 21
6. 대푯값(평균)들의 장단점 … 22
제3장 평균에 대한 검증 … 24
SAS 프로그램 3-1 … 25
결과 3-1 … 25
1. 표준편차와 표준오차 개념 … 26
2. 정규분포 … 27
1) 왜도(Skewness) … 27
2) 첨도(Kurtosis) … 27
SAS 프로그램 3-2 … 28
결과 3-2 … 29
SAS 프로그램 3-3 … 37
결과 3-3 … 37
?제4장 빈도 분석(Frequency analysis) … 40
1. 단일기준에 의한 적합도 검정 … 41
SAS 프로그램 4-1 … 41
결과 4-1 … 42
2. 복수기준에 의한 경우 … 44
1) 독립성 검정 … 44
SAS 프로그램 4-2-1 … 45
결과 4-2-1 … 45
2) 동질성 검정 … 46
SAS 프로그램 4-2-2 … 47
결과 4-2-2 … 48
제5장 상관분석(Correlation) … 54
SAS 프로그램 5 … 55
결과 5 … 55
제6장 T 검정(T-Test) … 60
1. 대응하고 있지 않은 경우의 T 검정 … 60
SAS 프로그램 6-1 … 60
결과 6-1 … 61
2. 대응하고 있는 T 검정 … 63
SAS 프로그램 6-2 … 63
결과 6-2 … 63
※ 자료 처리에 도움이 되는 사항 … 66
SAS 프로그램 ※ … 66
결과 ※ … 67
?제7장 분산분석 (Analysis of Variance) … 68
1. 분산분석 … 68
SAS 프로그램 7 … 69
결과 7 … 70
2. 각 사후검정 방법의 특징 … 74
1) LSD (Least Significant Difference) 검정법 … 74
2) Tukey 검정법 … 74
3) Duncan 검정법 … 75
4) Scheffe 검정법 … 75
5) 처리 평균 간에 다중비교에서 각 방법에 따른 차이 비교 … 75
6) 검정 방법에 따라 다른 최소유의범위 차이로 인한 Grouping 차이 … 77
7) 처리구의 추가, 삭제가 특정 처리 간 유의성에 미치는 영향 … 78
제8장 난괴법(Randomized block design) … 83
SAS 프로그램 8 … 83
결과 8 … 84
제9장 요인실험법(Factorial experiments)(다원 ANOVA) … 86
1. 2개 수준 처리(Two Way ANOVA) … 86
SAS 프로그램 9-1 … 87
결과 9-1 … 88
2. 3개 수준 차리(Three Way ANOVA) … 90
1) ANOVA를 이용한 분석 … 92
SAS 프로그램 9-2-1 … 92
결과 9-2-1 … 93
2) GLM을 이용한 분석 … 95
SAS 프로그램 9-2-2 … 95
결과 9-2-2 … 96
제10장 회귀분석(Regression analysis) … 101
1. 단순 회귀분석(Simple regression) … 101
SAS 프로그램 10-1 … 102
결과 10-1 … 103
※ 복합적 처리 … 105
2. 2차식 이상으로 표현되는 곡선 회귀 … 106
SAS 프로그램 10-2 … 107
결과 10-2 … 108
3. 비선형 회귀(Nonlinear regression) … 111
SAS 프로그램 10-3 … 111
결과 10-3 … 112
4. 다중회귀(Multiple regression) … 115
SAS 프로그램 10-4 … 115
결과 10-4 … 116
※ 변수선택방법 … 118
SAS 프로그램 ※ … 118
결과 ※ … 119
5. 경로 분석(PATH analysis) … 124
SAS 프로그램 10-5 … 125
결과 10-5 … 126
6. Multiple regression과 PATH analysis의 관계 … 133
1) Multiple regression 풀이 … 133
SAS 프로그램 10-6-1 … 133
결과 10-6-1 … 134
2) PATH analysis 풀이 … 134
SAS 프로그램 10-6-2 … 134
결과 10-6-2 … 134
7. 경로 분석의 직접 효과와 간접 효과 … 136
SAS 프로그램 10-7-1 … 136
결과 10-7-1 … 137
SAS 프로그램 10-7-2 … 139
결과 10-7-2 … 139
SAS 프로그램 10-7-3 … 140
결과 10-7-3 … 141
※ 경로 분석에서 유의성 검정 … 143
※ 경로 분석의 다양한 예 … 144
?제11장 군집 분석(CLUSTER analysis) … 146
SAS 프로그램 11-1 … 146
결과 11-1 … 147
1. 군집이 되어가는 과정 … 154
2. 표준화(Standardization) … 160
SAS 프로그램 11-2 … 160
결과 11-2 … 161
① 표준화하지 않은 경우의 자료 … 161
② 표준화한 경우의 자료 … 162
3. CLUSTER 사이의 유의성 검정 … 163
1) 표준화하지 않고 군집분석을 한 경우 … 163
SAS 프로그램 11-3-1 … 163
결과 11-3-1 … 165
2) 표준화한 후 군집분석을 한 경우 … 184
SAS 프로그램 11-3-2 … 184
결과 11-3-2 … 186
3) 최종 완성된 table … 206
제12장 주성분 분석 (Principal Component Analysis) … 208
SAS 프로그램 12-1 … 209
결과 12-1 … 209
1. Factor 항목의 신뢰도 분석 … 218
SAS 프로그램 12-2 … 218
결과 12-2 … 219
SAS 프로그램 12-3 … 228
결과 12-3 … 228
제13장 판별분석(Discriminant analysis) … 232
SAS 프로그램 13 … 232
결과 13 … 234
저자
저자
강다래
ㆍ 전북대학교 농업생명과학대학 동물생명공학과 학석사
ㆍ 전북대학교 농업생명과학대학 동물생명공학과 박사
ㆍ 현) 전북대학교 농업생명과학대학 동물생명공학과 교수
ㆍ 전북대학교 농업생명과학대학 동물생명공학과 박사
ㆍ 현) 전북대학교 농업생명과학대학 동물생명공학과 교수
Payment & Security
Payment methods
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.
$99 이상 무료 배송
3% 리워드 크레딧 적립
Secure Payment

