|
10장 카이제곱 분포와 도수분석
2004/06/15 11:47
|
* 카이제곱 분포 : z2 (표준정규분포 제곱)의 합, 표본수 n개 반복한 경우 z2 의 합은 자유도가 n인 카이제곱 분포.
- [(관찰치-기대치)2 / 기대치]의 합
* 카이제곱의 응용
- 적합도 검정 (Tests of Goodness-of-Fit)
- 독립성 검정 (Tests of Independence)
- 동질성 검정 (Tests of Homogeneity)
* 적합도 검정
- 관찰분포가 미리 생각된 또는 가설상의 분포와 불일치하는지를 결정하고자 할 때 적절한 방법 => 우리의 data가 가설상의 분포(정규분포, 이항분포, 포아슨 분포 등)와 일치하는가?
- k-r의 자유도를 가진 카이제곱분포 ( r: 제약조건 + 추정하는 모수의 개수)
- 표본을 정규분포 모집단에서 추출하였다고 할 때 기대치와 관찰치의 차이가 너무 커서 그것이 우연한 차이라고 할 수 없게 되면 표본이 정규분포하는 집단에서 나온 것이 아니라고 결론 짓는다. 또한 그 차이가 우연히 생길 만한 정도라면 그 표본이 정규분포하는 모집단으로부터 나온 것이라고 결론짓는다. 가설상의 분포가 이항분포, 포아슨분포, 기타 다른 분포일 때에도 같은 방식으로 적합도 검정을 실시할 수 있다.
* 독립성 검정
- 자료를 분류하는 두 가지의 기준들이 서로 독립적인가하는 귀무가설을 검정하는 것.
- 어떤 하나의 기준에 의한 분포가 다른 기준의 분포에 관계없이 동일하다면 이 때의 두 가지 분류 방법은 서로 독립이라고 말한다.
- 분할표(contingency table) : 하나의 분류방법에 따른 r개의 행과 또 다른 분류방법에 따른 c개의 열로 구성된다.
- 자유도 : (r-1)(c-1)인 카이제곱에 가까운 분포
- 작은 기대도수 : 기대치 5미만의 cell수가 전체 20%를 넘지 않으며, 최소기대치가 1이상이면 무관하다.
- 2 X 2 분할표 : n<0 or 20<n<40일 때, 그리고 어느 한개의 기대도수가 5미만일 때는 카이제곱 검정을 하지말라...
* 동질성 검정
- 각 각의 모집단에서 독립적으로 뽑은 표본들의 분포가 서로 동질의 것인가?
- 하나의 기준에 따른 주변합을 고정, 다른 기준에 따라 분류되는 것은 확률적.
- 독립성 검정 : 한 모집단에서 표본 추출, 행과 열의 합계는 조절이 아니고 우연히 나타난다.
[출처] 10장 카이제곱 분포와 도수분석|작성자 보건돌이