2024. 9. 6. 17:49ㆍDATA/BIGDATA
카이제곱(χ²) 검정은 범주형 데이터를 분석하는 데 사용되며, 주로 관찰된 빈도와 기대되는 빈도 사이의 차이가 통계적으로 유의한지 평가하는 데 사용된다.
카이제곱 검정의 두 가지 주요 유형 :
1. 적합도 검정(Goodness-of-Fit Test): 한 범주형 변수의 관찰 빈도 분포가 기대되는 이론적 분포와 일치하는지 확인.
2. 독립성 검정(Test of Independence): 두 범주형 변수 간의 독립성을 평가.
1. 카이제곱 검정 통계량 식
카이제곱 검정 통계량(χ²)은
\[
\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}
\]
- Oᵢ: 관찰된 빈도(Observed Frequency)
- Eᵢ: 기대되는 빈도(Expected Frequency)
- i: 각 범주의 인덱스
관찰된 빈도와 기대되는 빈도의 차이를 각 범주에 대해 제곱한 뒤, 기대 빈수로 나누어 그 값을 모두 더하고 결과적으로 카이제곱 검정 통계량은 관찰된 데이터가 기대와 얼마나 다른지를 나타낸다.
카이제곱 검정을 사용하는 이유
카이제곱 검정은 범주형 데이터 간의 관계를 검정하거나, 특정 분포와의 적합성을 평가할 때 사용되어 데이터의 패턴이나 변수 간의 상관관계가 단순한 우연에 의한 것인지, 아니면 실제로 유의한 차이가 있는지 파악할 수 있다.
사용 목적:
- 적합도 검정: 한 범주의 분포가 기대된 분포와 일치하는지 확인.
- 독립성 검정: 두 범주형 변수가 서로 독립적인지, 또는 상관관계가 있는지 검정.
'DATA > BIGDATA' 카테고리의 다른 글
UTC와 KST (1) | 2024.11.27 |
---|---|
Mongodb 설치 (3) | 2024.11.14 |
결정계수 (R²) (0) | 2024.09.05 |
회귀분석에서 가설 검정 (0) | 2024.09.05 |
표본상관계수 (0) | 2024.09.04 |