카이제곱 검정

카이제곱 검정

2024. 9. 6. 17:49ㆍDATA/BIGDATA

카이제곱(χ²) 검정은 범주형 데이터를 분석하는 데 사용되며, 주로 관찰된 빈도와 기대되는 빈도 사이의 차이가 통계적으로 유의한지 평가하는 데 사용된다.

카이제곱 검정의 두 가지 주요 유형 :

1. 적합도 검정(Goodness-of-Fit Test): 한 범주형 변수의 관찰 빈도 분포가 기대되는 이론적 분포와 일치하는지 확인.
2. 독립성 검정(Test of Independence): 두 범주형 변수 간의 독립성을 평가.

1. 카이제곱 검정 통계량 식
카이제곱 검정 통계량(χ²)은
\[
\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}
\]

- Oᵢ: 관찰된 빈도(Observed Frequency)
- Eᵢ: 기대되는 빈도(Expected Frequency)
- i: 각 범주의 인덱스

관찰된 빈도와 기대되는 빈도의 차이를 각 범주에 대해 제곱한 뒤, 기대 빈수로 나누어 그 값을 모두 더하고 결과적으로 카이제곱 검정 통계량은 관찰된 데이터가 기대와 얼마나 다른지를 나타낸다.

카이제곱 검정을 사용하는 이유
카이제곱 검정은 범주형 데이터 간의 관계를 검정하거나, 특정 분포와의 적합성을 평가할 때 사용되어 데이터의 패턴이나 변수 간의 상관관계가 단순한 우연에 의한 것인지, 아니면 실제로 유의한 차이가 있는지 파악할 수 있다.

사용 목적:
- 적합도 검정: 한 범주의 분포가 기대된 분포와 일치하는지 확인.
- 독립성 검정: 두 범주형 변수가 서로 독립적인지, 또는 상관관계가 있는지 검정.

'DATA > BIGDATA' 카테고리의 다른 글

UTC와 KST (1)	2024.11.27
Mongodb 설치 (3)	2024.11.14
결정계수 (R²) (0)	2024.09.05
회귀분석에서 가설 검정 (0)	2024.09.05
표본상관계수 (0)	2024.09.04

JJ의메모장

JJ의메모장

태그

최근글

댓글

공지사항

아카이브

'DATA > BIGDATA' 카테고리의 다른 글

관련글

티스토리툴바