2024. 3. 23. 19:34ㆍAPPLIED/Statistics
통계적 가설 검정 에서 귀무가설과 1종 오류(Type I Error), 그리고 2종 오류(Type II Error)
□ 귀무가설 (Null Hypothesis):
- 귀무가설은 일반적으로 연구자가 실험이나 조사를 시작할 때 특정 현상에 대해 처음에 설정하는 가설로, 효과가 없거나 차이가 없다는 가정을 나타내며 \( H_0 \)로 표기되며, 실험이나 연구의 결과를 비교할 기준점을 제공하여 실험 결과가 귀무가설 하에서 기대되는 결과와 얼마나 다른지를 평가함으로써 연구의 결과를 해석할 수 있다.
또, 귀무가설은 통계적 검정의 기본 가정으로 사용된다. 연구자는 귀무가설이 참이라고 가정하고 데이터를 분석한 후, 이를 바탕으로 귀무가설을 기각할 수 있는지 여부를 판단한다. 이 과정에서 p-값(p-value)이나 신뢰구간(confidence interval) 등의 통계적 지표가 사용된다.
- 평균 비교: 두 집단의 평균이 동일하다는 가설 (예: "두 그룹의 시험 성적 평균은 차이가 없다" -> \( H_0: \mu_1 = \mu_2 \))
- 비율 비교: 두 집단의 비율이 동일하다는 가설 (예: "남성과 여성의 합격률은 차이가 없다" -> \( H_0: p_1 = p_2 \))
- 상관 관계: 두 변수 간의 상관 관계가 없다는 가설 (예: "키와 체중 사이에 상관 관계가 없다" -> \( H_0: \rho = 0 \))
귀무가설을 설정한 후, 데이터를 수집하고 통계적 검정을 수행하여 귀무가설을 기각할지 여부를 판단한다. 만약 검정 결과가 통계적으로 유의미하다면, 이는 귀무가설을 기각하고 대립가설(alternative hypothesis, \( H_1 \) 또는 \( H_A \))을 지지한다는 것을 의미한다. 대립가설은 보통 귀무가설과 반대되는 가설로, 효과나 차이가 있다고 주장한다. 실험에서 새로운 약물이 기존 약물보다 효과가 더 좋다고 주장하려면, 귀무가설은 "새로운 약물의 효과는 기존 약물과 동일하다"가 된다. 데이터를 분석한 결과 새로운 약물이 더 효과적이라는 증거가 충분하다면, 연구자는 귀무가설을 기각하고 대립가설을 채택하게 된다. 즉, 귀무가설은 연구의 출발점이자 비교 기준으로 사용되며, 효과나 차이가 없다는 가정을 바탕으로 통계적 검정을 통해 연구 결과를 해석하고 결론을 도출한다.
□ 1종 오류 (Type I Error):
- 1종 오류는 귀무가설이 참인데도 귀무가설 (Null Hypothesis, \( H_0 \)) 을 기각하여 실제로는 차이가 없는데 차이가 있다고 잘못 결론을 내리는 것이다.
어떤 약물의 효과를 실험한다고 가정할 때, 귀무가설은 "약물의 효과가 없다"는 것이다. 만약 실제로 약물의 효과가 없는데도 실험 결과가 유의미하게 나와서 "약물의 효과가 있다"고 결론을 내린다면, 이는 1종 오류가 발생한 것이다.
-1종 오류의 확률과 유의수준 (α)
유의수준은 통계적 검정을 통해 귀무가설을 기각할 때 허용하는 최대 오류 확률을 의미한다. 유의수준을 0.05(5%)로 설정한다면, 이는 귀무가설이 참인데도 이를 기각할 확률을 5%로 설정한 것이다.
- 유의수준 (α)
\[ \alpha = P(\text{1종 오류}) = P(\text{귀무가설이 참인데도 기각}) \]
1종 오류가 발생하면 연구의 신뢰성을 저하시킬 수 있다. 약물의 효과가 없는데도 효과가 있다고 잘못 결론을 내리면, 이는 환자에게 불필요한 약물을 투여하게 되기 때문에 1종 오류를 발생하지 않게 해야 한다.
□ 2종 오류 (Type II Error):
- 2종 오류는 귀무가설이 거짓인데도 귀무가설(Null Hypothesis, \( H_0 \))을 기각하지 못하고 채택하는 것을 의미한다. 실제로는 차이가 있지만 차이가 없다고 잘못 결론을 내리는 것이다. 2종 오류의 확률은 보통 베타(β)로 표기되며, 해당 효과를 찾아내지 못하는 확률로 해석된다.
- 1종 오류는 거짓 양성(False Positive)이고, 2종 오류는 거짓 음성(False Negative) 으로 통계적 가설 검정에서 잘못된 결론을 내릴 수 있는 가능성을 나타낸다.
- 귀무가설이 "약물의 효과가 없다"고 할 때 만약 실제로 약물의 효과가 있음에도 불구하고 실험 결과가 유의미하지 않게 나와서 "약물의 효과가 없다"고 결론을 내린다면, 이는 2종 오류가 발생한 것이다.
- 베타(β)
\[ \beta = P(\text{2종 오류}) = P(\text{귀무가설이 거짓인데도 기각하지 못함}) \]
- 2종 오류를 줄이기 위해 표본 크기 증가시켜 효과를 더 잘 검출할 수 있게 하여 2종 오류의 확률을 줄인다. 그리고 α와 β의 균형을 고려하여 유의수준을 신중하게 설정한다.
□ 1종 오류와 2종 오류의 관계
2종 오류는 실제로는 귀무가설이 거짓인데도 불구하고 이를 기각하지 못하는 오류이다. 실제로 효과나 차이가 존재하는데도 이를 발견하지 못하는 경우이다.
유의수준(α)을 낮추면 1종 오류의 확률이 줄어들지만, 동시에 2종 오류의 확률(β)은 증가할 수 있다. 따라서 연구자는 1종 오류와 2종 오류의 균형을 고려하여 유의수준을 설정해야 한다.
'APPLIED > Statistics' 카테고리의 다른 글
이원교차표 (0) | 2024.04.05 |
---|---|
표준오차 (0) | 2024.04.04 |
공분산 Covariance , 공분산 행렬 Thecovariance matrix 그리고 상관계수 CorrelationCoefficient (0) | 2024.03.17 |
다변량 정규 분포 multivariate normal distribution - 평균 벡터, 공분산 행렬 (0) | 2024.03.17 |
신뢰 구간으로 필요한 표본 크기를 예측하기 (0) | 2024.03.10 |