2024. 4. 5. 14:38ㆍDATA/BIGDATA
무작위 표본 추출과 인위적 표본 추출은 데이터 분석에서 사용되는 두 가지 다른 접근 방식을 나타낸다.
■ 확률적표본추출 (Probability Sampling)
-무작위 표본 추출 (Random Sampling) 이며 모집단에서 무작위로 표본을 선택하는 방법이다.
- 각 원소가 선택될 확률이 동일하며, 각 표본은 독립적으로 선택된다.
- 이러한 방식으로 선택된 표본은 모집단을 대표할 수 있는 특성을 갖게 된다.
- 무작위 표본 추출은 편향을 피하고 통계적 추론을 할 수 있는 신뢰할 수 있는 결과를 얻기 위해 많이 사용된다.
- 모든 모집단이 표본으로 추출될 가능성이 확률적으로 동일하다.
- 대표성 확보, 일반화 가능성, 표본 오차 추정이 가능하다
- 시간과 비용이 비확률적 표본 추출에 비해 많이 소요된다
■ 비확률적 표본 추출 (Nonprobability Sampling)
- 인위적 표본 추출 (Convenience Sampling 또는 Non-random Sampling) 대표성 확보, 일반화 가능성이 어려우며 표본 오차 추정이 불가능 하다.
- 시간과 비용이 확률적 표본 추출에 비해 적게 소요된다
- 편의 표본 추출 눈덩이 표본 추출이라고도 불린다
- 인위적 표본 추출은 조사자의 편의나 편향으로 인해 특정한 표본을 선택하는 방법이다.
- 일반적으로 연구자의 편의에 따라 모집단으로부터 접근성이 용이하고 편리한 방법을 통해 표본을 추출하는 방법이다.
- 이 방법은 표본 선택에 있어서 편리하거나 저렴한 방법을 사용할 때 주로 선택된다.
- 그러나 인위적 표본 추출은 편향이나 대표성 문제를 야기할 수 있으며, 통계적 추론을 하는 데 제한이 있을 수 있다.
- 일반적으로 공식적인 연구나 조사에서는 사용을 피하는 것이 좋다.
무작위 표본 추출은 데이터의 무작위성을 보장하여 통계적 추론을 할 때 유용하며, 인위적 표본 추출은 편의나 저렴함을 우선시할 때 사용되지만 결과의 신뢰성과 대표성에 대한 의문을 낳을 수 있다.
'DATA > BIGDATA' 카테고리의 다른 글
hive 환경설정 (0) | 2024.05.20 |
---|---|
hadoop 환경 설정 (0) | 2024.05.20 |
검정통계량(test statistic) (0) | 2024.04.04 |
Yeo-Johnson 변환(Yeo-Johnson Transformation) (0) | 2024.04.03 |
표본 분산(Sample Variance) (0) | 2024.04.01 |