2024. 3. 9. 13:50ㆍDATA/BIGDATA
- "P(Z <= 2)"는 표준 정규 분포에서 표준화된 값이 2보다 작거나 같은 확률이며 표준 정규 분포의 누적 분포 함수를 사용하여 \(Z\) 값이 -∞부터 2까지의 영역에서의 확률을 계산한다.
- "N(5, 2^2)"는 평균이 5이고 표준 편차가 2인 정규 분포를 나타낸다. 여기서 \(N\)은 정규 분포를 나타내며, \(N(\mu, \sigma^2)\)의 형태로 표현된다.
eg.
학생들의 시험 점수가 정규 분포를 따른다고 가정하고 평균 점수가 70, 표준 편차가 10인 경우 \( N(70, 10^2) \) 로 정규 분포를 나타낼 수 있다. 그리고 80점 이하인 학생들의 비율을 알고 싶다면, 정규 분포를 따르는 평균이 70이고 표준 편차가 10인 정규 분포를 표준화시켜 표준 정규 분포를 만들고 따라서, "P(Z <= z)"를 계산하여 특정 점수 이하의 학생들의 비율을 알 수 있다. 여기서 "z"는 표준화된 값이며, 80을 평균에서 뺀 후 표준 편차로 나눈 값이다.
특정 점수 \( x \)를 표준화
표준화된 값 \( z \)는
\( z = \frac{x - \mu}{\sigma} \)
여기서 \( x = 80 \), \( \mu = 70 \), \( \sigma = 10 \)을 대입하면,
\( z = \frac{80 - 70}{10} = 1 \)
표준 정규 분포 \( Z \)에서 확률 계산
표준 정규 분포에서 \( P(Z \leq z) \)는 \( z \) 값 이하의 확률을 나타내고 계산한 \( z \) 값은 1이기 때문에 \( P(Z \leq 1) \)를 구하면 된다. 표준 정규 분포에서 \( z \) 값이 1 이하일 확률은 약 0.8413이다.
따라서, 평균 70, 표준 편차 10인 정규 분포를 따르는 학생들 중 80점 이하인 학생들의 비율은 약 84.13%이다.
import scipy.stats as stats
# 평균과 표준 편차 설정
mu = 70
sigma = 10
x = 80
# 표준화된 값 계산
z = (x - mu) / sigma
# P(Z <= z) 계산
prob = stats.norm.cdf(z)
print(f"80점 이하인 학생들의 비율: {prob * 100:.2f}%")
import scipy.stats as stats
# 평균과 표준 편차 설정
mu = 70
sigma = 10
x = 80
# P(X <= 80) 계산
prob = stats.norm.cdf(x, loc=mu, scale=sigma)
print(f"80점 이하인 학생들의 비율: {prob * 100:.2f}%")
'DATA > BIGDATA' 카테고리의 다른 글
서열 척도 Ordinal scale와 등간 척도 Interval Scale (0) | 2024.03.19 |
---|---|
상관계수(Correlation Coefficient)와 선형관계(Linear Relationship) (0) | 2024.03.17 |
MMDB (1) | 2024.02.24 |
(GIS) 공간 데이터에서 Vector & Raster (0) | 2024.02.24 |
기업의 데이터와 수집 관리 (0) | 2024.02.24 |