APPLIED(24)
-
1종 오류(Type I Error), 2종 오류(Type II Error)
통계적 가설 검정 에서 귀무가설과 1종 오류(Type I Error), 그리고 2종 오류(Type II Error)□ 귀무가설 (Null Hypothesis): - 귀무가설은 일반적으로 연구자가 실험이나 조사를 시작할 때 특정 현상에 대해 처음에 설정하는 가설로, 효과가 없거나 차이가 없다는 가정을 나타내며 \( H_0 \)로 표기되며, 실험이나 연구의 결과를 비교할 기준점을 제공하여 실험 결과가 귀무가설 하에서 기대되는 결과와 얼마나 다른지를 평가함으로써 연구의 결과를 해석할 수 있다. 또, 귀무가설은 통계적 검정의 기본 가정으로 사용된다. 연구자는 귀무가설이 참이라고 가정하고 데이터를 분석한 후, 이를 바탕으로 귀무가설을 기각할 수 있는지 여부를 판단한다. 이 과정에서 p-값(p-value)이..
2024.03.23 -
공분산 Covariance , 공분산 행렬 Thecovariance matrix 그리고 상관계수 CorrelationCoefficient
공분산은 두 변수 간의 관계를 측정하는 통계량이며 두 변수가 함께 어떻게 변하는지를 나타내는데 사용된다. 정의두 변수 \(X\)와 \(Y\)의 공분산은 다음과 같이 계산된다. \[ \text{cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y}) \] 여기서 \(x_i\)는 변수 \(X\)의 관측값, \(y_i\)는 변수 \(Y\)의 관측값이며, \(\bar{x}\)와 \(\bar{y}\)는 각각 변수 \(X\)와 \(Y\)의 평균이다. \(n\)은 데이터 포인트의 수를 나타낸다. 어떤 학생들의 공부 시간과 성적 데이터를 가지고 있다고 하면 \(X\)를 공부 시간이라 하고, \(Y\)를 성적이라고 하면, \(X\)와 \(Y\)의 공..
2024.03.17 -
다변량 정규 분포 multivariate normal distribution - 평균 벡터, 공분산 행렬
다변량 정규 분포는 두 개 이상의 확률 변수가 정규 분포를 따르는 경우에 해당한다. 두 개 이상의 확률 변수는 각각의 확률 변수가 발생하는 사건의 관계나 종속성을 분석하고 모델링하는 데 사용되는데 종속성 또는 독립성을 가질 수 있으며 두 확률 변수가 독립적이라면, 하나의 확률 변수가 특정 사건에 영향을 미치지 않고 다른 확률 변수의 값이 발생할 수 있고 두 변수가 종속적이라면, 한 변수의 값이 다른 변수의 값에 영향을 줄 수 있다. 일변량 정규 분포는 하나의 변수가 정규 분포를 따르는 것을 의미하는 반면, 다변량 정규 분포는 여러 개의 변수가 동시에 정규 분포를 따르는 것을 의미하고 평균 벡터와 공분산 행렬을 사용하여 특징화된다. 여기서 평균 벡터는 각 변수의 평균값을 포함하는 벡터이고, 공분..
2024.03.17 -
신뢰 구간으로 필요한 표본 크기를 예측하기
- 인터넷 평균 사용시간에 대한 신뢰구간 하루 동안 인터넷을 사용하는 시간은 표준편차 1.5시간인 정규분포를 따른다고 할 때, 하루 평균 인터넷 사용시간에 대한95% 신뢰구간의 길이가 0.5시간 이하가 되도록 하는 데 필요한 최소의 표본크기를 구한다.여기서, - 신뢰구간의 길이는 0.5시간으로 주어졌다.- \( \sigma \)는 표준 편차로 주어졌으며, 1.5시간,- 신뢰구간의 길이가 주어진 조건인 0.5이하가 되도록 하는데 필요한 최소한의 표본 크기 \( n \) 을 구해야 한다. 모집단이 평균이 \( \mu \)이고 분산이 \( \sigma^2 \)인 정규분포를 따르는 확률표본 \( X_1, X_2, \ldots, X_n \)이 있다고 가정한다.모평균의 \( (1-\alpha) \times 100..
2024.03.10 -
이산확률변수의 기댓값
이산확률변수의 기댓값(expected value)은 각 확률 변수 값에 대한 확률 가중치를 곱하여 총합한 값으로, 해당 확률 변수의 평균값을 의미한다. \[ E[X] = \sum_{i} x_i \cdot P(X = x_i) \]여기서 \( x_i \)는 각각의 확률 변수 값이고, \( P(X = x_i) \)는 해당 확률 변수 값이 발생할 확률이다. 따라서 확률 변수의 모든 가능한 값에 대해 각 값의 확률을 곱하고 합산하여 기댓값을 계산한다., 동전을 한 번 던져 앞면이 나올 경우를 \( X = 1 \), 뒷면이 나올 경우를 \( X = 0 \)으로 정의할 때, 동전을 던질 때의 기댓값은 \[ E[X] = (1 \cdot P(X=1)) + (0 \cdot P(X=0)) \]만약 동전이 공정한 경우, 즉 ..
2024.02.19 -
가설검정
1.가설검정 모수의 값보다 모수의 범위를 추정하는 주장에 대해 확신하기 위한 검정법이다. 2. 대립가설과 귀무가설 -기존 진통제의 효과지속시간이 7.4 시간 -새롭게 개발한 진통제의 지속시간이 더 길다고 확신되면 신제품을 시판할 계획. -100명에게 테스트한 결과로 효과지속시간을 평가 새로운 진통제의 평균지속시간에서 검정하고자 하는 주장은 $ \mu\ $ >7.4 로 표시할 수 있다. 이 주장에 대하여 어느 정도의 확신을 가질 수 있을 것인지 타당성을 평거하는 주장을 대립가설 $ H_a $ alternative hypothesis 이라고 한다. 대립가설 $ H_a $ : $ \mu\ $ >7.4 대립가설에 포함되어 있지 않은 $ \mu\ $ 값들로 이루어진 가설을 null hypothesis 이라 하고 ..
2024.01.01