기댓값(expected value)

2024. 4. 4. 17:49카테고리 없음

반응형

 

 

 

기댓값(expected value)은 확률 이론에서 주어진 사건이 발생할 것으로 예상되는 평균적인 값으로 주어진 확률분포에서 각 사건의 확률을 가중치로 사용하여 계산된다.

만약 확률 변수를 X라고 했을 때,

 

X가 이산형 확률 변수이면:

\([ E(X) = \sum_{i} x_i \cdot P(X=x_i) \)

  

 
- \( x_i \)는 이산형 확률 변수 \( X \)가 취할 수 있는 특정 값 
- \( P(X = x_i) \)는 확률 변수 \( X \)가 \( x_i \) 값을 가질 확률 

 

 주사위의 눈 \( X \)가 나올 확률 분포가 주어졌을 때, 주사위의 눈은 1부터 6까지의 값을 가지며, 각 눈이 나올 확률은 \( \frac{1}{6} \)이다.  기대값을 계산하면  

\[ E(X) = \sum_{i=1}^{6} x_i \cdot P(X = x_i) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = 3.5 \]

따라서, 주사위 눈의 기대값 \( E(X) \)는 3.5이다.

이산형 확률 변수의 기대값은 각 가능한 값과 그 값의 확률을 곱하여 합산함으로써 구할 수 있다.

 

 

 

 



연속형 확률 변수일 경우:

\( E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx \)

 

-  \( x_i \)는 이산형 확률 변수의 특정 값

- \( P(X=x_i) \)는 해당 값이 발생할 확률이다.

- \( f(x) \)는 연속형 확률 변수의 확률 밀도 함수 (Probability Density Function, PDF)

- \( x \)는 연속형 확률 변수 \( X \)가 취할 수 있는 값이다.

- 적분 구간 \(-\infty\)에서 \(\infty\)는 \( X \)가 취할 수 있는 모든 값을 포함한다.


 \( X \)가 평균이 \( \mu \)이고 분산이 \( \sigma^2 \)인 정규 분포를 따른다면,  

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]

  기대값 \( E(X) \)를 구하기 위한 적분 

\[ E(X) = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \, dx \]

 정규 분포를 따르는 연속형 확률 변수의 기대값은 그 평균값 \( \mu \)와 같다.

 

 

더보기

 

정규 분포의 확률 밀도 함수 

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]

기대값 \( E(X) \)는 다음과 같은 적분으로 정의된다:

\[ E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \, dx \]

이 적분을 풀기 위해, 변수 변환을 사용한다. \( u = \frac{x - \mu}{\sigma} \)로 치환하면 \( du = \frac{dx}{\sigma} \)가 된다. 따라서 \( dx = \sigma \, du \)이다.

변수 변환 후 적분식은  

\[ E(X) = \int_{-\infty}^{\infty} (\sigma u + \mu) \cdot \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{u^2}{2}} \sigma \, du \]

적분의 범위는 \( x \)가 \(-\infty\)에서 \(\infty\)까지일 때, \( u \) 역시 \(-\infty\)에서 \(\infty\)까지이다. 따라서 적분식은 다음과 같이 된다:

\[ E(X) = \int_{-\infty}^{\infty} (\sigma u + \mu) \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du \]

이제 적분을 두 개의 부분으로 나눈다:

\[ E(X) = \int_{-\infty}^{\infty} \sigma u \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du + \int_{-\infty}^{\infty} \mu \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du \]

각 부분을 따로따로 계산해  첫 번째 적분부터 계산하면:

\[ \int_{-\infty}^{\infty} \sigma u \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du \]

여기서, \( u \cdot e^{-\frac{u^2}{2}} \)는 기울기 \( 0 \)을 중심으로 대칭적인 함수이다. 즉, 이 함수의 적분값은 \( 0 \)이다.

따라서 첫 번째 적분은 0이다:

\[ \int_{-\infty}^{\infty} \sigma u \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du = 0 \]

두 번째 적분은 다음과 같다:

\[ \int_{-\infty}^{\infty} \mu \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du \]

여기서, \( \mu \)는 상수이므로 적분 밖으로 빼낼 수 있다:

\[ \mu \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{u^2}{2}} \, du \]

남은 적분은 표준 정규 분포의 확률 밀도 함수의 전체 면적으로, 그 값은 1이다. 따라서 두 번째 적분은 다음과 같다:

\[ \mu \cdot 1 = \mu \]

결과적으로, 연속형 확률 변수 \( X \)의 기대값 \( E(X) \)는 그 평균값 \( \mu \)와 같다:

\[ E(X) = \mu \]


 

 

 

 

 

 

 

□ eg.
 동전을 한 번 던질 때 앞면이 나올 확률이 0.5이고 뒷면이 나올 확률이 0.5라면, 동전을 한 번 던졌을 때 앞면이 나올 기댓값은 다음과 같이 계산된다:

\( E(X) = (1 \times 0.5) + (0 \times 0.5) = 0.5 \)

  동전을 한 번 던졌을 때 앞면이 나올 기댓값은 0.5이다.

 

 

 
□ eg.2


 두 가지 주식에 투자할 때 첫 번째 주식의 예상 수익률은 10%이고, 두 번째 주식의 예상 수익률은 8%이다. 각 주식에 투자할 비율은 60%와 40%이다. 예상 수익률?

 

 - 각 주식의 예상 수익률과 해당 주식에 투자할 비율을 고려하여 가중 평균을 구한다.

첫 번째 주식의 예상 수익률: 10%
두 번째 주식의 예상 수익률: 8%
첫 번째 주식에 투자할 비율: 60%  
두 번째 주식에 투자할 비율: 40% 

 

\[ E(\text{포트폴리오 수익률}) = (0.6 \times 0.10) + (0.4 \times 0.08) \]

여기서 계산을 해보면:

\[ E(\text{포트폴리오 수익률}) = 0.06 + 0.032 \]
\[ E(\text{포트폴리오 수익률}) = 0.092 \]

따라서, 이 두 주식에 대한 포트폴리오의 예상 수익률은 9.2%이다.
 

 

 

 

□ eg.3

 

동전을 세 번 던져서 앞면이 나오는 횟수를 나타내는 이산확률변수 \( X \) , 동전을 세 번 던질 때 앞면이 나올 횟수의 기댓값은?

 동전을 던질 때 앞면이 나올 확률은 \( P(X = 1) = P(X = 2) = P(X = 3) = \frac{1}{2} \)이다.

 이산확률변수 \( X \)의 기댓값 \( E(X) \)은 
\( E(X) = 1 \times P(X = 1) + 2 \times P(X = 2) + 3 \times P(X = 3) \)

\( = 1 \times \frac{1}{2} + 2 \times \frac{1}{2} + 3 \times \frac{1}{2} \)

\( = \frac{1}{2} + 1 + \frac{3}{2} \)

\( = \frac{1}{2} + 1 + \frac{3}{2} = 2 \)

따라서 동전을 세 번 던질 때 앞면이 나올 횟수의 기댓값은 2이다.

  
□ eg.4

 


 한 아파트의 거주자들의 평균 나이가 연속확률변수 \( Y \)

아파트 거주자들의 평균 나이가 30세이고, 표준편차가 5세인 정규분포를 따른다고 가정할 때, 아파트 거주자들의 평균 나이의 기댓값은?

 -  정규분포를 따르는 연속 확률 변수 \( Y \)의 기댓값 \( E(Y) \)을 구할 때, 주어진 평균값을 기댓값으로 사용할 수 있기 때문에 확률 변수 \( Y \)가 평균 \( \mu \)를 가진다면 \( E(Y) = \mu \)이다. 정규분포의 경우 기댓값은 분포의 중심에 해당하는 값이므로, 주어진 평균을 그대로 기댓값으로 사용하여 아파트 거주자들의 평균 나이의 기댓값은 30세이다.
 

 

 

 

 

□ eg.5

 

  공장에서 생산되는 제품의 불량률을 연속확률변수 \( X \)로 나타내고 \( X \)는 0부터 1 사이의 값을 가지며, 확률밀도함수 \( f(x) \)는 \( f(x) = 2x \) 이때, 제품의 불량률이 0.5보다 작을 확률, 즉 \( P(X < 0.5) \)은?

 

 

:
 확률밀도함수 \( f(x) = 2x \)를 가진 연속확률변수 \( X \)에 대해 \( P(X < 0.5) \)를 구해야 한다.

확률밀도함수를 사용하여 불량률이 0.5보다 작을 확률
\( P(X < 0.5) = \int_{0}^{0.5} f(x) \, dx \)

확률밀도함수가 \( f(x) = 2x \)로 주어졌으므로, 
\( = \int_{0}^{0.5} 2x \, dx \)


\( = \left( x^2 \right)_{0}^{0.5} = (0.5)^2 - (0)^2 = 0.25 \)

불량률이 0.5보다 작을 확률은 0.25이다.

 

 

 

 

 

 

 

■ 기댓값과 평균

 


기대값 (Expected Value)은 확률변수가 어떤 값을 가질 것으로 기대되는 평균적인 값으로 정의되의 각각의 값들이 나타날 확률과 그 값들의 가중평균을 계산하여 구한다. 

 확률분포가 이산형인 경우, 기대값은 이산확률변수의 평균과 동일하게 사용되지만 연속형 확률분포에서는 기대값과 평균이 정확히 일치하지 않을 수 있다. 

반응형