기하 분포의 확률 질량 함수

2024. 4. 1. 23:27DATA/BIGDATA

반응형

 

 

 

확률 질량 함수(probability mass function, PMF)는 이산 확률 변수에서 각각의 값에 대한 확률을 제공하는 함수이다. 이산 확률 변수는 유한한 값 만을 가질 수 있다. 확률 질량 함수는 이러한 이산 확률 변수의 각 값에 대해 확률을 할당하여 확률 분포를 나타낸다.

확률 질량 함수는 주어진 확률 변수 \( X \)의 값 \( x \)에 대해 \( P(X=x) \)로 정의된다. 따라서, 이 함수는 가능한 모든 \( x \)에 대해 확률을 할당하는 역할을 한다.

 

기하 분포의 경우 확률 질량 함수는 각 시행에서의 성공 확률 \( p \)와 첫 번째 성공까지의 시행 횟수 \( k \)를 고려하여 첫 번째 성공까지의 시행 횟수가 \( k \)일 확률이다.



\[ P(X=k) = (1-p)^{k-1} \times p \]

 


- \( p \)는 각 독립 시행에서 성공할 확률이다.
- \( k \)는 첫 번째 성공까지 시도한 횟수를 나타낸다. \( k \)는 1 이상의 정수여야 한다. 

기하 분포는 주어진 확률 \( p \)로 첫 번째 성공까지의 시행 횟수를 모델링하는 확률 분포이다. \( k \)번째 시행에서 처음 성공하는 경우를 성공하고, 그 이전 \( k-1 \)번의 시행에서는 실패하는 것을 고려한다. 이 공식은 첫 번째 성공까지의 시행 횟수가 \( k \)번째일 확률을 나타낸다.

 

 

동전을 던져 앞면이 나올 확률이 \( p = 0.5 \)로 주어졌다고 가정하면. 이 때, 기하 분포의 확률 질량 함수에 대입하여 특정 횟수에서 성공할 확률을 계산할 수 있다.

첫 번째 앞면이 나오는 시행 횟수가 3번일 때, 즉 \( k = 3 \)인 경우

확률 질량 함수에 \( p = 0.5 \)와 \( k = 3 \)을 대입하여 계산한다:

\[ P(X=3) = (1-0.5)^{3-1} \times 0.5 \]

\[ P(X=3) = (0.5)^{2} \times 0.5 \]

\[ P(X=3) = 0.25 \times 0.5 \]

\[ P(X=3) = 0.125 \]

따라서, 첫 번째 앞면이 나오는 시행 횟수가 3번일 확률은 0.125 또는 12.5%이다.

반응형

'DATA > BIGDATA' 카테고리의 다른 글

표본 분산(Sample Variance)  (0) 2024.04.01
베르누이 분포의 확률 질량 함수  (0) 2024.04.01
포아송 분포(Poisson distribution)  (1) 2024.04.01
기술 통계량(Descriptive Statitistics)  (0) 2024.04.01
앙상블 Ensemble method  (0) 2024.03.31