2024. 4. 1. 23:17ㆍDATA/BIGDATA
포아송 분포는 특정 시간 동안 또는 특정 공간 내에서 발생하는 사건의 횟수를 모델링하는 확률 분포이다. 이 분포는 이산 확률 분포로, 각 사건이 서로 독립적으로 발생하고 발생률(사건이 발생하는 평균 빈도)이 일정한 경우에 사용된다.
포아송 분포의 확률 질량 함수(probability mass function, PMF)는 다음과 같다:
\[ P(X=k) = \frac{{e^{-\lambda} \cdot \lambda^k}}{{k!}} \]
여기서:
- \( k \)는 발생하는 사건의 수를 나타낸다.
- \( \lambda \)는 단위 시간 또는 단위 공간당 평균 사건의 수를 나타낸다.
포아송 분포는 주로 특정 기간 동안의 도착 횟수, 사고 발생 횟수, 고객의 도착 횟수 등을 모델링하는 데 사용된다.
1시간 동안 도로 위에서 발생하는 사고 횟수, 1일 동안 인터넷에서 이메일을 받는 횟수 등을 포아송 분포로 모델링할 수 있다.
■ 전제조건
포아송 분포를 적용하기 위한 일반적인 전제조건은 사건이 발생하는 시간이나 공간이 일정한 간격으로 분리되어야 한다.
즉, 시간 또는 공간은 연속적으로 흐르거나 이어져야 하며 사건이 평균적으로 매 시간마다 5건 발생한다고 가정하면, 이 평균 비율은 시간이 지남에 따라 변하지 않아야 한다.
또, 한 시간 또는 한 공간에서 발생한 사건이 다른 시간 또는 공간에서 발생한 사건에 영향을 주지 않아야 한다. 각 사건은 서로 독립적이어야 하고 사건 발생률이 낮은 경우에도 사용할 수 있지만, 평균 사건 발생률이 일정하고 발생 가능성이 있는 모든 사건이 포함되어야 한다.
'DATA > BIGDATA' 카테고리의 다른 글
베르누이 분포의 확률 질량 함수 (0) | 2024.04.01 |
---|---|
기하 분포의 확률 질량 함수 (0) | 2024.04.01 |
기술 통계량(Descriptive Statitistics) (0) | 2024.04.01 |
앙상블 Ensemble method (0) | 2024.03.31 |
TF-IDF 변환 Transform Frequency-Inverse Document Frequency (0) | 2024.03.31 |