푸아송 분포
(포아송 분포에서 넘어옴)
푸아송 분포(Poisson分布, 영어: Poisson distribution)는 확률론에서 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포이다.
확률 질량 함수 | |
---|---|
누적 분포 함수 | |
기호 | , |
매개변수 | |
지지집합 | 0 이상의 정수 |
확률 질량 | |
누적 분포 | |
기댓값 | |
최빈값 | |
분산 | |
비대칭도 | |
적률생성함수 | |
특성함수 |
역사
편집19세기에 시메옹 드니 푸아송이 1838년 저서 《민사 사건과 형사 사건 재판에서의 확률에 관한 연구 및 일반적인 확률 계산 법칙에 대한 서문》(프랑스어: Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés)[1]에서 최초로 사용하였다.
정의
편집정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값을 라고 했을 때, 그 사건이 회 일어날 확률은 다음과 같다.
여기서 는 자연상수이다.
특성
편집응용
편집다음과 같은 확률적인 문제를 알아내기 위해 쓰이고 있다.
푸아송 가정에 어긋나는 사례
편집- 1분마다 학생회관에 도착할 학생들의 수는 푸아송 분포를 따르지 않을 수도 있다. 왜냐하면, 그 비율이 일정하지 않기 때문이다. (수업 중에는 그 비율이 낮고, 쉬는 시간에는 그 비율이 높을 것이다.) 또, 각 학생들의 도착 사건이 독립적이지 않다. (학생들은 보통 그룹지어서 이동하는 경향이 있다)
- 매년 캘리포니아에서 진도 5의 지진 발생 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면 한 번의 지진이 그 다음 일어날 지진의 가능성에 영향을 끼치기 때문이다.
- 집중 치료 병동의 환자들 중, 그 병동에서 보낼 날의 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면, 병동에서 하루도 지내지 않는 경우는 없기 때문이다. 이러한 경우 zero-truncated poisson distribution을 통한 모델링이 가능하다.
- 한 번도 사건이 일어나지 않는 시간 간격의 수가 기본 푸아송 분포를 통해 예측된 것보다 더 많은 경우 (쉽게 생각하면 푸아송 분포에서 계산된 P(k=0)보다 더 높은 P(k=0)을 가지는 경우), zero-inflated 모델을 적용할 수 있다.
이항 분포와의 관계
편집푸아송 분포는 이항 분포의 특수한 형태로 볼 수 있다.
이항분포를 따르는 위와 같은 확률변수 X에서, n이 대단히 크고 p가 대단히 작을 경우, 이 확률변수 X는 λ=np인 푸아송 분포로 근사할 수 있다.
예를 들어 DNA에 방사선을 쬐었을 때, 각 염기쌍이 돌연변이를 일으킬 확률은 각각 매우 작고 서로 독립적이다. 또한 하나의 DNA에는 많은 염기쌍이 있다. 따라서 DNA에 방사선을 쬐었을 때 발생하는 돌연변이의 개수는 푸아송 분포로 나타낼 수 있다.
같이 보기
편집각주
편집- ↑ Poisson, S.D. (1837). 《Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés》 (프랑스어). Paris, France: Bachelier.
외부 링크
편집- Prokhorov, A.V. (2001). “Poisson distribution”. 《Encyclopedia of Mathematics》 (영어). Springer-Verlag. ISBN 978-1-55608-010-4.
- Weisstein, Eric Wolfgang. “Poisson distribution”. 《Wolfram MathWorld》 (영어). Wolfram Research.