푸아송 분포

(포아송 분포에서 넘어옴)

푸아송 분포(Poisson分布, 영어: Poisson distribution)는 확률론에서 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포이다.

푸아송 분포
확률 질량 함수
다양한 '"`UNIQ--postMath-00000001-QINU`"'에 대한 푸아송 분포의 모습
누적 분포 함수
기호 ,
매개변수
지지집합 0 이상의 정수
확률 질량
누적 분포

(이때 불완전 감마 함수, 바닥 함수)

기댓값
최빈값
분산
비대칭도
적률생성함수
특성함수

역사 편집

19세기에 시메옹 드니 푸아송이 1838년 저서 《민사 사건과 형사 사건 재판에서의 확률에 관한 연구 및 일반적인 확률 계산 법칙에 대한 서문》(프랑스어: Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés)[1]에서 최초로 사용하였다.

정의 편집

정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값 라고 했을 때, 그 사건이  회 일어날 확률은 다음과 같다.

 

여기서  자연상수이다.

특성 편집

  1. 어떤 단위구간(예, 1일)동안 이를 더 짧은 작은 단위의 구간(예: 1시간)로 나눌 수 있고 이러한 더 짧은 단위구간 중에 어떤 사건이 발생할 확률은 전체 척도 중에서 항상 일정해야 한다.
  2. 두 개 이상의 사건이 동시에 발생할 확률은 0에 가깝다.
  3. 어떤 단위구간의 사건의 발생은 다른 단위구간의 발생으로부터 독립적이다.
  4. 특정 구간에서의 사건 발생확률은 그 구간의 크기에 비례한다.
  5. 푸아송분포 확률 변수의 기댓값분산은 모두 λ이다.

응용 편집

다음과 같은 확률적인 문제를 알아내기 위해 쓰이고 있다.

  • 일정 주어진 시간 동안에 도착한 고객의 수
  • 1킬로미터 도로에 있는 흠집의 수
  • 일정 주어진 생산시간 동안 발생하는 불량 수
  • 하룻동안 발생하는 출생자 수
  • 어떤 시간 동안 톨게이트를 통과하는 차량의 수
  • 어떤 페이지 하나를 완성하는 데 발생하는 오타의 발생률
  • 어떤 특정 량의 방사선을 DNA에 쬐였을 때 발생하는 돌연변이의 수
  • 어떤 특정 면적의 다양한 종류의 나무가 섞여 자라는 삼림에서 소나무의 수
  • 어떤 특정 진도 이상의 지진이 발생하는 수

푸아송 가정에 어긋나는 사례 편집

  • 1분마다 학생회관에 도착할 학생들의 수는 푸아송 분포를 따르지 않을 수도 있다. 왜냐하면, 그 비율이 일정하지 않기 때문이다. (수업 중에는 그 비율이 낮고, 쉬는 시간에는 그 비율이 높을 것이다.) 또, 각 학생들의 도착 사건이 독립적이지 않다. (학생들은 보통 그룹지어서 이동하는 경향이 있다)
  • 매년 캘리포니아에서 진도 5의 지진 발생 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면 한 번의 지진이 그 다음 일어날 지진의 가능성에 영향을 끼치기 때문이다.
  • 집중 치료 병동의 환자들 중, 그 병동에서 보낼 날의 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면, 병동에서 하루도 지내지 않는 경우는 없기 때문이다. 이러한 경우 zero-truncated poisson distribution을 통한 모델링이 가능하다.
  • 한 번도 사건이 일어나지 않는 시간 간격의 수가 기본 푸아송 분포를 통해 예측된 것보다 더 많은 경우 (쉽게 생각하면 푸아송 분포에서 계산된 P(k=0)보다 더 높은 P(k=0)을 가지는 경우), zero-inflated 모델을 적용할 수 있다.

이항 분포와의 관계 편집

푸아송 분포는 이항 분포의 특수한 형태로 볼 수 있다.

 

이항분포를 따르는 위와 같은 확률변수 X에서, n이 대단히 크고 p가 대단히 작을 경우, 이 확률변수 X는 λ=np인 푸아송 분포로 근사할 수 있다.

예를 들어 DNA에 방사선을 쬐었을 때, 각 염기쌍이 돌연변이를 일으킬 확률은 각각 매우 작고 서로 독립적이다. 또한 하나의 DNA에는 많은 염기쌍이 있다. 따라서 DNA에 방사선을 쬐었을 때 발생하는 돌연변이의 개수는 푸아송 분포로 나타낼 수 있다.

 

같이 보기 편집

참고 문헌 편집

  1. Poisson, S.D. (1837). 《Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés》 (프랑스어). Paris, France: Bachelier. 

외부 링크 편집