누적 분포 함수

확률론에서, 누적 분포 함수(累積分布函數, 영어: cumulative distribution function, 약자 cdf)는 주어진 확률 변수가 특정 값보다 작거나 같은 확률을 나타내는 함수이다.

정의편집

확률 공간  실수선   위의 보렐 가측 공간   사이의 확률 변수  (우연속) 누적 분포 함수  는 다음과 같다.

 

보다 일반적으로, 확률 공간  유클리드 공간   위의 보렐 가측 공간   사이의 확률 벡터  (우연속) 누적 분포 함수  는 다음과 같다.

 

위 정의에 등장하는 닫힌구간들을 열린구간으로 대체하면 좌연속 누적 분포 함수의 정의를 얻는다.

성질편집

필요 충분 조건편집

함수  에 대하여, 다음 두 조건이 서로 동치이다.

  •  는 어떤 확률 변수의 누적 분포 함수이다.
  •  증가 함수이자 우연속 함수이며, 또한  ,  이다.

보다 일반적으로, 함수  에 대하여, 다음 두 조건이 서로 동치이다.

  •  는 어떤 확률 벡터의 누적 분포 함수이다.
  • 다음 네 조건을 만족시킨다.
    • 만약  이며  이라면,  
    • 임의의  에 대하여,  
    • 임의의   에 대하여,  
    •  

이 경우 만약  이며  이라면,  임을 보일 수 있다.

확률 변수로 유도된 측도와의 관계편집

확률 변수  가 구간  에 속할 확률은 누적 분포 함수  를 통해

 

와 같이 나타낼 수 있다.  가 특정 실수  를 취할 확률은

 

이다.

보다 일반적으로, 확률 벡터   에 속할 확률은

 

이며,  을 취할 확률은

 

이다.

이산 확률 변수와 연속 확률 변수편집

 
이산 확률 분포, 연속 확률 분포, 이산적인 부분과 연속적인 부분이 모두 존재하는 분포에 대한 각각의 누적 분포 함수

확률 변수  에 대하여, 다음 두 조건이 서로 동치이다.

  •  이산 확률 변수이다.
  •  

특히, 만약  계단 함수라면,  연속 확률 변수이다. 그러나 그 역은 성립하지 않는다.

확률 변수  에 대하여, 다음 두 조건이 서로 동치이다.

특히, 만약  도함수  가 존재한다면, 이를  확률 밀도 함수라고 한다.

임의의 누적 분포 함수는 이산 확률 변수의 누적 분포 함수와 연속 확률 변수의 누적 분포 함수의 아핀 결합으로 나타낼 수 있다.

참고 문헌편집

외부 링크편집