카이제곱 분포

카이제곱 분포(χ제곱分布, 영어: chi-squared distribution) 또는 χ2 분포개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다. 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장한다.

카이제곱 분포
확률 밀도 함수
누적 분포 함수
매개변수 자연수 : 자유도
지지집합 x ∈ [0, +∞)
확률 밀도
누적 분포
기댓값
중앙값
최빈값 max{ k − 2, 0 }
분산
비대칭도
첨도 12 / k
엔트로피
적률생성함수 , 단
특성함수 [1]

카이제곱 분포는 감마 분포의 특수한 형태로 감마 분포에서 인 분포를 나타낸다.

정의

편집

양의 정수  가 주어졌다고 하고,  개의 독립적이고 표준정규분포를 따르는 확률변수  를 정의하자.

그렇다면 자유도 k의 카이제곱 분포확률변수

 

의 분포이다. 즉,   이다.

성질

편집

카이제곱 분포의 확률밀도함수는 다음과 같다.

 

여기에서  감마 함수이다.

누적분포함수는 다음과 같다.

 

여기에서  하부 불완전 감마 함수이다.

비대칭도 , 첨도 이다. 따라서 k가 충분히 크지 않은 경우 카이제곱 분포를 중심극한정리를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.

  • 로널드 피셔 를 정규분포로 근사하는 방법을 제안했다. 이때 평균은  , 분산은 1이 된다.
  •  를 정규분포로 근사할 수 있다. 평균은  , 분산은  가 된다.

각주

편집
  1. M.A. Sanders. “Characteristic function of the central chi-square distribution” (PDF). 2011년 7월 15일에 원본 문서 (PDF)에서 보존된 문서. 2009년 3월 6일에 확인함. 

같이 보기

편집