카이제곱 분포 (χ제곱分布, 영어 : chi-squared distribution ) 또는 χ2 분포 는
k
{\displaystyle k}
개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k를 자유도 라고 하며, 카이제곱 분포의 매개변수가 된다. 카이제곱 분포는 신뢰구간 이나 가설검정 등의 모델에서 자주 등장한다.
카이제곱 분포
확률 밀도 함수
누적 분포 함수
매개변수
자연수
k
{\displaystyle k}
: 자유도
지지집합
x ∈ [0, +∞)
확률 밀도
1
2
k
/
2
Γ
(
k
/
2
)
x
k
/
2
−
1
e
−
x
/
2
{\displaystyle {\frac {1}{2^{k/2}\Gamma (k/2)}}\;x^{k/2-1}e^{-x/2}}
누적 분포
1
Γ
(
k
/
2
)
γ
(
k
/
2
,
x
/
2
)
{\displaystyle {\frac {1}{\Gamma (k/2)}}\;\gamma (k/2,\,x/2)}
기댓값
k
{\displaystyle k}
중앙값
≈
k
(
1
−
2
9
k
)
3
{\displaystyle \approx k{\bigg (}1-{\frac {2}{9k}}{\bigg )}^{3}}
최빈값
max{ k − 2, 0 }
분산
2
k
{\displaystyle 2k}
비대칭도
8
/
k
{\displaystyle \scriptstyle {\sqrt {8/k}}}
첨도
12 / k
엔트로피
k
2
+
ln
(
2
Γ
(
k
/
2
)
)
+
(
1
−
k
/
2
)
ψ
(
k
/
2
)
{\displaystyle {\frac {k}{2}}\!+\!\ln(2\Gamma (k/2))\!+\!(1\!-\!k/2)\psi (k/2)}
적률생성함수
(
1
−
2
t
)
−
k
/
2
{\displaystyle (1-2\,t)^{-k/2}}
, 단
|
k
|
≤
1
/
2
{\displaystyle |k|\leq 1/2}
특성함수
(
1
−
2
i
t
)
−
k
/
2
{\displaystyle (1-2\,i\,t)^{-k/2}}
[ 1]
카이제곱 분포는 감마 분포 의 특수한 형태로 감마 분포 에서
k
=
ν
/
2
,
θ
=
2
{\displaystyle k=\nu /2,\theta =2}
인 분포를 나타낸다.
f
(
x
;
k
)
=
1
2
k
/
2
Γ
(
k
/
2
)
x
k
/
2
−
1
e
−
x
/
2
1
{
x
≥
0
}
{\displaystyle f(x;\,k)={\frac {1}{2^{k/2}\Gamma (k/2)}}\,x^{k/2-1}e^{-x/2}\,\mathbf {1} _{\{x\geq 0\}}}
카이제곱 분포의 확률밀도함수 는 다음과 같다.
f
(
x
;
k
)
=
1
2
k
/
2
Γ
(
k
/
2
)
x
k
/
2
−
1
e
−
x
/
2
1
{
x
≥
0
}
{\displaystyle f(x;\,k)={\frac {1}{2^{k/2}\Gamma (k/2)}}\,x^{k/2-1}e^{-x/2}\,\mathbf {1} _{\{x\geq 0\}}}
여기에서
Γ
(
k
/
2
)
{\displaystyle \Gamma (k/2)}
는 감마 함수 이다.
누적분포함수 는 다음과 같다.
F
(
x
;
k
)
=
γ
(
k
/
2
,
x
/
2
)
Γ
(
k
/
2
)
=
P
(
k
/
2
,
x
/
2
)
{\displaystyle F(x;\,k)={\frac {\gamma (k/2,\,x/2)}{\Gamma (k/2)}}=P(k/2,\,x/2)}
여기에서
γ
(
s
,
x
)
{\displaystyle \gamma (s,x)}
는 하부 불완전 감마 함수 이다.
비대칭도 는
8
/
k
{\displaystyle {\sqrt {8/k}}}
, 첨도 는
12
/
k
{\displaystyle 12/k}
이다. 따라서 k가 충분히 크지 않은 경우 카이제곱 분포를 중심극한정리 를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.
로널드 피셔 는
2
χ
k
2
{\displaystyle {\sqrt {2\chi _{k}^{2}}}}
를 정규분포로 근사하는 방법을 제안했다. 이때 평균은
2
k
−
1
{\displaystyle {\sqrt {2k-1}}}
, 분산은 1이 된다.
χ
k
2
/
k
3
{\displaystyle {\sqrt[{3}]{\chi _{k}^{2}/k}}}
를 정규분포로 근사할 수 있다. 평균은
1
−
2
/
(
9
k
)
{\displaystyle 1-2/(9k)}
, 분산은
2
/
(
9
k
)
{\displaystyle 2/(9k)}
가 된다.