최대가능도 방법: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
잔글 Osteologia 사용자가 최대우도 문서를 최대가능도방법 문서로 옮겼습니다: 한국통계학회 용어집 선호 용어 사용 http://stat.anyang.ac.kr/sec/dic/wsearch_end.asp
편집 요약 없음
1번째 줄:
'''최대우도최대가능도방법''' (最大可能方法, {{llang|en|maximum likelihood estimation,method}}) 또는 '''MLE최대우도법'''(最大尤度法) 어떤 확률변수에서 [[표집]]한 값들을 토대로 그 확률변수의 [[모수]](母數, parameter)를 구하는 방법으로,방법이다. 어떤 모수가 주어졌을 때, 원하는 값들이 나올 확률([[우도 (통계)|우도가능도]])을 최대로 만드는 모수를 선택하는 방법이다. [[점추정]] 방식에 속한다.
 
== 방법 ==
어떤 모수 <math>\theta</math>로 결정되는 확률변수들의 모임 <math>D_\theta = (X_1, X_2, \cdots, X_n)</math>이 있고, <math>D_\theta</math>의 [[확률 밀도 함수]]나 [[확률 질량 함수]]가 <math>f</math>이고, 그 확률변수들에서 각각 값 <math>x_1, x_2, \cdots, x_n</math>을 얻었을 경우, 우도[[가능도]] <math>\mathcal{L}(\theta)</math>는 다음과 같다.
 
어떤 모수 <math>\theta</math>로 결정되는 확률변수들의 모임 <math>D_\theta = (X_1, X_2, \cdots, X_n)</math>이 있고, <math>D_\theta</math>의 [[확률 밀도 함수]]나 [[확률 질량 함수]]가 <math>f</math>이고, 그 확률변수들에서 각각 값 <math>x_1, x_2, \cdots, x_n</math>을 얻었을 경우, 우도 <math>\mathcal{L}(\theta)</math>는 다음과 같다.
:<math>\mathcal{L}(\theta) = f_{\theta}(x_1, x_2, \cdots, x_n)</math>
여기에서 우도를가능도를 최대로 만드는 <math>\theta</math>는
:<math>\widehat{\theta} = \underset{\theta}{\operatorname{argmax}}\ \mathcal{L}(\theta)</math>
가 된다.
줄 16 ⟶ 15:
 
== 예제: 가우스 분포 ==
[[평균]] <math>\mu</math>와 [[분산]] <math>\sigma^2</math>의 값을 모르는 [[가우스 분포정규분포]]에서 <math>x_1, x_2, \cdots, x_n</math>의 값을 표집하였을 때, 이 값들을 이용하여 원래 분포의 평균과 분산을 추측한다. 이 경우 구해야 하는 모수는 <math>\theta = (\mu, \sigma)</math>이다. 가우스[[정규분포]]의 분포의[[확률 확률밀도함수가밀도 함수]]가
 
[[평균]] <math>\mu</math>와 [[분산]] <math>\sigma^2</math>의 값을 모르는 [[가우스 분포]]에서 <math>x_1, x_2, \cdots, x_n</math>의 값을 표집하였을 때, 이 값들을 이용하여 원래 분포의 평균과 분산을 추측한다. 이 경우 구해야 하는 모수는 <math>\theta = (\mu, \sigma)</math>이다. 가우스 분포의 확률밀도함수가
:<math>f_{\mu, \sigma}(x_i) = \frac{1}{\sqrt{2 \pi} \sigma} \exp(\frac{-(x_i - \mu)^2}{2 \sigma^2})</math>
이고, <math>x_1, x_2, \cdots, x_n</math>가 모두 독립이므로
줄 23 ⟶ 21:
양변에 로그를 씌우면
:<math>\mathcal{L}^*(\theta) = -\frac{n}{2} \log{2\pi} - n \log \sigma - \frac{1}{2 \sigma^2} \sum_i {(x_i - \mu)^2}</math>
가 된다. 식의 값을 최대로 만드는최대화하는 모수를 찾기 위해, 양변을 <math>\mu</math>로 각각 편미분하여 0이 되는 값을 찾는다.
:<math>\frac{\partial}{\partial \mu} \mathcal{L}^*(\theta) = \frac{1}{\sigma^2} \sum_i (x_i - \mu)</math>
:<math>= \frac{1}{\sigma^2} (\sum_i x_i - n \mu)</math>
따라서 이 식을 0으로 만드는 값은 <math>\widehat \mu = (\sum_i x_i) / n</math>으로, 즉 표집한 값들의 평균이 된다. 마찬가지 방법으로 양변을 <math>\sigma</math>로 편미분하면
:<math>\frac{\partial}{\partial \sigma} \mathcal{L}^*(\theta) = -\frac{n}{\sigma} + \frac{1}{\sigma^3} \sum_i (x_i - \mu)^2</math>
따라서 이 식을 0으로 만드는 값은 다음과 같다.
:<math>\sigma^2 = \sum_i (x_i - \mu)^2 / n</math>이 된다.
 
[[분류:추정 이론]]