가우스-마르코프 정리

통계학에서 가우스-마르코프 정리(영어: Gauss–Markov theorem, 또는 일부 저자는 가우스 정리[1]라고 표기)는 선형 회귀 모형의 오차가 상관관계가 없고, 오차의 분산이 일정하며, 오차의 기대값이 0이며 설명변수가 외생변수일 때 보통 최소제곱 추정량(OLS)은 다른 선형 불편 추정량에 비하여 표본 분산이 가장 낮다고 명시한다.[2] 오차항이 정규분포를 따를 필요는 없다.

이 정리는 비록 가우스의 작품이 마르코프의 작품보다 현저히 앞섰지만 칼 프리드리히 가우스와 안드레이 마르코프의 이름을 따서 명명되었다.[3] 그러나 가우스가 독립성과 정규성을 가정하여 그 결과를 도출하는 동안 마르코프는 위에서 언급한 형식으로 가정들을 줄였다.[4] 비구형 오류에 대한 추가 일반화는 알렉산더 에이트켄에 의해 이루어졌다.[5]

선형 회귀 모델과 최소 제곱 추정 편집

선형 회귀 모델로서 목적 변수 Y와 p개의 설명 변수 Xi, i = 1, ..., p 및 오차항   의 관계를 다음과 같이 모델화한 것을 생각한다.

 

목적 변수 및 설명 변수 측정 결과의 조(yk; xk,1,...,xk,p)를 하나의 데이터로 하여 n( ≧ p)개의 데이터를 이용하여 잔차의 제곱합

 

가 최소가 되다 를 최소 제곱 추정량이라고 부른다.여기서

 

라고 놓으면 선형 회귀 모델은

 

라며, 최소 제곱 추정량 

 

으로 주어진다. 또한, 상부 첨자은 전치 행렬을 나타낸다.

가우스 마르코프의 정리 편집

가정 편집

오차항   에 대해서

  1.   (불편성)
  2.   (등분산성·무상관성)

를 가정한다. 여기서 는 단위 행렬을 나타낸다.

무상관성은 독립성보다도 약한 가정이며, 또 정규 분포 등 특정 분포를 따르는 것을 가정하고 있지 않다.

정리의 내용 편집

최소 제곱 추정량  는 최우수 선형 불편 추정량(best linear unbiased estimator, BLUE)이다. 즉 임의의 선형 불편 추정량  에 대해서

 

가 성립한다.

증명 편집

 는 선형 추정량이므로  행렬의 행렬 를 이용하여 고 하다.  가 불편성을 갖기 위한 조건을 요구하면  가 항등적으로 성립되기 때문에 이다.

다음에 의 분산 공분산 행렬을 정리하면

 

가 된다 여기서 라고 했을 때의 추정량이 최소 제곱 추정량 이 되기 때문에  을 나타내면 된다. 불편성보다 그래서

 

에 주의하면

 

가 성립한다. 따라서

 

가 성립하며, 최소 제곱 추정량 는 최우수 선형 불편 추정량이 된다.

각주 편집

  1. See chapter 7 of Johnson, R.A.; Wichern, D.W. (2002). 《Applied multivariate statistical analysis》 5. Prentice hall. 
  2. Theil, Henri (1971). 〈Best Linear Unbiased Estimation and Prediction〉. 《Principles of Econometrics》. New York: John Wiley & Sons. 119–124쪽. ISBN 0-471-85845-5. 
  3. Plackett, R. L. (1949). “A Historical Note on the Method of Least Squares”. 《Biometrika36 (3/4): 458–460. doi:10.2307/2332682. 
  4. David, F. N.; Neyman, J. (1938). “Extension of the Markoff theorem on least squares”. 《Statistical Research Memoirs》 2: 105–116. OCLC 4025782. 
  5. Aitken, A. C. (1935). “On Least Squares and Linear Combinations of Observations”. 《Proceedings of the Royal Society of Edinburgh》 55: 42–48. doi:10.1017/S0370164600014346.