표준 편차

표준 편차(標準 偏差, 영어: standard deviation,SD)는 자료의 산포도를 나타내는 수치로, 분산의 양의 제곱근으로 정의된다. 표준편차가 작을수록 평균값에서 변량들의 거리가 가깝다.[1] 통계학확률에서 주로 확률의 분포, 확률변수 혹은 측정된 인구나 중복집합에 적용된다. 관례에 따라 모집단은 그리스문자로 표본은 영어 알파벳으로 표기하는데, 모집단의 표준편차는 (시그마)로, 표본의 표준편차는 (에스)로 나타낸다.[2]

각 밴드의 너비가 1 표준편차인 정규분포의 구상. 68-95-99.7 규칙 참고.
예측값 0과 표준편차 1을 나타낸 정규분포의 누적 확률.

편차(deviation)는 관측값에서 평균 또는 중앙값을 뺀 것이다.

분산(variance)은 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 개수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다.

표준 편차(standard deviation)는 분산을 제곱근한 것이다. 편차들(deviations)의 제곱합(SS, sum of square)에서 얻어진 값의 평균치인 분산의 성질로 부터 다시 제곱근해서 원래 단위로 만들어줌으로써 얻게된다.

모 표준 편차(population standard deviation) σ는 모집단의 표준 편차이다. 모 분산 σ2에 제곱근을 씌워서 구한다.

표본 표준 편차(sample standard deviation) s는 표본의 표준 편차이다. 표본 분산 s2에 제곱근을 씌워서 구한다.

정의편집

확률 변수 X기댓값   라 하자. 이 때 모집단 X의 표준편차  는 다음과 같이 정의한다.[3]

 

유도과정에서 기댓값의 성질이 사용되었다. 표준편차는 분산의 제곱근과 같은 의미를 가진다.

통계적 추정편집

동일 경중률인 경우편집

경중률이 동일한 경우 표본 내의 어떤 변인 x가 가지는 모집단에서 표본(sample)의 표준편차의 추정치 s는 다음과 같다.

 
  : 표본의 표준편차
  : 변인
  : 표본의 평균
  : 표본의 크기
  : 잔차

분모를 n-1로 나누는 이유는 분산을 계산할 때 모평균이 아닌 표본 평균을 사용했기 때문에 모집단의 편의 추정량(biased estimator)이 되므로, 분산이 불편 추정량(unbiased estimator)이 되도록 하기 위해서이다.[4] n-1을 자유도(degree of freedom)라고 본다.[5]

경중률이 다른 경우편집

경중률을 w라 할 때,  인 경우에는 표본(sample) 표준편차 s를 다음과 같이 구한다.[4]

 

같이 보기편집

각주편집

  1. 이재기; 최석근; 박경식; 정성혁 (2013). 《측량학1》 2판. 형설출판사. 76-77쪽. ISBN 978-89-472-7336-7. 
  2. “List of Probability and Statistics Symbols”. 《Math Vault》 (영어). 2020년 4월 26일. 2020년 8월 21일에 확인함. 
  3. 송성주, 전명식. 《수리통계학》. 자유아카데미. 57쪽. 
  4. 이재기; 최석근; 박경식; 정성혁 (2013). 《측량학1》 2판. 형설출판사. 77쪽. ISBN 978-89-472-7336-7. 
  5. 이재기; 최석근; 박경식; 정성혁 (2013). 《측량학1》 2판. 형설출판사. 76쪽. ISBN 978-89-472-7336-7.