분산: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
TedBot (토론 | 기여)
잔글 봇: 틀 이름 및 스타일 정리
편집 요약 없음
2번째 줄:
 
[[확률론]]과 [[통계학]]에서 어떤 [[확률변수]]의 '''분산'''(分散, {{llang|en|variance}}, {{출처|변량|날짜=2017-10-17}})은 그 확률변수가 [[기댓값]]으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자이다.<ref name="lee76">{{서적 인용|저자1=이재기|저자2=최석근|저자3=박경식|저자4=정성혁|제목=측량학1|출판사=형설출판사|판=2|날짜=2013|ibsn=978-89-472-7336-7|쪽=76}}</ref> 기댓값은 확률변수의 위치를 나타내고 분산은 그것이 얼마나 넓게 퍼져 있는지를 나타낸다. 분산보다는 분산의 [[제곱근]]인 [[표준편차]]가 더 자주 사용된다.
 
[[분산]](variance)은 관측값에서 [[평균]]을 뺀 값을 [[제곱]]하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다.
 
[[모 분산]](population variance) σ<sup>2</sup>은 [[모 집단]]의 분산이다. 관측값에서 [[모 평균]]을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다.
 
[[표본 분산]](sample variance) s<sup>2</sup>은 [[표본]]의 분산이다. 관측값에서 [[표본 평균]]을 빼고 제곱한 값을 모두 더한 것을 n-1로 나눈 것이다.
 
== 정의 ==