산포도(degree of scattering)

통계 자료에서 흩어짐의 정도를 나타내는 수치. 분산도(分散度)라고도 한다.
일반적 으로 분산·표준편차(標準偏差)·불편분산(不偏分散)·평균편차·데이터 범위 등이 있다.
가장 많이 사용되는 것은 분산과 표준편차이다.
데이터를 , 평균값(
)/n을
라고 할 때, 데이터가 평균값의 주위에 어느 정도 흩어져 있는가를 표시하는 척도, 즉
을 분산이라고 한다. 위의 식은
이 된다.
즉 분산을 계산하려면 데이터의 제곱의 평균값에서 을 빼면 된다.
분산의 제곱근을 표준편차라고 한다.
대략적으로 말하면 분산이 클 때에는 흩어짐이 크나, 극단적으로 빗나간 데이터가 있다면
그 외의 데이터의 흩어짐이 작다 해도 분산은 커진다.
을 n으로 나누는 대신 (n-1)로 나눈 것, 즉
을 불편분산이라 하며 모집단분포의 분산 v에 대한 불편추정량(不偏推定量)이 되므로 v가 미지일 때의 추정·검정에 많이 쓰인다.
또
를 평균편차라 하며 데이터의 최소값에서 최대값까지의 범위를 데이터범위라고 한다.

본 저작물은 공공누리 출처표시+상업적 이용금지 에 따라 이용할 수 있습니다.
- 다음
- 산학계몽 2010.08.17
- 이전
- 산패(rancidity) 2010.08.17
