
데이터 분포에서 분산지수는 매우 중요한 역할을 합니다. 이러한 측정은 데이터의 가변성을 특성화하여 소위 중앙 위치의 측정을 보완합니다.
그만큼 분산 지수 중심경향을 보완한다. 또한 데이터 배포에도 필수적입니다. 이는 가변성을 특징으로 하기 때문입니다. 통계 훈련과의 관련성은 Wild와 Pfannkuch(1999)에 의해 강조되었습니다.
데이터 변동성에 대한 인식은 평균과 관련하여 데이터 분산에 대한 정보를 제공하므로 통계적 사고의 기본 구성 요소 중 하나입니다.
평균의 해석
그만큼 산술 평균 실제로는 널리 사용되지만 종종 잘못 해석될 수 있습니다. 이는 변수 값이 매우 희박할 때 발생합니다. 이러한 경우에는 평균 분산 지수(2)를 동반해야 합니다.
분산 지수에는 무작위 변동성과 관련된 세 가지 중요한 구성 요소가 있습니다. (2):
- 우리 주변 세계의 편재성에 대한 인식.
- 설명을 위한 경쟁입니다.
- 이를 정량화하는 능력(이는 분산 개념을 적용하는 방법을 이해하고 아는 것을 의미함)

분산 지수는 무엇을 위해 사용됩니까?
모집단 표본의 데이터를 일반화해야 하는 경우 분산 지수는 우리가 작업하는 오류에 직접적인 영향을 미치기 때문에 매우 중요합니다. . 샘플에서 더 많은 분산을 수집할수록 동일한 오류로 작업하는 데 필요한 크기가 더 커집니다.
반면에 이러한 지수는 데이터가 중앙 값에서 멀리 떨어져 있는지 확인하는 데 도움이 됩니다. 그들은 이 중심 값이 연구 모집단을 대표하는 데 적합한지 여부를 알려줍니다. 이는 분포와 비교에 매우 유용합니다. 이해하다 의사 결정 과정의 위험 (1).
이러한 비율은 분포를 비교하고 의사 결정 시 위험을 이해하는 데 매우 유용합니다. 분산이 클수록 중심 값의 대표성이 떨어집니다. .
가장 많이 사용되는 것은 다음과 같습니다.
- 범위.
- 통계적 편차 .
- 변화.
- 표준 또는 일반 편차.
- 변동 계수.
분산 지수의 기능
범위
순위를 사용하는 것은 일차적인 비교를 위한 것입니다. 이런 식으로 두 가지 극단적인 관찰만 고려합니다. . 이것이 작은 샘플에만 권장되는 이유입니다(1). 변수의 마지막 값과 첫 번째 값(3)의 차이로 정의됩니다.

통계적 편차
평균 편차는 모든 사람이 산술 평균에서 동일한 거리에 있을 경우 데이터가 어디에 집중되는지를 나타냅니다(1). 우리는 변수 값의 편차를 해당 변수 값과 계열의 산술 평균 간의 절대값 차이로 간주합니다. 따라서 이는 편차의 산술 평균으로 간주됩니다(3).
변화
분산은 모든 값의 대수 함수입니다. 추론 통계 작업에 적합합니다(1). 이는 2차 편차(3)로 정의될 수 있습니다.
표준 또는 일반 편차
동일한 모집단에서 채취한 표본의 경우 표준 편차가 가장 많이 사용되는 것 중 하나입니다(1). 이는 분산(3)의 제곱근입니다.
변동 계수
서로 다른 단위로 측정된 두 데이터 세트 간의 변화를 비교하는 데 주로 사용되는 측정값입니다. 그리고. 예를 들어 키와 몸무게 샘플에 포함된 학생 수입니다. 이는 데이터가 가장 많이 밀집되어 있고 평균이 가장 대표적인 분포를 결정하는 데 사용됩니다(1).

변동계수는 추상적인 숫자이기 때문에 앞선 것보다 더 대표적인 분산지수이다. 다시 말해서 그것은 독립적이다 변수 값이 나타나는 단위로. 일반적으로 이 변동 계수는 백분율(3)로 표시됩니다.
분산 지수에 대한 결론
인덱스 분산은 한편으로는 샘플의 가변성 정도를 나타냅니다. 반면에 중심가치의 대표성은 낮은 값을 얻으면 값이 해당 중심을 중심으로 집중된다는 의미이기 때문입니다. 이는 데이터의 변동성이 거의 없으며 중앙이 모든 것을 잘 나타냄을 의미합니다.
반대로 높은 값을 얻는다는 것은 그 값이 집중되지 않고 흩어져 있다는 뜻이다. 이는 변동성이 크고 센터가 대표성을 갖지 못한다는 것을 의미합니다. 반면에 추론을 할 때 원한다면 더 큰 표본이 필요할 것입니다. 오류를 줄이다 변동성의 증가로 인해 정확하게 증가했습니다.