Статистические Калькуляторы
Калькулятор дисперсии


Калькулятор дисперсии

Если задан дискретный набор данных, представляющий выборку или генеральную совокупность, калькулятор рассчитывает среднее значение, дисперсию и стандартное отклонение и отображает рабочий процесс, задействованный в расчете.

Выборка Население
Дисперсия σ2 = 28.5 s2 = 24.9375
Стандартное отклонение σ = 5.3385 s = 4.9937
Количество n = 8 n = 8
Среднее μ = 18.25 x̄ = 18.25
Сумма квадратов SS = 199.5 SS = 199.5

Произошла ошибка при расчете.

Содержание

  1. Дисперсия как мера изменчивости
  2. Правила использования этого калькулятора
  3. Формула для дисперсии: дисперсия генеральной совокупности в сравнении с дисперсией выборки
    1. Дисперсия генеральной совокупности
    2. Дисперсия выборки
  4. Шаги для расчета дисперсии
  5. Пример расчёта дисперсии для выборки
  6. Значение дисперсии

Калькулятор дисперсии

Дисперсия как мера изменчивости

Одним из фундаментальных аспектов статистического вывода по заданному набору данных является измерение метрики, характеризующей изменчивость данных по сравнению с их средним значением.

Изменчивость, как правило, измеряется в статистике следующими метриками:

  • Дисперсия - это среднее квадратичное отклонение от среднего значения.
  • Стандартное отклонение - рассчитывается как квадратный корень из дисперсии. Стандартное отклонение - это широко используемая метрика для измерения дисперсии/вариабельности.
  • Коэффициент вариации, также известный как относительное стандартное отклонение. Коэффициент вариации вычисляется как отношение стандартного отклонения σ к среднему μ или \$(C_v=\frac{σ}{μ})\$.

Этот калькулятор вычисляет дисперсию заданного набора данных и отображает рабочий процесс, задействованный в вычислении.

Правила использования этого калькулятора

Калькулятор дисперсии принимает входные данные в виде списка чисел, разделенных разделителем. Несколько примеров возможного ввода показаны в таблице ниже.

строчный ввод колоночный ввод колоночный ввод колоночный ввод
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Числа могут быть разделены запятой, пробелом, переводом строки или сочетанием нескольких типов разделителей. Вы можете использовать формат строки или столбца. Для всех форматов, приведенных в таблице выше, калькулятор обрабатывает вводимые данные как 44, 63, 72, 75, 80, 86, 87, 89.

После ввода данных вы можете выбрать, будут ли это данные выборки или данные генеральной совокупности. После нажатия кнопки вычислить калькулятор отображает пять статистических параметров набора данных: количество наблюдений, среднее значение, сумму квадратов отклонений, дисперсию и стандартное отклонение.

Для получения хорошей статистики при проведении выводов требуется большой набор данных. Часто бывает трудно получить данные о генеральной совокупности, представляющие все возможные наблюдения в эксперименте при заданных условиях. Как правило, из генеральной совокупности берется "выборка"; выводы о генеральной совокупности обычно делаются на основе выборки.

Дисперсия измеряет среднюю дисперсию набора данных относительно среднего значения. Она часто обозначается через σ² для генеральной совокупности и через для выборки. Большее значение σ² или подразумевает больший разброс точек данных от среднего значения выборки, и наоборот.

Рассмотрим следующие примеры наборов данных.

(Набор I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Набор II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Вводя Набор I в калькулятор дисперсии мы получаем:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

для выборки, и

n=11

μ=16

SS=704

σ²=64

σ=8

Для генеральной совокупности.

Вводя Набор II в калькулятор дисперсии мы получаем:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

для выборки, и

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

Для генеральной совокупности.

  • В наборе I числа значительно отклонялись от среднего выборочного значения:

s²=70,4

σ²=64

  • В наборе II изменчивость мала:

s²=5,6

σ²=5,09

Формула для дисперсии: дисперсия генеральной совокупности в сравнении с дисперсией выборки

Дисперсия генеральной совокупности

Генеральная совокупность в статистике относится ко всем возможным наблюдениям в эксперименте. Для N наблюдений дисперсия генеральной совокупности составляет:

$$\sigma^2=\frac{\sum_{i}^{N}{{(X_i-\ \mu)}^2\ }}{N}$$

где

  • σ² = дисперсия генеральной совокупности
  • Σ = сумма
  • xᵢ = каждое наблюдение
  • μ = среднее значение генеральной совокупности
  • n = количество наблюдений в генеральной совокупности

Дисперсия выборки

Дисперсия выборки определяется как

$$s^2=\frac{\sum_{i}^{N}{{(X_i-\ \bar{X})}^2\ }}{n-1}$$

где

  • = дисперсия выборки
  • Σ = сумма
  • xᵢ = каждое наблюдение
  • = среднее значение выборки
  • n = количество наблюдений в выборке

Шаги для расчета дисперсии

В расчете дисперсии участвуют следующие шаги.

Шаг 1: Рассчитайте среднее значение выборки/генеральной совокупности (популяции). Это сумма всех точек данных, деленная на количество точек данных (n для выборки и N для генеральной совокупности), т.е.,

Среднее выборки:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Среднее генеральной совокупности:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Шаг 2: Рассчитайте отклонения, вычитая среднее значение выборки/генеральной совокупности из каждой точки данных, т.е.,

Отклонения выборки:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), ..., (x_n-\bar{x})$$

Отклонения генеральной совокупности:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), ..., (x_N-\mu)$$

Шаг 3: Рассчитайте квадраты отклонений для каждой точки данных.

Квадраты отклонений выборки:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, ..., (x_n-\bar{x})^2$$

Квадраты отклонений генеральной совокупности:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, ..., (x_N-\mu)^2$$

Шаг 4: Рассчитайте сумму квадратов отклонений.

Сумма квадратов отклонений выборки:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Сумма квадратов отклонений генеральной совокупности:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Шаг 5: Разделите сумму квадратов отклонений на n-1 для выборки и на N для генеральной совокупности для расчета дисперсии.

Дисперсия выборки:

$$s^2=\frac{SS}{n-1}$$

Дисперсия генеральной совокупности:

$$\sigma^2=\frac{SS}{N}$$

Пример расчёта дисперсии для выборки

Рассмотрим следующий набор данных: 1, 2, 4, 5, 6 и 12. Для расчёта дисперсии выборки выполним следующие шаги:

Шаг 1: Вычисляем среднее значение выборки (среднее арифметическое).

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Шаг 2: Вычисляем отклонения от среднего для каждой точки данных.

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Шаг 3: Вычисляем квадраты отклонений.

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

Шаг 4: Суммируем квадраты отклонений.

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

Шаг 5: Вычисляем дисперсию выборки, разделив сумму квадратов отклонений на число степеней свободы (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$

Для генеральной совокупности мы бы разделили на n (общее количество точек данных), а не на n-1, чтобы вычислить дисперсию генеральной совокупности.

Значение дисперсии

Дисперсия используется в инвестировании. Она помогает управляющим активами улучшить показатели эффективности инвестиций. Финансовые аналитики могут использовать дисперсию для оценки индивидуальных показателей компонентов инвестиционного портфеля.

Инвесторы рассчитывают дисперсию при рассмотрении новой покупки, чтобы решить, стоит ли инвестиция риска. Дисперсия помогает аналитикам определить меру неопределенности, которую трудно оценить количественно без дисперсии и стандартного отклонения.

Неопределенность не поддается прямому измерению. Но дисперсия и стандартное отклонение (квадратный корень из дисперсии) помогают определить предполагаемое влияние конкретной акции на портфель.

Ученые, статистики, математики и аналитики данных также могут использовать дисперсию. Она помогает получить полезную информацию об эксперименте или выборочной совокупности.

Ученые могут искать различия между тестовыми группами, чтобы определить, достаточно ли они похожи, чтобы успешно проверить гипотезу. Чем выше дисперсия набора данных, тем больше разброс значений в наборе данных. Исследователи данных могут использовать эту информацию, чтобы понять, насколько хорошо среднее значение отражает набор.

Недостатком использования дисперсии является то, что большие выбросы в наборе могут привести к некоторому искажению данных. Это происходит потому, что выбросы могут еще больше увеличить свой вес после возведения в квадрат.

Многие исследователи предпочитают работать со стандартным отклонением, которое рассчитывается как квадратный корень из дисперсии. На стандартное отклонение меньше влияют выбросы, оно меньше и его легче интерпретировать.