Статистические Калькуляторы
Калькулятор стандартного отклонения

Калькулятор стандартного отклонения

Калькулятор стандартного отклонения рассчитывает среднее, дисперсию и стандартное отклонение выборки или генеральной совокупности и показывает все промежуточные этапы вычислений.

Результат
Среднеквадратичное отклонение s = 4.5
Дисперсия s2 = 20.24
Считать n = 7
Срднее x̄ = 14.29
Сумма квадратов SS = 100

В вашем расчете произошла ошибка.

Оглавление

  1. Стандартное отклонение как статистическая мера
  2. Правила использования этого калькулятора
  3. Проблемы, для решения которых предназначен данный калькулятор
  4. Формулы вычисления стандартного отклонения
  5. Расчет стандартного отклонения
  6. Пример расчета стандартного отклонения выборки
  7. Применение стандартного отклонения

Калькулятор стандартного отклонения

Стандартное отклонение как статистическая мера

Стандартное отклонение - это одна из наиболее часто используемых метрик, характеризующих статистику данного набора данных. Стандартное отклонение простыми словами это мера того, насколько разбросан набор данных. Вычисляя стандартное отклонение, можно узнать, являются ли числа близкими к среднему значению или далеки от него. Если точки данных находятся далеко от среднего значения, то в наборе данных имеется большое отклонение. Таким образом, чем больше разброс данных, тем выше стандартное отклонение.

Данный калькулятор рассчитывает стандартное отклонение заданного набора данных и отображает математические шаги, участвующие в расчете.

Правила использования этого калькулятора

Калькулятор принимает входные данные в виде списка чисел, разделенных разделителем. Несколько примеров возможного ввода показаны в таблице ниже.

row input column input column input column input
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Числа могут быть разделены запятой/пробелом/разрывом строки или их сочетанием и могут вставляться в формате строки или столбца. Для всех форматов, приведенных в таблице выше, калькулятор обрабатывает введенные данные как 44, 63, 72, 75, 80, 86, 87, 89.

После ввода данных выберите, ищете ли вы стандартное отклонение для генеральной совокупности или для выборки, и нажмите кнопку ввода. Калькулятор отобразит пять статистических параметров набора данных: количество наблюдений, среднее, сумму квадратов отклонений, дисперсию и стандартное отклонение.

Проблемы, для решения которых предназначен данный калькулятор

Калькулятор предназначен для расчета стандартного отклонения дискретного набора данных и дает представление о теории, лежащей в основе расчета.

Данные могут представлять собой совокупность, состоящую из всех возможных наблюдений в эксперименте при заданных условиях. Во многих случаях выборка каждого члена генеральной совокупности невозможна.

В статистической практике принято работать с подмножеством более крупной "совокупности", которое мы называем "выборкой". Это связано с тем, что часто нецелесообразно или невозможно собрать данные от каждого человека в совокупности. Мы делаем оценки или выводы о совокупности на основе информации, полученной от выборки.

При расчете стандартного отклонения формула, которую мы используем, корректируется в зависимости от того, имеем ли мы дело с выборкой или со всей совокупностью. Эта корректировка осуществляется с помощью коэффициента, известного как "степени свободы". Для выборки при расчете дисперсии мы делим не на n, а на n - 1 (где n - объем выборки), и затем возводим в квадрат, чтобы найти стандартное отклонение. Эта поправка компенсирует тот факт, что мы используем выборочные данные для оценки стандартного отклонения популяции, и обеспечивает несмещенность нашей оценки.

Стандартное отклонение измеряет среднюю дисперсию/отклонение/изменчивость набора данных относительно среднего значения. Стандартное отклонение обозначается греческой буквой σ для генеральной совокупности или s для выборки. Большее значение σ или s подразумевает больший разброс точек данных от среднего значения выборки и наоборот.

Рассмотрим следующие примеры наборов данных.

(Набор I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(Набор II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Подставляя эти наборы данных в калькулятор, мы получаем для набора I

  • x̄=16 - среднее значение
  • s=8,3904708 - стандартное отклонение

для набора II

  • x̄=16 - среднее значение
  • s=2,3664319 - стандартное отклонение

В наборе I числа значительно отклонились от среднего выборочного значения (s=8,39), в то время как в наборе II вариативность мала (s=2,36) по сравнению с набором I.

Формулы вычисления стандартного отклонения

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

σ — стандартное отклонение генеральной совокупности, xᵢ — величина отдельного значения генеральной совокупности, μ — среднее арифметическое генеральной совокупности, n — размер генеральной совокупности.

Эта формула применяется, когда анализируются все значения генеральной совокупности.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

s — стандартное отклонение выборки, xᵢ — величина отдельного значения выборки, — среднее арифметическое выборки, n — размер выборки.

Эта формула применяется, когда присутствует очень большой размер генеральной совокупности и на анализ берётся только её выборка.

Расчет стандартного отклонения

Расчет стандартного отклонения выполняется следующим образом.

Шаг 1: Вычисляется среднее значение выборки/генеральной совокупности. Это просто сумма всех точек данных, поделенная на количество отсчетов n или n, т.е.

Среднее значение выборки:

$$\bar{X}=\frac{x₁+x₂+X_3+........+X_n}{n}$$

Среднее значение по генеральной совокупности

$$\mu=\frac{x₁+x₂+X_3+........+X_N}{N}$$

Шаг 2: Рассчитайте отклонение, вычитая среднее значение выборки/генеральной совокупности из каждой точки данных, т.е.

Отклонения выборки:

$$(x₁-\bar{X}), (x₂-\bar{X}), (X_3-\bar{X})…………………… (X_n-\bar{X})$$

Отклонения генеральной совокупности:

$$(x₁-\ \mu), (x₂-\ \mu), (X_3-\ \mu)……………….. (X_N-\ \mu)$$

Шаг 3: Вычислите квадраты отклонений для каждой точки данных.

Квадраты отклонений для выборки:

$$(x₁-\bar{X})^2, (x₂-\bar{X})^2, (X_3-\bar{X})^2…………………… (X_n-\bar{X})^2$$

Квадраты отклонений для генеральной совокупности:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (X_3-\ \mu)^2……………….. (X_N-\ \mu)^2$$

Шаг 4: Рассчитайте сумму квадратов отклонений, сложив все индивидуальные квадраты отклонений.

Сумма квадратов отклонений для выборки:

$$SS=(x₁-\bar{X})^2+ (x₂-\bar{X})^2+(X_3-\bar{X})^2……………………+(X_n-\bar{X})^2$$

Сумма квадратов отклонений для генеральной совокупности:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(X_3-\ \mu)^2……………….+ (X_N-\ \mu)^2$$

Шаг 5: Для получения дисперсии разделите сумму квадратов отклонений на число степеней свободы. Для популяции делите на N, а для выборки - на n-1.

Дисперсия выборки

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Дисперсия популяции

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

При вычислении дисперсии для выборки мы могли бы предположить, что для вычислений мы будем использовать выражение:

$$\frac{(X-\bar{X})^2}{n}$$

где

x̄ - среднее значение выборки, а n - объем выборки. Но такая формула не используется.

Такое выражение не дало бы хорошей оценки дисперсии генеральной совокупности. Когда генеральная совокупность очень большая, а выборка очень маленькая, дисперсия, вычисленная по этой формуле, недооценила бы дисперсию генеральной совокупности. Она показала бы слишком маленькую дисперсию из-за нехватки данных. Поэтому с помощью выражения n-1 мы увеличиваем потенциальную величину дисперсии.

Вместо деления на n мы находим дисперсию выборки путем деления на $n - 1$. Такая операция дает немного большее значение дисперсии, более близкое к действительному значению.

Шаг 6: Извлеките квадратный корень из полученного числа. Стандартное отклонение - это квадратный корень из дисперсии.

Стандартное отклонение выборки

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(X_i-\ \bar{X})}^2\ }}{n-1}}$$

Стандартное отклонение генеральной совокупности

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(X_i-\ \bar{\mu})}^2\ }}{N}}$$

Пример расчета стандартного отклонения выборки

Рассмотрим следующие оценки N=8 студентов на итоговом экзамене по физике:

45, 67, 70, 75, 80, 81, 82 и 84.

Калькулятор рассчитывает стандартное отклонение выборки, используя следующие шаги:

Шаг 1: Вычислите среднее значение.

$$\bar{X}=\frac{\sum_{i} X_i}{N}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

Шаг 2: Вычислите отклонения.

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Шаг 3: Вычислите квадраты отклонений.

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Шаг 4: Сложите квадраты отклонений.

$$SS=\sum_{i}^{N}{{(X_i-\ \bar{X})}^2=784+36+9+4+49+64+81+121}=1148$$

Шаг 5: Вычислите дисперсию, разделив сумму квадратов отклонений на степень свободы (N-1). Для генеральной совокупности дисперсия в этом шаге делится на N, а не на N-1. В данном случае мы имеем выборку, то есть данные только о части студентов, а не целиком всю генеральную совокупность.

$$s^2=\ \frac{\sum_{i}^{N}{{(X_i-\ \bar{X})}^2\ }}{N-1}=\frac{1148}{8-1}=164$$

Шаг 6: Вычислите квадратный корень из дисперсии, чтобы получить стандартное отклонение.

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

Применение стандартного отклонения

Дисперсии и стандартные отклонения могут быть использованы для определения разброса данных. Если дисперсия или стандартное отклонение большие, то данные более разбросаны. Эта информация полезна при сравнении двух (или более) наборов данных, чтобы определить какой из них более (наиболее) изменчив.

Стандартное отклонение широко используется для контроля качества в промышленности. В крупномасштабном производстве определенные характеристики продукции должны попадать в установленный диапазон, доступ к которому можно получить с помощью расчета стандартного отклонения. Например, при производстве гаек и болтов, разброс их диаметров должен быть небольшим, иначе детали не будут подходить друг к другу.

Стандартное отклонение используется в финансах и многих других областях для оценки риска. В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

Также стандартное отклонение используется в финансах в качестве меры волатильности, в социологии в опросах общественного мнения — оно помогает в расчёте погрешности.

Дисперсия и стандартное отклонение используются для определения количества значений данных, которые попадают в заданный интервал распределения. Например, теорема Чебышева показывает, что для любого распределения не менее 75% значений данных будут находиться в пределах 2 стандартных отклонений от среднего значения.

Возьмем простой пример с климатом. Предположим, мы изучаем дневную температуру в двух городах одного региона. Один город расположен на побережье, а другой - внутри континента. Средняя максимальная дневная температура в этих двух городах может быть одинаковой. Но стандартное отклонение, то есть разброс максимальных дневных температур, будет больше у города, расположенного на континенте, а у прибрежного города стандартное отклонение максимальных дневных температур будет меньше.

Это означает, что в континентальном городе максимальная температура воздуха в каждый конкретный день года будет отличаться более значительно, чем в прибрежном городе. То есть прибрежный город будет иметь более мягкий климат.