Статистические Калькуляторы
Калькулятор стандартного отклонения и предельной погрешности


Калькулятор стандартного отклонения и предельной погрешности

Учитывая дискретный набор данных, калькулятор рассчитывает среднее, дисперсию и стандартное отклонение выборки или совокупности и показывает все промежуточные этапы вычислений.

Выборка Население
Стандартное отклонение σ = 5.3385 s = 4.9937
Дисперсия σ2 = 28.5 s2 = 24.9375
Количество n = 8 n = 8
Среднее μ = 18.25 x̄ = 18.25
Сумма квадратов SS = 199.5 SS = 199.5

Произошла ошибка при расчете.

Содержание

  1. Стандартное отклонение
  2. Стандартное отклонение совокупности
    1. Пример расчета стандартного отклонения генеральной совокупности
  3. Стандартное отклонение выборки
  4. Предел погрешности
  5. Доверительный интервал
  6. Пример расчета доверительного интервала

Калькулятор стандартного отклонения и предельной погрешности

Калькулятор стандартного отклонения вычисляет стандартное отклонение набора чисел. Кроме того, он предоставляет дополнительную информацию, включая среднее значение и дисперсию. Калькулятор также рассчитывает доверительный интервал набора данных для различных доверительных уровней и предоставляет таблицу распределения частот.

Чтобы воспользоваться этим калькулятором, введите в него числа через запятую. Выберите, представляют ли числа генеральную совокупность или выборку, а затем нажмите "Рассчитать". С помощью кнопки "Очистить" вы также можете очистить калькулятор, чтобы ввести другой набор чисел.

Стандартное отклонение

Стандартное отклонение - это статистическая мера, которая измеряет степень разброса или изменчивости данного набора данных. Оно представляет собой среднее расстояние точек данных от среднего значения набора данных. Чем меньше стандартное отклонение, тем ближе точки данных к среднему значению. И наоборот, чем больше стандартное отклонение, тем дальше точки данных от среднего значения. Стандартное отклонение - это квадратный корень из другого показателя разброса, называемого дисперсией.

Стандартное отклонение рассчитывается в зависимости от источника набора данных. Если набор данных представляет все точки данных, представляющие интерес (то есть генеральную совокупность), стандартное отклонение называется стандартным отклонением генеральной совокупности. Однако если набор данных представляет собой выборку из генеральной совокупности, стандартное отклонение называется стандартным отклонением выборки.

Стандартное отклонение совокупности

Популяционное стандартное отклонение рассчитывается, когда набор данных представляет собой интересующую нас популяцию. То есть, набор данных представляет все рассматриваемые наблюдения. Популяционное стандартное отклонение обозначается σ.

σ - это строчная буква греческого алфавита под названием Sigma. Популяционное стандартное отклонение рассчитывается по формуле:

$$\sigma=\sqrt{\dfrac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Где:

  • Σ - греческая заглавная буква Sigma, которая используется для обозначения суммирования в математике;
  • xᵢ представляет каждую из точек данных (каждое наблюдение набора данных), начиная с первой точки данных и заканчивая $N-ой (последней) точкой данных;
  • μ представляет среднее значение совокупности;
  • n - размер совокупности.

Пример расчета стандартного отклонения генеральной совокупности

Следующий пример показывает, как найти стандартное отклонение данных о населении.

Инвесторы считают акции рискованным активом из-за их высокой волатильности по сравнению с другими классами активов. Инвестиционный менеджер хочет проанализировать волатильность некоторых акций за предыдущий месяц и не будет рекомендовать своим клиентам акции, стандартное отклонение которых больше или равно среднему значению, поскольку считает такие акции "слишком рискованными".

Ниже приведены все дневные цены закрытия (в долларах США) акций за предыдущий месяц. Вычислите стандартное отклонение и определите, считает ли менеджер эти акции "слишком рискованными":

1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81

Обратите внимание, что менеджера интересуют только цены акций за предыдущий месяц, а все перечисленные выше цены - это цены предыдущего месяца. Следовательно, в нашем распоряжении имеется совокупность. Поэтому мы рассчитаем стандартное отклонение, используя формулу для стандартного отклонения совокупности.

Чтобы найти стандартное отклонение, сначала вычислите среднее значение. Помните, что среднее значение μ получается путем деления суммы чисел на их количество.

$$\mu=\dfrac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20}=1,097$$

Затем вычтите среднее значение из каждого числа и возведите разницу в квадрат. Затем сложите результаты и разделите результат на количество. Полученный результат называется дисперсией σ².

$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40-1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$

Наконец, возьмите квадратный корень из дисперсии, чтобы получить стандартное отклонение.

$$\sigma=\sqrt{0,045031}\approx0,21$$

Как видите, стандартное отклонение цен этой акции за предыдущий месяц меньше среднего значения. Следовательно, менеджер не будет считать эту акцию "слишком рискованной".

Стандартное отклонение выборки

Стандартное отклонение выборки рассчитывается, когда рассматриваемый набор данных представляет собой выборку из интересующей нас совокупности. Набор данных представляет собой меньший набор наблюдений из всех рассматриваемых наблюдений. Стандартное отклонение выборки обозначается s. Выборочное стандартное отклонение рассчитывается по формуле:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Где:

  • Σ обозначает суммирование;
  • xᵢ представляет каждую из точек данных;
  • представляет среднее значение выборки;
  • n - размер выборки.

Мы проиллюстрируем, как найти стандартное отклонение выборочных данных на том же примере, что и для стандартного отклонения совокупности. Но в этой ситуации у инвестиционного менеджера нет доступа к ценам закрытия всех торговых дней предыдущего месяца. Однако у него есть цены закрытия некоторых случайных 5 дней предыдущего месяца. Следовательно, он будет оценивать стандартное отклонение цен закрытия акций, используя данные из имеющейся выборки.

Предположим, что у него есть цены закрытия за 5 дней:

1,31, 1,40, 0,86, 0,88, 1,40

Обратите внимание, что менеджера интересуют цены акций за предыдущий месяц. Однако у него есть не все цены предыдущего месяца, а небольшое подмножество цен закрытия только за 5 дней. Поэтому в данном случае мы имеем дело с выборкой. Мы рассчитаем стандартное отклонение, используя формулу стандартного отклонения выборки.

Сначала вычислим среднее значение выборки.

$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$

Далее рассчитаем дисперсию .

$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88-1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$

Наконец, возьмите квадратный корень из дисперсии, чтобы получить стандартное отклонение.

$$s=\sqrt{0,0764}\approx0,28$$

Предел погрешности

Одно из применений стандартного отклонения - вычисление "приемлемого" диапазона значений. Это играет важную роль в статистическом обеспечении качества и прогностическом анализе. Предположим, что рассматриваемые данные имеют нормальное распределение. В таком случае этот диапазон называется доверительным интервалом (см. следующий раздел). Эти доверительные интервалы даются на различных доверительных уровнях (или в процентах).

Предел погрешности - это компонент доверительного интервала, который задает ширину доверительного интервала. То есть, предел погрешности дает максимальное и минимальное принятые значения рассматриваемой величины.

Предел погрешности рассчитывается по формуле:

$$Предел\ погрешности\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Мы применяем эту формулу, если нам известно стандартное отклонение совокупности, σ. И при этом выборка должна быть достаточно большой (обычно n>30).

Когда стандартное отклонение совокупности неизвестно, а выборка мала (обычно n≤30), мы используем следующую формулу:

$$Предел\ погрешности\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

В этой формуле мы используем стандартное отклонение выборки s, так как стандартное отклонение совокупности σ нам неизвестно.

\$z_{\alpha/2}\$ и \$t_{n-1, \alpha/2}\$ определяются с помощью z-статистики и t-статистики соответственно и называются критическим значением. Они являются константами, связанными с доверительными уровнями.

Наиболее распространенными доверительными интервалами, используемыми в статистике, являются 90%, 95%, и 99%. Их значения \$z_{\alpha/2}\$ составляют 1,645 (для 90%), 1,96 (для 95%), и 2,575 (для 99%).

\$\frac{\sigma}{\sqrt n}\$ или \$\frac{s}{\sqrt n}\$ называются стандартной ошибкой.

  • \$\frac{\sigma}{\sqrt n}\$ используется для случаев, когда нам известно стандартное отклонение генеральной совокупности σ и у нас большая выборка (обычно n>30).
  • \$\frac{s}{\sqrt n}\$ используется для случаев, когда нам неизвестно стандартное отклонение генеральной совокупности и у нас малая выборка (обычно n≤30). То есть вместо стандартного отклонения генеральной совокупности σ нам приходится использовать доступное нам стандартное отклонение имеющейся у нас в распоряжении выборки s.

Доверительный интервал

Как было сказано выше, доверительный интервал - это интервал (диапазон значений), в котором, как ожидается, находится данная величина при определенном уровне доверия.

Например, мы можем сказать, что определенная величина, скажем, рост 13-летних девочек, лежит между 59 и 66 дюймами при доверительном уровне 90%. То есть, если нам предстоит отобрать группу 13-летних девочек, примерно в 90% случаев их рост будет лежать между заданными значениями.

Доверительный интервал рассчитывается по формуле:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • - среднее значение выборки,
  • \$z_{\alpha/2}\$ - критическое значение,
  • σ - стандартное отклонение генеральной совокупности,
  • n - число наблюдений.

Другая формула используется, когда мы не знаем стандартное отклонение генеральной совокупности σ и должны использовать стандартное отклонение выборки s:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • - среднее значение выборки,
  • \$t_{n-1,\alpha/2}\$ - критическое значение,
  • s - стандартное отклонение выборки,
  • n - число наблюдений.

Как мы помним из предыдущей главы, \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ и \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ являются пределами ошибки.

Пример расчета доверительного интервала

Предположим, что мы знаем, что ежедневные цены акций, которые мы рассматриваем, имеют нормальное распределение. В нашем распоряжении есть выборка цен на акции:

1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80

Нам нужно рассчитать в каком диапазоне будут колебаться цены на акции с уверенностью в 95%.

Это малая выборка и стандартное отклонение генеральной совокупности нам неизвестно, поэтому для вычислений мы будем использовать стандартное отклонение выборки и формулу:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • - среднее значение выборки, 1,10
  • \$t_{n-1,\alpha/2}\$ - критическое значение, \$t_{9, 0,025}\$ = 2,26 (критическое значение для определенного размера выборки и доверительного уровня обычно рассчитывается по z-таблице или по t-таблице)
  • s - стандартное отклонение выборки, 0,23
  • n - число наблюдений, 10,
  • \$\frac{s}{\sqrt n}\$ - стандартная ошибка здесь \$\frac{0,23}{\sqrt{10}}=0,07\$

Итак, мы подставляем цифры в формулу

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

и получаем:

$$\bar{x}-z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right) = 1,17 - 1,96 \left(\frac{0,21}{\sqrt{5}}\right)=0,99$$

$$\bar{x}+z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right) = 1,17 + 1,96 \left(\frac{0,21}{\sqrt{5}}\right)=1,35$$

Это означает, что мы на 95% уверены, что средняя цена на акции лежит в доверительном интервале (0,94, 1,26).