Статистичні Калькулятори
Калькулятор стандартного відхилення


Калькулятор стандартного відхилення

Безкоштовний калькулятор стандартного відхилення. Миттєво обчислюйте дисперсію, середнє значення та відхилення онлайн із детальним покроковим рішенням.

Вибірка Генеральна сукупність
Стандартне відхилення σ = 5.3385 s = 4.9937
Дисперсія σ2 = 28.5 s2 = 24.9375
Кількість n = 8 n = 8
Середнє μ = 18.25 x̄ = 18.25
Сума квадратів SS = 199.5 SS = 199.5

Під час вашого обчислення сталася помилка.

Зміст

  1. Що таке стандартне відхилення?
  2. Стандартне відхилення генеральної сукупності
    1. Приклад обчислення стандартного відхилення генеральної сукупності
  3. Вибіркове стандартне відхилення
  4. Гранична похибка
  5. Довірчий інтервал
    1. Приклад обчислення довірчого інтервалу

Калькулятор стандартного відхилення

Наш безкоштовний онлайн-калькулятор стандартного відхилення швидко та точно обчислює стандартне відхилення для будь-якого набору чисел. Крім основного показника, інструмент надає розширену статистичну інформацію про ваші дані, включаючи середнє значення та дисперсію. Для більш глибокого аналізу калькулятор також визначає довірчий інтервал набору даних для різних рівнів довіри та автоматично генерує таблицю частотного розподілу.

Щоб скористатися цим калькулятором, просто введіть ваші значення у відповідне поле через кому. Потім виберіть, що саме представляють ваші дані — генеральну сукупність чи вибірку, — і натисніть кнопку «Розрахувати».

Що таке стандартне відхилення?

Стандартне відхилення (середньоквадратичне відхилення) — це ключова статистична міра, яка визначає ступінь розкиду або мінливості заданого набору даних. Вона відображає усереднену відстань усіх точок даних від їхнього спільного середнього значення. Чим менше стандартне відхилення, тим щільніше дані згруповані навколо середнього показника. І навпаки, високе стандартне відхилення свідчить про те, що точки даних сильно розсіяні. З математичної точки зору, стандартне відхилення є квадратним коренем з іншого важливого показника розкиду — дисперсії.

Метод розрахунку стандартного відхилення залежить від повноти наявних даних. Якщо ваш набір містить абсолютно всі елементи, що досліджуються (тобто є генеральною сукупністю), розраховується стандартне відхилення генеральної сукупності. Якщо ж ви аналізуєте лише частину даних (вибірку з генеральної сукупності), застосовується формула вибіркового стандартного відхилення.

Стандартне відхилення генеральної сукупності

Цей показник обчислюється тоді, коли набір даних охоплює всю генеральну сукупність, що є предметом дослідження (тобто враховано абсолютно всі можливі спостереження). Стандартне відхилення генеральної сукупності традиційно позначається малою грецькою літерою сигма (σ).

Формула для обчислення стандартного відхилення генеральної сукупності має такий вигляд:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Де:

  • Σ — велика грецька літера Сигма, яка в математиці позначає суму;
  • xᵢ — кожне окреме значення (спостереження) в наборі даних, від першого до останнього (N-го);
  • μ — середнє значення генеральної сукупності;
  • N — загальна кількість елементів у генеральній сукупності.

Приклад обчислення стандартного відхилення генеральної сукупності

Розглянемо практичний приклад розрахунку для даних генеральної сукупності.

Інвестори часто вважають акції ризикованим активом через їхню високу волатильність порівняно з іншими фінансовими інструментами. Інвестиційний менеджер аналізує волатильність певних акцій за минулий місяць. Він вирішує не рекомендувати клієнтам акції, якщо їхнє стандартне відхилення перевищує або дорівнює середньому значенню ціни, оскільки вважає такий актив «надто ризикованим».

Нижче наведено всі щоденні ціни закриття (у доларах США) для цих акцій за попередній місяць. Нам потрібно обчислити стандартне відхилення та з'ясувати, чи відхилить менеджер цей актив:

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

Оскільки менеджера цікавить динаміка цін виключно за минулий місяць, і ми маємо дані за всі торгові дні цього періоду, наш набір є повною генеральною сукупністю. Тому ми використовуємо відповідну формулу.

Щоб знайти стандартне відхилення, спочатку обчислимо середнє значення (μ). Для цього додаємо всі ціни та ділимо на їхню кількість:

$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

Далі віднімаємо середнє значення від кожної ціни та підносимо отриману різницю до квадрата. Додаємо всі ці квадрати й ділимо суму на кількість спостережень. Отриманий результат — це дисперсія (σ²):

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

Нарешті, знаходимо квадратний корінь із дисперсії, щоб отримати стандартне відхилення:

$$\sigma=\sqrt{0.045031}\approx0.21$$

Як бачимо, стандартне відхилення (0.21) є значно меншим за середнє значення (1.097). Отже, менеджер не вважатиме ці акції «надто ризикованими».

Вибіркове стандартне відхилення

Цей вид відхилення розраховується тоді, коли набір даних є лише частиною (вибіркою) більшої генеральної сукупності. У статистиці вибіркове стандартне відхилення позначається латинською літерою s і обчислюється за формулою з поправкою Бесселя (ділення на n-1 для усунення зміщення):

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Де:

  • Σ — математичний знак суми;
  • xᵢ — кожне окреме значення у вибірці;
  • — вибіркове середнє значення;
  • n — розмір вибірки (кількість спостережень).

Покажемо на схожому прикладі, як це працює. Уявіть, що той самий інвестиційний менеджер не має доступу до всіх цін закриття за минулий місяць. У нього є дані лише за 5 випадкових днів. У цьому випадку він змушений оцінювати волатильність на основі вибірки.

Припустимо, він має такі ціни за 5 днів:

1.31, 1.40, 0.86, 0.88, 1.40

Оскільки це не всі ціни за місяць, а лише невелика підмножина, ми маємо справу з вибіркою. Тому використовуємо формулу вибіркового стандартного відхилення.

Спочатку знаходимо вибіркове середнє ():

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

Далі розраховуємо вибіркову дисперсію (), не забуваючи поділити на n-1:

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

І нарешті, добуваємо квадратний корінь:

$$s=\sqrt{0.0764}\approx 0.28$$

Гранична похибка

Одним із найважливіших практичних застосувань стандартного відхилення є визначення «прийнятного» або очікуваного діапазону значень. Це критично важливо у статистичному контролі якості на виробництві та предиктивній аналітиці. Якщо базові дані мають нормальний розподіл, такий діапазон називається довірчим інтервалом (детальніше в наступному розділі). Ці інтервали розраховуються для різних рівнів довіри (надійності).

Гранична похибка (або похибка вибірки) — це ключовий компонент, який визначає ширину довірчого інтервалу. Простими словами, вона показує максимально та мінімально допустимі відхилення аналізованої величини від середнього.

Гранична похибка розраховується за такою формулою:

$$Margin\ of\ error\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Ця формула застосовується, якщо нам відоме стандартне відхилення генеральної сукупності (σ), а розмір вибірки достатньо великий (зазвичай n > 30).

Якщо ж стандартне відхилення генеральної сукупності невідоме, а вибірка невелика (n ≤ 30), використовується інша формула:

$$Margin\ of\ error\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Тут замість σ ми використовуємо вибіркове стандартне відхилення s.

Показники \$z_{\alpha/2}\$ та \$t_{n-1, \alpha/2}\$ називаються критичними значеннями. Вони визначаються за допомогою статистичних Z-таблиць або t-таблиць відповідно і є константами, що залежать від обраного рівня довіри.

У статистиці найчастіше використовують рівні довіри 90%, 95% та 99%. Відповідні критичні значення \$z_{\alpha/2}\$ для них дорівнюють 1.645 (для 90%), 1.96 (для 95%) та 2.575 (для 99%).

Вирази \$\frac{\sigma}{\sqrt n}\$ або \$\frac{s}{\sqrt n}\$ називаються стандартною похибкою.

  • \$\frac{\sigma}{\sqrt n}\$ застосовується для великих вибірок (n > 30), коли відомо точне стандартне відхилення генеральної сукупності σ.
  • \$\frac{s}{\sqrt n}\$ застосовується для малих вибірок (n ≤ 30), коли σ невідоме. У такому разі для розрахунків береться наявне вибіркове стандартне відхилення s.

Довірчий інтервал

Як зазначалося раніше, довірчий інтервал — це діапазон значень, у межах якого з певною ймовірністю (рівнем довіри) знаходиться істинне значення досліджуваного параметра.

Наприклад, можна стверджувати з рівнем довіри 90%, що середній зріст 13-річних дівчат становить від 59 до 66 дюймів. Це означає, що якщо ми проведемо безліч вибіркових досліджень, у 90% випадків середній зріст групи потраплятиме саме в цей діапазон.

Формула розрахунку довірчого інтервалу (якщо σ відоме):

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • — вибіркове середнє;
  • \$z_{\alpha/2}\$ — критичне значення (z-статистика);
  • σ — стандартне відхилення генеральної сукупності;
  • n — кількість спостережень (розмір вибірки).

Якщо ж стандартне відхилення генеральної сукупності невідоме, використовується вибіркове стандартне відхилення s і t-статистика:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • — вибіркове середнє;
  • \$t_{n-1,\alpha/2}\$ — критичне значення (t-статистика);
  • s — вибіркове стандартне відхилення;
  • n — кількість спостережень.

Частини формул \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ та \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ — це і є розглянута вище гранична похибка.

Приклад обчислення довірчого інтервалу

Припустимо, ми знаємо, що щоденні ціни на досліджувані акції мають нормальний розподіл. Ми маємо вибірку цін за 10 днів:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

Наше завдання — розрахувати діапазон, у якому з імовірністю 95% (рівень довіри 95%) знаходитиметься середня ціна акції.

Оскільки вибірка мала (n=10), а стандартне відхилення генеральної сукупності невідоме, ми використовуємо вибіркове стандартне відхилення та відповідну формулу:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Знайдемо всі необхідні компоненти:

  • (вибіркове середнє) = 1.10
  • \$t_{n-1,\alpha/2}\$ (критичне значення для n-1=9 та рівня 95%) = \$t_{9, 0.025}\$ = 2.26 (знаходиться за статистичною t-таблицею)
  • s (вибіркове стандартне відхилення) = 0.23
  • n (кількість спостережень) = 10
  • \$\frac{s}{\sqrt n}\$ (стандартна похибка) = \$\frac{0.23}{\sqrt{10}}=0.07\$

Підставивши ці значення у формулу:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Отримуємо нижню та верхню межі інтервалу:

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

Результат: ми можемо стверджувати з рівнем довіри 95%, що середня ціна цих акцій знаходиться в довірчому інтервалі (0.94, 1.26).