Kalkulatory Statystyczne
Odchylenie standardowe

Odchylenie standardowe

Dla danego dyskretnego zestawu danych kalkulator oblicza średnią, wariancję i odchylenie standardowe próbki lub populacji oraz pokazuje wszystkie pośrednie kroki obliczeń.

Wynik
Odchylenie standardowe s = 4.5
Zmienność s2 = 20.24
Liczyć n = 7
Mieć na myśli x̄ = 14.29
Suma kwadratów SS = 100

Wystąpił błąd w obliczeniach.

Spis treści

  1. Odchylenie standardowe jako miara statystyczna
  2. Zasady korzystania z tego kalkulatora
  3. Problemy, które ma rozwiązać ten kalkulator
  4. Formuły do obliczania odchylenia standardowego
  5. Obliczanie odchylenia standardowego
  6. Przykład obliczenia odchylenia standardowego próbki
  7. Zastosowania odchylenia standardowego

Odchylenie standardowe

Odchylenie standardowe jako miara statystyczna

Odchylenie standardowe to jedna z najczęściej używanych miar służących do charakteryzowania statystyk danego zestawu danych. Odchylenie standardowe, mówiąc najprościej, jest miarą rozproszenia zestawu danych. Obliczając odchylenie standardowe, można dowiedzieć się, czy liczby są bliskie średniej czy też od niej odległe. Jeśli punkty danych są daleko od średniej, wówczas w zestawie danych występuje duże odchylenie. Zatem im większe rozproszenie danych, tym wyższe odchylenie standardowe.

Ten kalkulator definiuje odchylenie standardowe dla danego zestawu danych i wyświetla matematyczne kroki zaangażowane w obliczenie.

Zasady korzystania z tego kalkulatora

Kalkulator akceptuje dane wejściowe w postaci listy liczb oddzielonych separatorem. Poniżej pokazano kilka przykładów możliwych danych wejściowych.

dane wejściowe w wierszu dane wejściowe w kolumnie dane wejściowe w kolumnie dane wejściowe w kolumnie
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Liczby mogą być oddzielone przecinkiem/spacją/przejściem do nowej linii lub ich mieszanką i mogą być wprowadzane zarówno w formacie wiersza, jak i kolumny. Dla wszystkich formatów pokazanych w powyższej tabeli kalkulator przetwarza dane wejściowe jako 44, 63, 72, 75, 80, 86, 87, i 89.

Po wprowadzeniu danych należy wybrać, czy są to dane próbki czy populacji i nacisnąć enter. Kalkulator wyświetla pięć parametrów statystycznych zestawu danych: liczebność (liczba obserwacji), średnia, suma kwadratów odchyleń, wariancja i odchylenie standardowe.

Problemy, które ma rozwiązać ten kalkulator

Kalkulator jest zaprojektowany do obliczania odchylenia standardowego dyskretnego zestawu danych i zapewnia wgląd w teorię stojącą za obliczeniem.

Dane mogą składać się z populacji zawierającej wszystkie możliwe obserwacje w eksperymencie (jakiegokolwiek rodzaju) w określonych warunkach. W wielu przypadkach niemożliwe jest pobranie próbki od każdego członka populacji.

W praktyce statystycznej powszechne jest pracowanie z podzbiorem większej 'populacji', który określamy mianem 'próbki'. Dzieje się tak, ponieważ często jest niepraktyczne lub niemożliwe zebranie danych od każdej jednostki populacji. Estymujemy lub wnioskujemy o populacji na podstawie informacji zebranych z próbki.

Gdy obliczamy odchylenie standardowe, formuła, której używamy, jest dostosowywana w zależności od tego, czy mamy do czynienia z próbką, czy z całą populacją. Dostosowanie to jest dokonywane za pomocą czynnika znanego jako 'stopnie swobody'. Dla próbki dzielimy przez n - 1 (gdzie n jest wielkością próbki) zamiast przez n podczas obliczania wariancji, która następnie jest podnoszona do kwadratu, aby znaleźć odchylenie standardowe. Korekta ta kompensuje fakt, że używamy danych próbki do szacowania odchylenia standardowego populacji i zapewnia, że nasze oszacowanie jest nieobciążone.

Odchylenie standardowe mierzy średnie rozproszenie/odchylenie/zmienność zestawu danych względem średniej. Często oznaczane jest grecką literą σ dla populacji lub s dla próbki. Większa wartość σ lub s oznacza większe rozproszenie punktów danych od średniej próbki i odwrotnie.

Rozważmy następujące przykłady zestawów danych.

(Zestaw I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(Zestaw II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20 Podstawiając te zestawy danych do kalkulatora, otrzymujemy dla zestawu I

  • x̄=16 - średnia wartość
  • s=8,3904708 - odchylenie standardowe

Dla zestawu II

  • x̄=16 - średnia wartość
  • s=2,3664319 - odchylenie standardowe

W zestawie I liczby znacznie odbiegają od średniej próbki (s=8,39), podczas gdy w zestawie II zmienność jest mała (s=2,36) w porównaniu do zestawu I.

Formuły do obliczania odchylenia standardowego

Ta formuła jest stosowana, gdy analizowane są wszystkie wartości populacji.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ to odchylenie standardowe populacji,
  • xᵢ to wartość indywidualna populacji,
  • μ to średnia arytmetyczna populacji,
  • N to wielkość populacji.

Poniższa formuła jest używana, gdy wielkość populacji jest bardzo duża i do analizy pobierana jest tylko jej próbka.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s to odchylenie standardowe próbki,
  • xᵢ to wartość indywidualna próbki,
  • to średnia próbki,
  • n to wielkość próbki.

Obliczanie odchylenia standardowego

W obliczeniu odchylenia standardowego uczestniczą następujące kroki.

Krok 1: Oblicz średnią próbki/populacji. Jest to suma wszystkich punktów danych podzielona przez liczbę obserwacji N lub n, tj.

Średnia próbki:

$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$

Średnia populacji

$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$

Krok 2: Oblicz odchylenia poprzez odjęcie średniej próbki/populacji od każdego punktu danych, tj.

Odchylenia próbki:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$

Odchylenia populacji:

$$(x₁-\mu), (x₂-\mu), (x_3-\mu)……………….. (x_N-\mu)$$

Krok 3: Oblicz kwadraty odchyleń dla każdego punktu danych.

Kwadraty odchyleń próbki:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$

Kwadraty odchyleń populacji:

$$(x₁-\mu)^2, (x₂-\mu)^2, (x_3-\mu)^2……………….. (x_N-\mu)^2$$

Krok 4: Oblicz sumę kwadratów odchyleń poprzez dodanie wszystkich indywidualnych kwadratów odchyleń.

Suma kwadratów odchyleń próbki:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$

Suma kwadratów odchyleń populacji:

$$SS=(x₁-\mu)^2+ (x₂-\mu)^2+(x_3-\mu)^2……………….+ (x_N-\mu)^2$$

Krok 5: Podziel sumę kwadratów odchyleń przez liczbę stopni swobody, aby uzyskać wariancję. Dla populacji podziel przez N, a dla próbki podziel przez n-1.

Wariancja próbki

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Wariancja populacji

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

Gdy obliczamy wariancję dla próbki, moglibyśmy założyć, że użyjemy wyrażenia do obliczeń:

$$\frac{(x-\bar{x})^2}{n}$$

gdzie

x̄ to średnia próbki, a n to wielkość próbki. Jednak takiej formuły się nie stosuje.

Takie wyrażenie nie dałoby dobrego oszacowania wariancji populacji. Kiedy populacja ogólna jest bardzo duża, a próbka jest bardzo mała, wariancja obliczona tą formułą niedoszacowałaby wariancji populacji. Pokazałoby to zbyt małą wariancję z powodu braku danych. Dlatego używając wyrażenia n-1 zwiększamy potencjalną wartość wariancji.

Zamiast dzielić przez n, znajdujemy wariancję próbki, dzieląc przez n-1. Ta operacja daje nieco większą wartość wariancji, bliższą rzeczywistej wartości.

Krok 6: Wydobyć pierwiastek kwadratowy z otrzymanej liczby. Odchylenie standardowe to pierwiastek kwadratowy z wariancji.

Odchylenie standardowe próbki

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

Odchylenie standardowe populacji

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

Przykład obliczenia odchylenia standardowego próbki

Rozważmy następujące wyniki n=8 studentów na egzaminie końcowym z fizyki:

45, 67, 70, 75, 80, 81, 82, i 84

Kalkulator oblicza odchylenie standardowe próbki, korzystając z następujących kroków:

Krok 1: Oblicz średnią.

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+67+70+75+80+81+82+84}{8}=73$$

Krok 2: Oblicz odchylenia

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Krok 3: Oblicz kwadraty odchyleń

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Krok 4: Zsumuj kwadraty odchyleń.

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

Krok 5: Oblicz wariancję dzieląc sumę kwadratów odchyleń przez stopnie swobody (n-1). W przypadku populacji, w tym kroku wariancję dzielono by przez N zamiast przez N-1. W tym przypadku mamy do czynienia z próbką, czyli danymi dotyczącymi części populacji studentów, a nie całej populacji.

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{7}=164$$

Krok 6: Wydobyć pierwiastek kwadratowy z wariancji, aby uzyskać odchylenie standardowe.

$$s=\sqrt{s^2}=\sqrt{164}\approx 12,80$$

Zastosowania odchylenia standardowego

Dyspersja i odchylenie standardowe mogą być używane do określenia rozrzutu danych. Jeśli wariancja lub odchylenie standardowe są duże, dane są bardziej rozrzucone. Informacja ta jest przydatna podczas porównywania dwóch (lub więcej) zestawów danych w celu określenia, który z nich jest bardziej (najbardziej) zmienny.

W przemyśle odchylenie standardowe jest szeroko stosowane do kontroli jakości. W produkcji masowej pewne cechy produktu muszą mieścić się w określonym zakresie, który może być dostępny poprzez obliczenie odchylenia standardowego. Na przykład, w produkcji nakrętek i śrub, wariacja ich średnic musi być mała, w przeciwnym razie części nie będą pasować do siebie.

Odchylenie standardowe jest stosowane w finansach i wielu innych dziedzinach do oceny ryzyka. W analizie technicznej odchylenie standardowe jest używane do konstruowania linii Bollingera oraz obliczania zmienności.

Ponadto, odchylenie standardowe jest stosowane w finansach jako miara zmienności, a w socjologii wykorzystywane jest w badaniach opinii publicznej do pomocy w obliczaniu niepewności.

Wariancja i odchylenie standardowe są używane do określenia liczby wartości danych, które mieszczą się w danym przedziale dystrybucji. Na przykład, twierdzenie Czebyszewa pokazuje, że dla dowolnej dystrybucji przynajmniej 75% wartości danych znajdzie się w obrębie 2 odchyleń standardowych od średniej.

Weźmy prosty przykład z klimatologii. Załóżmy, że badamy codzienną temperaturę dwóch miast w tym samym regionie. Jedno miasto jest na wybrzeżu, a drugie w głębi lądu. Średnia maksymalna dzienna temperatura w tych dwóch miastach może być taka sama. Ale odchylenie standardowe, czyli rozrzut maksymalnych dziennych temperatur, będzie większy dla miasta położonego na kontynencie, a miasto nadmorskie będzie miało mniejsze odchylenie standardowe maksymalnych dziennych temperatur.

Oznacza to, że miasto kontynentalne będzie miało większe zmiany maksymalnej temperatury powietrza w dowolnym dniu roku niż miasto nadmorskie. Czyli, miasto nadmorskie będzie miało łagodniejszy klimat.