Kalkulatory Statystyczne
Kalkulator Wariancji


Kalkulator Wariancji

Dla danego dyskretnego zbioru danych reprezentującego próbkę lub populację, kalkulator oblicza średnią, wariancję i odchylenie standardowe oraz wyświetla proces obliczeniowy.

Próbka Populacja
Wariancja σ2 = 28.5 s2 = 24.9375
Odchylenie standardowe σ = 5.3385 s = 4.9937
Liczba n = 8 n = 8
Średnia μ = 18.25 x̄ = 18.25
Suma kwadratów SS = 199.5 SS = 199.5

Wystąpił błąd w twoim obliczeniu.

Spis treści

  1. Wariancja jako miara zmienności
  2. Zasady korzystania z tego kalkulatora
  3. Wzór na wariancję: wariancja populacji vs wariancja próbki
    1. Wariancja populacji
    2. Wariancja próbki
  4. Kroki obliczania wariancji
  5. Przykład obliczania wariancji dla próbki
  6. Znaczenie wariancji

Kalkulator Wariancji

Wariancja jako miara zmienności

Jednym z podstawowych aspektów wnioskowania statystycznego dla danego zbioru danych jest zmierzenie metryki, która charakteryzuje zmienność danych od ich średniej. Najbardziej popularne metryki mierzące zmienność to:

  • Wariancja, czyli średnia kwadratów odchyleń od średniej.
  • Odchylenie standardowe - jest to pierwiastek kwadratowy z wariancji. Odchylenie standardowe jest powszechnie używaną metryką do pomiaru dyspersji/zmienności.
  • Współczynnik zmienności, znany także jako względne odchylenie standardowe. Współczynnik zmienności oblicza się jako stosunek odchylenia standardowego σ do średniej μ, czyli \$(C_v=\frac{σ}{μ})\$.

Ten kalkulator znajduje wariancję danego zbioru danych i wyświetla kroki związane z obliczeniem.

Zasady korzystania z tego kalkulatora

Kalkulator wariancji akceptuje dane wejściowe w postaci listy liczb oddzielonych separatorem. Poniższa tabela pokazuje kilka przykładów możliwego wejścia.

wejście wierszem wejście kolumną wejście kolumną wejście kolumną
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Liczby mogą być oddzielone przecinkiem, spacją, znakiem nowej linii lub mieszanką więcej niż jednego typu separatora. Można używać zarówno formatu wierszowego, jak i kolumnowego. Dla wszystkich formatów pokazanych w powyższej tabeli, kalkulator przetwarza dane wejściowe jako 44, 63, 72, 75, 80, 86, 87 i 89.

Po wprowadzeniu danych można wybrać, czy są to dane próbki, czy populacji. Po naciśnięciu przycisku oblicz, kalkulator wyświetla pięć parametrów statystycznych zbioru danych: liczebność (ilość obserwacji), średnia, suma kwadratów odchyleń, wariancja i odchylenie standardowe.

Kalkulator jest zaprojektowany do obliczania wariancji zbioru danych. Zapewnia również wgląd w teorię stojącą za obliczeniami i pokazuje wszystkie kroki związane z tym procesem.

Podczas wnioskowania preferuje się używanie dużego zbioru danych, aby uzyskać dobre statystyki. Jednak często trudno jest uzyskać dane populacyjne reprezentujące wszystkie możliwe obserwacje. Dlatego zasadą jest pobranie "próbki" z populacji. A wnioski o populacji zwykle wyciąga się na podstawie danych próbki.

Wariancja mierzy średnią dyspersję zbioru danych w stosunku do średniej. Zazwyczaj oznaczana jest przez σ² dla populacji i przez dla próbki. Większa wartość σ² lub wskazuje na większą dyspersję punktów danych od średniej próbki i odwrotnie.

Rozważ następujące zestawy danych przykładowych.

(Zestaw I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Zestaw II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Wstawiając Zestaw I do kalkulatora wariancji, otrzymujemy:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

dla próbki, oraz

n=11

μ=16

SS=704

σ²=64

σ=8

dla populacji.

Podobnie, wstawiając Zestaw II do kalkulatora, otrzymujemy:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

dla próbki, oraz

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

dla populacji.

  • W Zestawie I liczby znacznie odchylały się od średniej próbki

s²=70,4

σ²=64

  • W Zestawie II zmienność jest mała

s²=5,6

σ²=5,09

Wzór na wariancję: wariancja populacji vs wariancja próbki

Wariancja populacji

Populacja w statystyce odnosi się do wszystkich możliwych obserwacji w eksperymencie. Dla N obserwacji wariancja populacji wynosi:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

gdzie

  • σ² to wariancja populacji,
  • Σ to suma,
  • xᵢ to każda obserwacja,
  • μ to średnia populacji,
  • n to liczba obserwacji w populacji.

Wariancja próbki

Wariancja próbki jest definiowana jako

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

gdzie

  • to wariancja próbki,
  • Σ to suma,
  • xᵢ to każda obserwacja,
  • to średnia próbki,
  • n to liczba obserwacji w próbce.

Kroki obliczania wariancji

W obliczeniu wariancji uczestniczą następujące kroki.

Krok 1: Oblicz średnią próbki/populacji. Jest to suma wszystkich punktów danych podzielona przez liczbę punktów danych (n dla próbki i N dla populacji), czyli

Średnia próbki:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Średnia populacji:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Krok 2: Oblicz odchylenia poprzez odjęcie średniej próbki/populacji od każdego punktu danych, czyli

Odchylenia próbki:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

Odchylenia populacji:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

Krok 3: Oblicz kwadraty odchyleń dla każdego punktu danych.

Kwadraty odchyleń próbki:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

Kwadraty odchyleń populacji:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

Krok 4: Oblicz sumę kwadratów odchyleń.

Suma kwadratów odchyleń próbki:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Suma kwadratów odchyleń populacji:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Krok 5: Podziel sumę kwadratów odchyleń przez n-1 dla próbki i N dla populacji, aby obliczyć wariancję.

Wariancja próbki:

$$s^2=\frac{SS}{n-1}$$

Wariancja populacji:

$$\sigma^2=\frac{SS}{N}$$

Przykład obliczania wariancji dla próbki

Weźmy pod uwagę następujący zbiór danych: 1, 2, 4, 5, 6 i 12. Aby obliczyć wariancję próbki, postępujemy zgodnie z następującymi krokami:

Krok 1: Oblicz średnią próbki (średnią arytmetyczną).

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Krok 2: Oblicz odchylenia od średniej dla każdego punktu danych.

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Krok 3: Oblicz kwadraty odchyleń.

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

Krok 4: Zsumuj kwadraty odchyleń.

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2=16+9+1+0+1+49=76$$

Krok 5: Oblicz wariancję próbki przez podzielenie sumy kwadratów odchyleń przez stopnie swobody (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$

Dla populacji, dzielilibyśmy przez n (całkowitą liczbę punktów danych), a nie przez n-1, aby obliczyć wariancję populacji.

Znaczenie wariancji

Dyspersja jest używana w inwestowaniu. Pomaga menedżerom aktywów poprawić wyniki ich inwestycji. Analitycy finansowi mogą używać wariancji do oceny indywidualnej wydajności składników portfela inwestycyjnego.

Inwestorzy obliczają wariancję, rozważając nowy zakup, aby zdecydować, czy inwestycja jest warta ryzyka. Dyspersja pomaga analitykom określić miarę niepewności, która jest trudna do skwantyfikowania bez wariancji i odchylenia standardowego.

Niepewność nie jest bezpośrednio mierzalna. Ale wariancja i odchylenie standardowe (pierwiastek kwadratowy wariancji) pomagają określić postrzegany wpływ określonego akcji na portfel.

Naukowcy, statystycy, matematycy i analitycy danych również mogą używać wariancji. Pomaga to zapewnić przydatne informacje o eksperymencie lub populacji próbki.

Naukowcy mogą szukać różnic między grupami testowymi, aby określić, czy są one wystarczająco podobne, aby z powodzeniem przetestować hipotezę. Im wyższa wariancja zbioru danych, tym bardziej rozproszone wartości w zbiorze danych. Badacze danych mogą używać tych informacji, aby zobaczyć, jak dobrze średnia reprezentuje zbiór danych.

Wadą używania wariancji jest to, że duże wartości odstające w zbiorze mogą prowadzić do pewnego zniekształcenia danych. Jest to spowodowane tym, że wartości odstające mogą jeszcze bardziej zwiększyć swoją wagę po podniesieniu do kwadratu.

Wielu badaczy woli pracować ze standardowym odchyleniem, obliczanym jako pierwiastek kwadratowy wariancji. Standardowe odchylenie jest mniej podatne na wartości odstające, jest mniejszą liczbą i łatwiejsze do interpretacji.