Nie znaleziono wyników
Nie możemy teraz znaleźć niczego z tym terminem, spróbuj wyszukać coś innego.
Dla danego dyskretnego zbioru danych reprezentującego próbkę lub populację, kalkulator oblicza średnią, wariancję i odchylenie standardowe oraz wyświetla proces obliczeniowy.
Próbka | Populacja | |
---|---|---|
Wariancja | σ2 = 28.5 | s2 = 24.9375 |
Odchylenie standardowe | σ = 5.3385 | s = 4.9937 |
Liczba | n = 8 | n = 8 |
Średnia | μ = 18.25 | x̄ = 18.25 |
Suma kwadratów | SS = 199.5 | SS = 199.5 |
Wystąpił błąd w twoim obliczeniu.
Jednym z podstawowych aspektów wnioskowania statystycznego dla danego zbioru danych jest zmierzenie metryki, która charakteryzuje zmienność danych od ich średniej. Najbardziej popularne metryki mierzące zmienność to:
Ten kalkulator znajduje wariancję danego zbioru danych i wyświetla kroki związane z obliczeniem.
Kalkulator wariancji akceptuje dane wejściowe w postaci listy liczb oddzielonych separatorem. Poniższa tabela pokazuje kilka przykładów możliwego wejścia.
wejście wierszem | wejście kolumną | wejście kolumną | wejście kolumną |
---|---|---|---|
44, 63, 72, 75, 80, 86, 87, 89 | 44 | 44, | 44,63,72 |
44 63 72 75 80 86 87 89 | 63 | 63, | 75,80 |
44,, 63,, 72, 75, 80, 86, 87, 89 | 72 | 72, | 86,87 |
44 63 72 75, 80, 86, 87, 89 | 75 | 75, | 89 |
44; 63; 72, 75,, 80, 86, 87, 89 | 80 | 80, | |
44,,, 63,, 72, 75, 80, 86, 87, 89 | 86 | 86, | |
44 63,, 72,,,, 75, 80, 86, 87, 89 | 87 | 87, | |
89 | 89, |
Liczby mogą być oddzielone przecinkiem, spacją, znakiem nowej linii lub mieszanką więcej niż jednego typu separatora. Można używać zarówno formatu wierszowego, jak i kolumnowego. Dla wszystkich formatów pokazanych w powyższej tabeli, kalkulator przetwarza dane wejściowe jako 44, 63, 72, 75, 80, 86, 87 i 89.
Po wprowadzeniu danych można wybrać, czy są to dane próbki, czy populacji. Po naciśnięciu przycisku oblicz, kalkulator wyświetla pięć parametrów statystycznych zbioru danych: liczebność (ilość obserwacji), średnia, suma kwadratów odchyleń, wariancja i odchylenie standardowe.
Kalkulator jest zaprojektowany do obliczania wariancji zbioru danych. Zapewnia również wgląd w teorię stojącą za obliczeniami i pokazuje wszystkie kroki związane z tym procesem.
Podczas wnioskowania preferuje się używanie dużego zbioru danych, aby uzyskać dobre statystyki. Jednak często trudno jest uzyskać dane populacyjne reprezentujące wszystkie możliwe obserwacje. Dlatego zasadą jest pobranie "próbki" z populacji. A wnioski o populacji zwykle wyciąga się na podstawie danych próbki.
Wariancja mierzy średnią dyspersję zbioru danych w stosunku do średniej. Zazwyczaj oznaczana jest przez σ² dla populacji i przez s² dla próbki. Większa wartość σ² lub s² wskazuje na większą dyspersję punktów danych od średniej próbki i odwrotnie.
Rozważ następujące zestawy danych przykładowych.
(Zestaw I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,
(Zestaw II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20
Wstawiając Zestaw I do kalkulatora wariancji, otrzymujemy:
n=11
x̄=16
SS=704
s²=70,4
s=8,39
dla próbki, oraz
n=11
μ=16
SS=704
σ²=64
σ=8
dla populacji.
Podobnie, wstawiając Zestaw II do kalkulatora, otrzymujemy:
n=11
x̄=16
SS=56
s²=5,6
s=2,36
dla próbki, oraz
n=11
μ=16
SS=56
σ²=5,09
σ=2,25
dla populacji.
s²=70,4
σ²=64
s²=5,6
σ²=5,09
Populacja w statystyce odnosi się do wszystkich możliwych obserwacji w eksperymencie. Dla N obserwacji wariancja populacji wynosi:
$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$
gdzie
Wariancja próbki jest definiowana jako
$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$
gdzie
W obliczeniu wariancji uczestniczą następujące kroki.
Krok 1: Oblicz średnią próbki/populacji. Jest to suma wszystkich punktów danych podzielona przez liczbę punktów danych (n dla próbki i N dla populacji), czyli
Średnia próbki:
$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$
Średnia populacji:
$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$
Krok 2: Oblicz odchylenia poprzez odjęcie średniej próbki/populacji od każdego punktu danych, czyli
Odchylenia próbki:
$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$
Odchylenia populacji:
$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$
Krok 3: Oblicz kwadraty odchyleń dla każdego punktu danych.
Kwadraty odchyleń próbki:
$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$
Kwadraty odchyleń populacji:
$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$
Krok 4: Oblicz sumę kwadratów odchyleń.
Suma kwadratów odchyleń próbki:
$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$
Suma kwadratów odchyleń populacji:
$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$
Krok 5: Podziel sumę kwadratów odchyleń przez n-1 dla próbki i N dla populacji, aby obliczyć wariancję.
Wariancja próbki:
$$s^2=\frac{SS}{n-1}$$
Wariancja populacji:
$$\sigma^2=\frac{SS}{N}$$
Weźmy pod uwagę następujący zbiór danych: 1, 2, 4, 5, 6 i 12. Aby obliczyć wariancję próbki, postępujemy zgodnie z następującymi krokami:
Krok 1: Oblicz średnią próbki (średnią arytmetyczną).
$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$
Krok 2: Oblicz odchylenia od średniej dla każdego punktu danych.
x₁-x̄ | x₂-x̄ | x₃-x̄ | x₄-x̄ | x₅-x̄ | x₆-x̄ |
---|---|---|---|---|---|
1 - 5 | 2 - 5 | 4 - 5 | 5 - 5 | 6 - 5 | 12 - 5 |
-4 | -3 | -1 | 0 | 1 | 7 |
Krok 3: Oblicz kwadraty odchyleń.
(x₁-x̄)² | (x₂-x̄)² | (x₃-x̄)² | (x₄-x̄)² | (x₅-x̄)² | (x₆-x̄)² |
---|---|---|---|---|---|
16 | 9 | 1 | 0 | 1 | 49 |
Krok 4: Zsumuj kwadraty odchyleń.
$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2=16+9+1+0+1+49=76$$
Krok 5: Oblicz wariancję próbki przez podzielenie sumy kwadratów odchyleń przez stopnie swobody (n-1).
$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$
Dla populacji, dzielilibyśmy przez n (całkowitą liczbę punktów danych), a nie przez n-1, aby obliczyć wariancję populacji.
Dyspersja jest używana w inwestowaniu. Pomaga menedżerom aktywów poprawić wyniki ich inwestycji. Analitycy finansowi mogą używać wariancji do oceny indywidualnej wydajności składników portfela inwestycyjnego.
Inwestorzy obliczają wariancję, rozważając nowy zakup, aby zdecydować, czy inwestycja jest warta ryzyka. Dyspersja pomaga analitykom określić miarę niepewności, która jest trudna do skwantyfikowania bez wariancji i odchylenia standardowego.
Niepewność nie jest bezpośrednio mierzalna. Ale wariancja i odchylenie standardowe (pierwiastek kwadratowy wariancji) pomagają określić postrzegany wpływ określonego akcji na portfel.
Naukowcy, statystycy, matematycy i analitycy danych również mogą używać wariancji. Pomaga to zapewnić przydatne informacje o eksperymencie lub populacji próbki.
Naukowcy mogą szukać różnic między grupami testowymi, aby określić, czy są one wystarczająco podobne, aby z powodzeniem przetestować hipotezę. Im wyższa wariancja zbioru danych, tym bardziej rozproszone wartości w zbiorze danych. Badacze danych mogą używać tych informacji, aby zobaczyć, jak dobrze średnia reprezentuje zbiór danych.
Wadą używania wariancji jest to, że duże wartości odstające w zbiorze mogą prowadzić do pewnego zniekształcenia danych. Jest to spowodowane tym, że wartości odstające mogą jeszcze bardziej zwiększyć swoją wagę po podniesieniu do kwadratu.
Wielu badaczy woli pracować ze standardowym odchyleniem, obliczanym jako pierwiastek kwadratowy wariancji. Standardowe odchylenie jest mniej podatne na wartości odstające, jest mniejszą liczbą i łatwiejsze do interpretacji.