Statistische Rekenmachines
Standaardafwijking


Standaardafwijking

Met behulp van een discrete gegevensset berekent de rekenmachine het gemiddelde, de variantie en de standaardafwijking van een steekproef of een populatie en toont alle tussenliggende stappen van de berekeningen.

Resultaat
Standaardafwijking s = 4.5
Variantie s2 = 20.24
Aantal n = 7
Gemiddelde x̄ = 14.29
Som van Kwadraten SS = 100

Er was een fout met uw berekening.

Inhoudsopgave

  1. Standaardafwijking als statistische maat
  2. De regels voor het gebruik van deze rekenmachine
  3. De problemen waarvoor deze rekenmachine is ontworpen
  4. Formules voor het berekenen van de standaardafwijking
  5. Berekening van de standaardafwijking
  6. Voorbeeld van standaardafwijking berekening van een steekproef
  7. Toepassingen van Standaardafwijking

Standaardafwijking

Standaardafwijking als statistische maat

Standaardafwijking is een van de meest gebruikte maatstaven om de statistieken van een gegeven gegevensset te karakteriseren. De standaardafwijking is eenvoudig gezegd een maat voor hoe verspreid de gegevensset is. Door het berekenen van de standaardafwijking kunt u nagaan of de getallen dicht bij of ver van het gemiddelde liggen. Als de gegevenspunten ver van het gemiddelde af liggen, dan is er een grote afwijking in de gegevensset. Dus hoe groter de spreiding in de gegevens, hoe hoger de standaardafwijking.

Deze rekenmachine definieert de standaardafwijking van een gegeven gegevensset en toont de wiskundige stappen die bij de berekening zijn betrokken.

De regels voor het gebruik van deze rekenmachine

De rekenmachine accepteert de invoer als een lijst van getallen gescheiden door een scheidingsteken. Een paar voorbeelden van mogelijke invoeren worden in de onderstaande tabel getoond.

rij invoer kolom invoer kolom invoer kolom invoer
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

De getallen kunnen gescheiden worden door een komma/spatie/regeleinde of een mix daarvan en kunnen zowel in rij- als kolomformaat worden ingevoerd. Voor alle in de bovenstaande tabel getoonde formaten verwerkt de rekenmachine de invoer als 44, 63, 72, 75, 80, 86, 87 en 89.

Nadat u de gegevens hebt ingevoerd, selecteert u of het om een steekproef of populatiegegevens gaat en drukt u op enter. De rekenmachine geeft vijf statistische parameters van de gegevensset weer: aantal (aantal waarnemingen), gemiddelde, som van gekwadrateerde afwijkingen, variantie en standaardafwijking.

De problemen waarvoor deze rekenmachine is ontworpen

De rekenmachine is ontworpen om de standaardafwijking van een discrete gegevensset te berekenen en biedt inzicht in de theorie achter de berekening.

De gegevens kunnen bestaan uit een populatie die bestaat uit alle mogelijke waarnemingen in een experiment (van welke aard dan ook) onder de gespecificeerde voorwaarden. In veel gevallen is het onmogelijk om elk lid van de populatie te bemonsteren.

In de statistische praktijk is het gebruikelijk om te werken met een subset van een grotere 'populatie', die we aanduiden als een 'steekproef'. Dit komt omdat het vaak onpraktisch of onmogelijk is om gegevens te verzamelen van elk individu in de populatie. We maken schattingen of inferenties over de populatie op basis van de informatie die uit de steekproef is verzameld.

Bij het berekenen van de standaardafwijking wordt de formule die we gebruiken aangepast afhankelijk van of we te maken hebben met een steekproef of de gehele populatie. Deze aanpassing wordt gemaakt door een factor die bekend staat als 'vrijheidsgraden'. Voor een steekproef delen we door n - 1 (waar n de steekproefgrootte is) in plaats van n bij het berekenen van de variantie, die vervolgens gekwadrateerd wordt om de standaardafwijking te vinden. Deze correctie compenseert het feit dat we steekproefgegevens gebruiken om de populatiestandaardafwijking te schatten en zorgt ervoor dat onze schatting onbevooroordeeld is.

Standaardafwijking meet de gemiddelde spreiding/afwijking/variabiliteit van een gegevensset ten opzichte van het gemiddelde. Het wordt vaak aangeduid met de Griekse letter σ voor een populatie of s voor een steekproef. Een grotere waarde van σ of s impliceert een grotere spreiding van gegevenspunten van het steekproefgemiddelde en vice versa.

Beschouw de volgende voorbeelden van gegevenssets.

(Set I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(Set II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20 Als we deze gegevenssets in de rekenmachine invoeren, krijgen we voor set I

  • x̄=16 - de gemiddelde waarde
  • s=8,3904708 - standaardafwijking

Voor set II

  • x̄=16 - de gemiddelde waarde
  • s=2,3664319 - standaardafwijking

In set I weken de getallen aanzienlijk af van het steekproefgemiddelde (s=8,39) terwijl in set II de variabiliteit klein is (s=2,36) in vergelijking met set I.

Formules voor het berekenen van de standaardafwijking

Deze formule wordt toegepast wanneer alle waarden van de populatie worden geanalyseerd.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ is de standaardafwijking van de populatie,
  • xᵢ is de waarde van een individuele waarde van de populatie,
  • μ is het rekenkundig gemiddelde van de populatie,
  • n is de omvang van de populatie.

De onderstaande formule wordt gebruikt wanneer er een zeer grote omvang van de populatie is en alleen een steekproef ervan wordt genomen voor analyse.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s is de standaardafwijking van de steekproef,
  • xᵢ is de waarde van een individuele steekproefwaarde,
  • is het gemiddelde van de steekproef,
  • n is de steekproefgrootte.

Berekening van de standaardafwijking

De volgende stappen zijn betrokken bij de berekening van de standaardafwijking.

Stap 1: Bereken het gemiddelde van de steekproef/populatie. Dit is de som van alle datapunten gedeeld door het aantal waarnemingen N of n, oftewel

Steekproefgemiddelde:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

Populatiegemiddelde:

$$\mu=\frac{x₁+x₂+x₃+........+x_N}{N}$$

Stap 2: Bereken de afwijkingen door van elk datapunt het steekproef-/populatiegemiddelde af te trekken, dat wil zeggen

Afwijkingen steekproef:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x})…………………… (x_n-\bar{x})$$

Afwijkingen populatie:

$$(x₁-\mu), (x₂-\mu), (x₃-\mu)……………….. (x_N-\mu)$$

Stap 3: Bereken de gekwadrateerde afwijkingen voor elk datapunt.

Gekwadrateerde afwijkingen steekproef:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2…………………… (x_n-\bar{x})^2$$

Gekwadrateerde afwijkingen populatie:

$$(x₁-\mu)^2, (x₂-\mu)^2, (x₃-\mu)^2……………….. (x_N-\mu)^2$$

Stap 4: Bereken de som van de gekwadrateerde afwijkingen door alle individuele gekwadrateerde afwijkingen op te tellen

Som van gekwadrateerde afwijkingen steekproef:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

Som van gekwadrateerde afwijkingen populatie:

$$SS=(x₁-\mu)^2+ (x₂-\mu)^2+(x₃-\mu)^2……………….+ (x_N-\mu)^2$$

Stap 5: Deel de som van de gekwadrateerde afwijkingen door het aantal vrijheidsgraden om de variantie te verkrijgen. Voor een populatie deel je door N, en voor een steekproef door n-1.

Variantie steekproef

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Variantie populatie

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

Bij het berekenen van de variantie voor een steekproef zouden we kunnen aannemen dat we de uitdrukking voor de berekeningen gebruiken:

$$\frac{(x-\bar{x})^2}{n}$$

waarbij

x̄ het steekproefgemiddelde is en n de steekproefgrootte. Maar zo'n formule wordt niet gebruikt.

Zo'n uitdrukking zou geen goede schatting geven van de variantie van de populatie. Wanneer de algemene populatie erg groot is en de steekproef erg klein, zou de variantie berekend door deze formule de variantie van de populatie onderschatten. Dit zou een te kleine variantie laten zien vanwege een gebrek aan gegevens. Dus door de uitdrukking n-1 te gebruiken vergroten we de potentiële variantiewaarde.

In plaats van te delen door n, vinden we de variantie van de steekproef door te delen door n-1. Deze bewerking geeft een iets grotere variantiewaarde, dichter bij de werkelijke waarde.

Stap 6: Trek de vierkantswortel van het resulterende getal. De standaardafwijking is de vierkantswortel van de variantie.

Standaardafwijking steekproef

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

Standaardafwijking populatie

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

Voorbeeld van standaardafwijking berekening van een steekproef

Laten we de volgende cijfers van n=8 studenten in de eindtoets Natuurkunde overwegen:

45, 67, 70, 75, 80, 81, 82, en 84

De rekenmachine berekent de standaardafwijking van de steekproef met de volgende stappen:

Stap 1: Bereken het gemiddelde.

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+67+70+75+80+81+82+84}{8}=73$$

Stap 2: Bereken de afwijkingen

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Stap 3: Bereken de kwadraten van de afwijkingen

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Stap 4: Sommeer de gekwadrateerde afwijkingen.

$$SS=\sum_{i}^{n}{(x_i-\bar{x})}^2=784+36+9+4+49+64+81+121=1148$$

Stap 5: Bereken de variantie door de som van de gekwadrateerde afwijkingen te delen door de vrijheidsgraden (n-1). Voor een populatie zou de variantie in deze stap gedeeld worden door N in plaats van N-1. In dit geval hebben we een steekproef, dat wil zeggen, gegevens van een deel van de studentenpopulatie, niet de gehele populatie.

$$s^2=\frac{\sum_{i}^{n}{(x_i-\bar{x})}^2}{n-1}=\frac{1148}{8-1}=164$$

Stap 6: Neem de vierkantswortel van de variantie om de standaardafwijking te verkrijgen.

$$s=\sqrt{s^2}=\sqrt{164}=12,80$$

Toepassingen van Standaardafwijking

Dispersie en standaardafwijking kunnen worden gebruikt om de spreiding van de gegevens te bepalen. Als de variantie of standaardafwijking groot is, zijn de gegevens meer verspreid. Deze informatie is nuttig bij het vergelijken van twee (of meer) datasets om te bepalen welke meer (de meeste) variabiliteit heeft.

In de industrie wordt de standaardafwijking veel gebruikt voor kwaliteitscontrole. Bij grootschalige productie moeten bepaalde producteigenschappen binnen een gedefinieerd bereik vallen dat kan worden vastgesteld door het berekenen van de standaardafwijking. Bijvoorbeeld, in de productie van moeren en bouten moet de variatie in hun diameters klein zijn, anders passen de onderdelen niet in elkaar.

Een standaardafwijking wordt in de financiën en vele andere gebieden gebruikt om risico's te beoordelen. In technische analyse wordt de standaardafwijking gebruikt om Bollinger-lijnen te construeren en volatiliteit te berekenen.

Ook wordt de standaardafwijking in de financiën gebruikt als een maat voor volatiliteit en in de sociologie wordt het gebruikt in publieke opiniepeilingen om onzekerheid te helpen berekenen.

De variantie en standaardafwijking worden gebruikt om te bepalen hoeveel gegevenswaarden binnen een gegeven distributie-interval vallen. Bijvoorbeeld, de stelling van Chebyshev toont aan dat voor elke distributie, ten minste 75% van de gegevenswaarden binnen 2 standaardafwijkingen van het gemiddelde zal zijn.

Laten we een eenvoudig voorbeeld nemen met het klimaat. Stel dat we de dagelijkse temperatuur van twee steden in dezelfde regio bestuderen. De ene stad ligt aan de kust en de andere in het binnenland. De gemiddelde maximale dagelijkse temperatuur in deze twee steden kan hetzelfde zijn. Maar de standaardafwijking, dat wil zeggen de spreiding van maximale dagelijkse temperaturen, zal groter zijn voor de stad gelegen op het continent, en de kuststad zal een kleinere standaardafwijking van maximale dagtemperaturen hebben.

Dit betekent dat een continentale stad een grotere variatie in maximale luchttemperatuur zal hebben op een willekeurige dag van het jaar dan een kuststad. Dat wil zeggen, de kuststad zal een milder klimaat hebben.