Statistische Rekenmachines
Standaarddeviatie Calculator


Standaarddeviatie Calculator

Gegeven een discrete gegevensset, berekent de calculator het gemiddelde, de variantie en de standaarddeviatie van een steekproef of een populatie en toont alle tussenliggende stappen van de berekeningen.

Steekproef Populatie
Standaardafwijking σ = 5.3385 s = 4.9937
Variantie σ2 = 28.5 s2 = 24.9375
Aantal n = 8 n = 8
Gemiddelde μ = 18.25 x̄ = 18.25
Som van Kwadraten SS = 199.5 SS = 199.5

Er was een fout met uw berekening.

Inhoudsopgave

  1. De Standaardafwijking
  2. De Populatiestandaardafwijking
    1. Voorbeeld van het berekenen van de standaardafwijking van de algemene bevolking
  3. De Steekproefstandaardafwijking
  4. Foutmarge
  5. Het Betrouwbaarheidsinterval
    1. Voorbeeld van de berekening van het betrouwbaarheidsinterval

Standaarddeviatie Calculator

De standaardafwijkingcalculator berekent de standaardafwijking van een reeks getallen. Daarnaast biedt het aanvullende informatie over de getallen, waaronder het gemiddelde en de variantie. De calculator berekent ook het betrouwbaarheidsinterval van de dataset voor verschillende betrouwbaarheidsniveaus en biedt de frequentieverdelingstabel.

Om deze calculator te gebruiken, voert u de getallen in de calculator in, gescheiden door komma's. Selecteer of de getallen een populatie of een steekproef vertegenwoordigen en klik op "Berekenen".

De Standaardafwijking

De standaardafwijking is een statistische maat die de mate van spreiding of variabiliteit van een gegeven gegevensset definieert. Het biedt de geaggregeerde gemiddelde afstand van de datapunten ten opzichte van het gemiddelde van de dataset. Hoe kleiner de standaardafwijking, hoe dichter de datapunten bij het gemiddelde liggen. Omgekeerd, hoe hoger de standaardafwijking, hoe verder de datapunten van het gemiddelde verwijderd zijn. De standaardafwijking is de vierkantswortel van een andere maat voor spreiding genaamd de variantie.

De standaardafwijking wordt berekend op basis van de informatie over de dataset. Als de dataset alle gegevenspunten van belang vertegenwoordigt (populatie), wordt de standaardafwijking de populatiestandaardafwijking genoemd. Als de dataset echter een steekproef uit een populatie vertegenwoordigt, wordt de standaardafwijking de steekproefstandaardafwijking genoemd.

De Populatiestandaardafwijking

De populatiestandaardafwijking wordt berekend wanneer de dataset de populatie van belang vertegenwoordigt. Dat wil zeggen, de dataset vertegenwoordigt alle waarnemingen die in overweging worden genomen. De populatiestandaardafwijking wordt aangeduid met σ.

σ is de kleine letter van een Griekse letter genaamd Sigma. De populatiestandaardafwijking wordt berekend met de formule:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Waar:

  • Σ is de Griekse hoofdletter Sigma, die wordt gebruikt om sommatie in de wiskunde aan te duiden;
  • xᵢ vertegenwoordigt elk van de datapunten (elke waarneming van de dataset), beginnend bij het eerste datapunt tot het Nde (het laatste) datapunt;
  • μ vertegenwoordigt het populatiegemiddelde;
  • n is de populatiegrootte.

Voorbeeld van het berekenen van de standaardafwijking van de algemene bevolking

Het volgende voorbeeld toont aan hoe de standaardafwijking van populatiegegevens te vinden.

Beleggers beschouwen aandelen als een risicovolle activa vanwege hun hoge volatiliteit vergeleken met andere activaklassen. Een investeringsmanager wil de volatiliteit van enkele aandelen in de vorige maand analyseren en zal geen enkel aandeel aan zijn klanten aanbevelen waarvan de standaardafwijking groter is dan of gelijk is aan het gemiddelde, aangezien hij zo'n aandeel "te riskant" vindt.

Hieronder staan alle dagelijkse slotkoersen (in USD) van aandelen voor de vorige maand. Bereken de standaardafwijking en bepaal of de manager het aandeel "te riskant" vindt:

1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81

Merk op dat de manager alleen geïnteresseerd is in de aandelenkoersen van de vorige maand, en de hierboven vermelde prijzen zijn alle prijzen van de vorige maand. Bijgevolg hebben we de populatie tot onze beschikking. Dus we zullen de standaardafwijking berekenen met behulp van de formule voor de standaardafwijking van de populatie.

Om de standaardafwijking te vinden, bereken eerst het gemiddelde. Onthoud dat het gemiddelde μ wordt verkregen door de som van de getallen te delen door het aantal getallen.

$$\mu=\frac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20}=1,097$$

Vervolgens trek je het gemiddelde af van elk getal en kwadrateer je het verschil. Voeg vervolgens de resultaten bij elkaar op en deel het resultaat door het aantal. Het resultaat wordt de variantie σ² genoemd.

$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40-1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$

Neem ten slotte de vierkantswortel van de variantie om de standaardafwijking te krijgen.

$$\sigma=\sqrt{0,045031}\approx0,21$$

Zoals u kunt zien, is de standaardafwijking van de prijzen van dit aandeel voor de vorige maand minder dan het gemiddelde. Dus de manager zal dit aandeel niet als "te riskant" beschouwen.

De Steekproefstandaardafwijking

De steekproefstandaardafwijking wordt berekend wanneer de dataset onder overweging een steekproef uit de populatie van belang vertegenwoordigt. De dataset vertegenwoordigt een kleinere set observaties van alle observaties die in overweging worden genomen. De steekproefstandaardafwijking wordt aangeduid met s. De steekproefstandaardafwijking wordt berekend met behulp van de formule:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Waar:

  • Σ staat voor sommatie;
  • xᵢ vertegenwoordigt elk van de datapunten;
  • vertegenwoordigt het steekproefgemiddelde;
  • n is de steekproefgrootte.

We zullen illustreren hoe de standaardafwijking van steekproefgegevens te vinden, gebruikmakend van hetzelfde voorbeeld als voor de standaardafwijking van de populatie. Maar in deze situatie heeft de investeringsmanager geen toegang tot de slotkoersen van alle handelsdagen van de vorige maand. Hij heeft echter de slotkoersen van enkele willekeurige 5 dagen van de vorige maand. Dientengevolge zal hij de standaardafwijking van slotkoersen van aandelen schatten met behulp van gegevens uit de beschikbare steekproef.

Laten we aannemen dat hij de slotkoersen voor 5 dagen heeft:

1,31, 1,40, 0,86, 0,88, 1,40

Merk op dat de manager geïnteresseerd is in de aandelenkoersen van de vorige maand. Hij heeft echter niet alle prijzen van de vorige maand, maar een kleine subset van de slotkoersen van slechts 5 dagen. Dus in dit geval hebben we te maken met een steekproef. We zullen de standaardafwijking berekenen met behulp van de formule voor de steekproefstandaardafwijking.

Bereken eerst het gemiddelde van de steekproef.

$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$

Bereken vervolgens de variantie .

$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88-1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$

Neem ten slotte de vierkantswortel van de variantie om de standaardafwijking te krijgen.

$$s=\sqrt{0,0764}\approx 0,28$$

Foutmarge

Een van de toepassingen van de standaardafwijking is het berekenen van de "acceptabele" reikwijdte van waarden. Dit speelt een belangrijke rol in de statistische kwaliteitsborging in de industrie en voorspellende analyse. Stel dat de onderliggende gegevens die in overweging worden genomen een normale verdeling volgen. In dat geval wordt deze reeks aangeduid als het betrouwbaarheidsinterval (zie de volgende sectie). Deze betrouwbaarheidsintervallen worden gegeven op verschillende betrouwbaarheidsniveaus (of percentages).

De foutmarge is een onderdeel van het betrouwbaarheidsinterval dat de breedte van het interval aangeeft. Dat wil zeggen, de foutmarge geeft de maximale en de minimale geaccepteerde waarden van de hoeveelheid in overweging.

De foutmarge wordt berekend met behulp van de formule:

$$Foutmarge = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

We passen deze formule toe als de populatiestandaardafwijking, σ, bekend is. En tegelijkertijd moet de steekproef voldoende groot zijn (meestal n>30).

Wanneer de populatiestandaardafwijking onbekend is en de steekproef klein is (meestal n≤30), gebruiken we de volgende formule:

$$Foutmarge = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

In deze formule gebruiken we de steekproefstandaardafwijking s aangezien de populatiestandaardafwijking σ niet bekend is.

\$z_{\alpha/2}\$ en \$t_{n-1, \alpha/2}\$ worden bepaald met behulp van z-statistieken en t-statistieken, respectievelijk, en worden de kritieke waarde genoemd. Ze zijn constanten die geassocieerd zijn met betrouwbaarheidsniveaus.

De meest voorkomende betrouwbaarheidsintervallen die in de statistiek worden gebruikt, zijn 90%, 95% en 99%. En hun \$z_{\alpha/2}\$ waarden zijn 1,645 (voor 90%), 1,96 (voor 95%) en 2,575 (voor 99%)

\$\frac{\sigma}{\sqrt n}\$ of \$\frac{s}{\sqrt n}\$ worden de standaardfout genoemd.

  • \$\frac{\sigma}{\sqrt n}\$ wordt gebruikt wanneer we de standaardafwijking van de populatie σ kennen en we een grote steekproef hebben (meestal n>30).
  • \$\frac{s}{\sqrt n}\$ wordt gebruikt voor gevallen waarin we de standaardafwijking van de populatie niet kennen en we een kleine steekproef hebben (meestal n≤30). Dat wil zeggen, in plaats van de standaardafwijking van de algemene populatie σ, moeten we de standaardafwijking van de steekproef die ons ter beschikking staat s gebruiken.

Het Betrouwbaarheidsinterval

Zoals hierboven geïntroduceerd, is het betrouwbaarheidsinterval een interval (reeks waarden) waarbinnen een bepaalde hoeveelheid naar verwachting ligt op een bepaald betrouwbaarheidsniveau.

Bijvoorbeeld, we kunnen zeggen dat een bepaalde hoeveelheid, zeg de hoogte van 13-jarige meisjes, ligt tussen 59 inch en 66 inch op een betrouwbaarheidsniveau van 90%. Dat wil zeggen, als we een groep 13-jarige meisjes selecteren, zal ongeveer 90% van de tijd hun hoogte tussen de gegeven waarden liggen.

Het betrouwbaarheidsinterval wordt berekend met behulp van de formule:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • is het steekproefgemiddelde,
  • \$z_{\alpha/2}\$ is de kritieke waarde,
  • σ is de populatiestandaardafwijking,
  • n is het aantal waarnemingen.

Een andere formule wordt gebruikt wanneer we de populatiestandaardafwijking σ niet kennen en we in plaats daarvan de steekproefstandaardafwijking s moeten gebruiken:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • is het steekproefgemiddelde,
  • \$t_{n-1,\alpha/2}\$ is de kritieke waarde,
  • s is de steekproefstandaardafwijking,
  • n is het aantal waarnemingen.

Zoals we ons kunnen herinneren uit het vorige hoofdstuk zijn \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ en \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ de foutmarges.

Voorbeeld van de berekening van het betrouwbaarheidsinterval

Stel dat we weten dat de dagelijkse aandelenkoersen die we overwegen een normale verdeling hebben. We hebben een steekproef van aandelenkoersen tot onze beschikking:

1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80

We moeten berekenen binnen welke reikwijdte de aandelenkoersen zullen fluctueren met 95% zekerheid.

Dit is een kleine steekproef en we kennen de populatiestandaardafwijking niet, dus we zullen de steekproefstandaardafwijking gebruiken en de formule om te berekenen:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • is het steekproefgemiddelde, 1,10
  • \$t_{n-1,\alpha/2}$ is de kritieke waarde, \$t_{9, 0,025}\$ = 2,26 (de kritieke waarde voor een gegeven steekproefgrootte en betrouwbaarheidsniveau wordt gewoonlijk berekend uit een z-tabel of t-tabel)
  • s is de steekproefstandaardafwijking, 0,23
  • n is het aantal waarnemingen, 10,
  • \$\frac{s}{\sqrt n}\$ is de standaardfout \$\frac{0,23}{\sqrt{10}}=0,07\$

Dus we zetten de getallen in de formule

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

en we krijgen:

$$1,10 - 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 - 2,26 (\frac{0,23}{3,16}) = 1,10 - 2,26 × 0,07 = 1,10 - 0,16 = 0,94$$

$$1,10 + 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 + 2,26 (\frac{0,23}{3,16}) = 1,10 + 2,26 × 0,07 = 1,10 + 0,16 = 1,26$$

Dit betekent dat we voor 95% zeker zijn dat de gemiddelde aandelenprijs in het betrouwbaarheidsinterval (0,94, 1,26) ligt.