Geen resultaten gevonden
We kunnen momenteel niets met die term vinden, probeer iets anders te zoeken.
Gegeven een discrete gegevensset, berekent de calculator het gemiddelde, de variantie en de standaarddeviatie van een steekproef of een populatie en toont alle tussenliggende stappen van de berekeningen.
Steekproef | Populatie | |
---|---|---|
Standaardafwijking | σ = 5.3385 | s = 4.9937 |
Variantie | σ2 = 28.5 | s2 = 24.9375 |
Aantal | n = 8 | n = 8 |
Gemiddelde | μ = 18.25 | x̄ = 18.25 |
Som van Kwadraten | SS = 199.5 | SS = 199.5 |
Er was een fout met uw berekening.
De standaardafwijkingcalculator berekent de standaardafwijking van een reeks getallen. Daarnaast biedt het aanvullende informatie over de getallen, waaronder het gemiddelde en de variantie. De calculator berekent ook het betrouwbaarheidsinterval van de dataset voor verschillende betrouwbaarheidsniveaus en biedt de frequentieverdelingstabel.
Om deze calculator te gebruiken, voert u de getallen in de calculator in, gescheiden door komma's. Selecteer of de getallen een populatie of een steekproef vertegenwoordigen en klik op "Berekenen".
De standaardafwijking is een statistische maat die de mate van spreiding of variabiliteit van een gegeven gegevensset definieert. Het biedt de geaggregeerde gemiddelde afstand van de datapunten ten opzichte van het gemiddelde van de dataset. Hoe kleiner de standaardafwijking, hoe dichter de datapunten bij het gemiddelde liggen. Omgekeerd, hoe hoger de standaardafwijking, hoe verder de datapunten van het gemiddelde verwijderd zijn. De standaardafwijking is de vierkantswortel van een andere maat voor spreiding genaamd de variantie.
De standaardafwijking wordt berekend op basis van de informatie over de dataset. Als de dataset alle gegevenspunten van belang vertegenwoordigt (populatie), wordt de standaardafwijking de populatiestandaardafwijking genoemd. Als de dataset echter een steekproef uit een populatie vertegenwoordigt, wordt de standaardafwijking de steekproefstandaardafwijking genoemd.
De populatiestandaardafwijking wordt berekend wanneer de dataset de populatie van belang vertegenwoordigt. Dat wil zeggen, de dataset vertegenwoordigt alle waarnemingen die in overweging worden genomen. De populatiestandaardafwijking wordt aangeduid met σ.
σ is de kleine letter van een Griekse letter genaamd Sigma. De populatiestandaardafwijking wordt berekend met de formule:
$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$
Waar:
Het volgende voorbeeld toont aan hoe de standaardafwijking van populatiegegevens te vinden.
Beleggers beschouwen aandelen als een risicovolle activa vanwege hun hoge volatiliteit vergeleken met andere activaklassen. Een investeringsmanager wil de volatiliteit van enkele aandelen in de vorige maand analyseren en zal geen enkel aandeel aan zijn klanten aanbevelen waarvan de standaardafwijking groter is dan of gelijk is aan het gemiddelde, aangezien hij zo'n aandeel "te riskant" vindt.
Hieronder staan alle dagelijkse slotkoersen (in USD) van aandelen voor de vorige maand. Bereken de standaardafwijking en bepaal of de manager het aandeel "te riskant" vindt:
1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81
Merk op dat de manager alleen geïnteresseerd is in de aandelenkoersen van de vorige maand, en de hierboven vermelde prijzen zijn alle prijzen van de vorige maand. Bijgevolg hebben we de populatie tot onze beschikking. Dus we zullen de standaardafwijking berekenen met behulp van de formule voor de standaardafwijking van de populatie.
Om de standaardafwijking te vinden, bereken eerst het gemiddelde. Onthoud dat het gemiddelde μ wordt verkregen door de som van de getallen te delen door het aantal getallen.
$$\mu=\frac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20}=1,097$$
Vervolgens trek je het gemiddelde af van elk getal en kwadrateer je het verschil. Voeg vervolgens de resultaten bij elkaar op en deel het resultaat door het aantal. Het resultaat wordt de variantie σ² genoemd.
$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40-1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$
Neem ten slotte de vierkantswortel van de variantie om de standaardafwijking te krijgen.
$$\sigma=\sqrt{0,045031}\approx0,21$$
Zoals u kunt zien, is de standaardafwijking van de prijzen van dit aandeel voor de vorige maand minder dan het gemiddelde. Dus de manager zal dit aandeel niet als "te riskant" beschouwen.
De steekproefstandaardafwijking wordt berekend wanneer de dataset onder overweging een steekproef uit de populatie van belang vertegenwoordigt. De dataset vertegenwoordigt een kleinere set observaties van alle observaties die in overweging worden genomen. De steekproefstandaardafwijking wordt aangeduid met s. De steekproefstandaardafwijking wordt berekend met behulp van de formule:
$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$
Waar:
We zullen illustreren hoe de standaardafwijking van steekproefgegevens te vinden, gebruikmakend van hetzelfde voorbeeld als voor de standaardafwijking van de populatie. Maar in deze situatie heeft de investeringsmanager geen toegang tot de slotkoersen van alle handelsdagen van de vorige maand. Hij heeft echter de slotkoersen van enkele willekeurige 5 dagen van de vorige maand. Dientengevolge zal hij de standaardafwijking van slotkoersen van aandelen schatten met behulp van gegevens uit de beschikbare steekproef.
Laten we aannemen dat hij de slotkoersen voor 5 dagen heeft:
1,31, 1,40, 0,86, 0,88, 1,40
Merk op dat de manager geïnteresseerd is in de aandelenkoersen van de vorige maand. Hij heeft echter niet alle prijzen van de vorige maand, maar een kleine subset van de slotkoersen van slechts 5 dagen. Dus in dit geval hebben we te maken met een steekproef. We zullen de standaardafwijking berekenen met behulp van de formule voor de steekproefstandaardafwijking.
Bereken eerst het gemiddelde van de steekproef.
$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$
Bereken vervolgens de variantie s².
$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88-1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$
Neem ten slotte de vierkantswortel van de variantie om de standaardafwijking te krijgen.
$$s=\sqrt{0,0764}\approx 0,28$$
Een van de toepassingen van de standaardafwijking is het berekenen van de "acceptabele" reikwijdte van waarden. Dit speelt een belangrijke rol in de statistische kwaliteitsborging in de industrie en voorspellende analyse. Stel dat de onderliggende gegevens die in overweging worden genomen een normale verdeling volgen. In dat geval wordt deze reeks aangeduid als het betrouwbaarheidsinterval (zie de volgende sectie). Deze betrouwbaarheidsintervallen worden gegeven op verschillende betrouwbaarheidsniveaus (of percentages).
De foutmarge is een onderdeel van het betrouwbaarheidsinterval dat de breedte van het interval aangeeft. Dat wil zeggen, de foutmarge geeft de maximale en de minimale geaccepteerde waarden van de hoeveelheid in overweging.
De foutmarge wordt berekend met behulp van de formule:
$$Foutmarge = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$
We passen deze formule toe als de populatiestandaardafwijking, σ, bekend is. En tegelijkertijd moet de steekproef voldoende groot zijn (meestal n>30).
Wanneer de populatiestandaardafwijking onbekend is en de steekproef klein is (meestal n≤30), gebruiken we de volgende formule:
$$Foutmarge = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
In deze formule gebruiken we de steekproefstandaardafwijking s aangezien de populatiestandaardafwijking σ niet bekend is.
\$z_{\alpha/2}\$ en \$t_{n-1, \alpha/2}\$ worden bepaald met behulp van z-statistieken en t-statistieken, respectievelijk, en worden de kritieke waarde genoemd. Ze zijn constanten die geassocieerd zijn met betrouwbaarheidsniveaus.
De meest voorkomende betrouwbaarheidsintervallen die in de statistiek worden gebruikt, zijn 90%, 95% en 99%. En hun \$z_{\alpha/2}\$ waarden zijn 1,645 (voor 90%), 1,96 (voor 95%) en 2,575 (voor 99%)
\$\frac{\sigma}{\sqrt n}\$ of \$\frac{s}{\sqrt n}\$ worden de standaardfout genoemd.
Zoals hierboven geïntroduceerd, is het betrouwbaarheidsinterval een interval (reeks waarden) waarbinnen een bepaalde hoeveelheid naar verwachting ligt op een bepaald betrouwbaarheidsniveau.
Bijvoorbeeld, we kunnen zeggen dat een bepaalde hoeveelheid, zeg de hoogte van 13-jarige meisjes, ligt tussen 59 inch en 66 inch op een betrouwbaarheidsniveau van 90%. Dat wil zeggen, als we een groep 13-jarige meisjes selecteren, zal ongeveer 90% van de tijd hun hoogte tussen de gegeven waarden liggen.
Het betrouwbaarheidsinterval wordt berekend met behulp van de formule:
$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$
Een andere formule wordt gebruikt wanneer we de populatiestandaardafwijking σ niet kennen en we in plaats daarvan de steekproefstandaardafwijking s moeten gebruiken:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
Zoals we ons kunnen herinneren uit het vorige hoofdstuk zijn \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ en \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ de foutmarges.
Stel dat we weten dat de dagelijkse aandelenkoersen die we overwegen een normale verdeling hebben. We hebben een steekproef van aandelenkoersen tot onze beschikking:
1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80
We moeten berekenen binnen welke reikwijdte de aandelenkoersen zullen fluctueren met 95% zekerheid.
Dit is een kleine steekproef en we kennen de populatiestandaardafwijking niet, dus we zullen de steekproefstandaardafwijking gebruiken en de formule om te berekenen:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
Dus we zetten de getallen in de formule
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
en we krijgen:
$$1,10 - 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 - 2,26 (\frac{0,23}{3,16}) = 1,10 - 2,26 × 0,07 = 1,10 - 0,16 = 0,94$$
$$1,10 + 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 + 2,26 (\frac{0,23}{3,16}) = 1,10 + 2,26 × 0,07 = 1,10 + 0,16 = 1,26$$
Dit betekent dat we voor 95% zeker zijn dat de gemiddelde aandelenprijs in het betrouwbaarheidsinterval (0,94, 1,26) ligt.