Statistikberegnere
Standardafvigelse-beregner


Standardafvigelse-beregner

Gratis standardafvigelse-beregner med trin-for-trin løsninger. Find hurtigt gennemsnit, varians og standardafvigelse for stikprøve- eller populationsdata.

Stikprøve Population
Standardafvigelse σ = 5.3385 s = 4.9937
Varians σ2 = 28.5 s2 = 24.9375
Antal n = 8 n = 8
Gennemsnit μ = 18.25 x̄ = 18.25
Kvadratsum SS = 199.5 SS = 199.5

Der opstod en fejl i din beregning.

Indholdsfortegnelse

  1. Standardafvigelsen
  2. Populationens standardafvigelse
    1. Eksempel på beregning af standardafvigelsen for en generel population
  3. Stikprøvens standardafvigelse
  4. Fejlmargin
  5. Konfidensintervallet
    1. Eksempel på beregning af konfidensinterval

Standardafvigelse-beregner

Vores standardafvigelse-beregner er et kraftfuldt og brugervenligt værktøj designet til at finde standardafvigelsen for ethvert datasæt. Ud over at beregne standardafvigelsen genererer den øjeblikkeligt vigtige statistiske indsigter, herunder gennemsnit, varians og en detaljeret frekvensfordelingstabel. Derudover beregner dette værktøj konfidensintervallet for dit datasæt på tværs af forskellige konfidensniveauer.

For at komme i gang skal du blot indtaste dine datapunkter adskilt af kommaer. Vælg derefter, om dine tal repræsenterer en hel population eller en stikprøve, og klik på "Beregn" for at se dine omfattende resultater.

Standardafvigelsen

Standardafvigelse er et grundlæggende statistisk mål, der angiver graden af spredning eller variabilitet inden for et givet datasæt. Den repræsenterer den gennemsnitlige afstand af dine datapunkter fra datasættets gennemsnit (middelværdi). En lavere standardafvigelse betyder, at datapunkterne klumper sig tæt omkring gennemsnittet, mens en højere standardafvigelse indikerer, at dataene er bredt spredt ud. Matematisk set er standardafvigelsen kvadratroden af variansen – et andet afgørende mål for datadispersion.

Hvordan du beregner standardafvigelsen afhænger fuldstændigt af dit datasæt. Hvis dine data inkluderer hvert eneste medlem af den gruppe, du undersøger, skal du beregne populationens standardafvigelse. Hvis dine data derimod kun er en undergruppe af en større gruppe, skal du beregne stikprøvens standardafvigelse.

Populationens standardafvigelse

Du bør beregne populationens standardafvigelse, når dit datasæt inkluderer alle mulige observationer inden for din interessegruppe. I statistik betegnes populationens standardafvigelse med symbolet σ.

σ (udtalt "sigma") er et lille græsk bogstav. Formlen for populationens standardafvigelse er som følger:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Hvor:

  • Σ er det græske store bogstav Sigma, som betegner summation (summen) i matematik;
  • xᵢ repræsenterer hvert enkelt datapunkt (observation) i datasættet, fra den første værdi til den N'te (sidste) værdi;
  • μ repræsenterer populationens gennemsnit;
  • N er den samlede populationsstørrelse.

Eksempel på beregning af standardafvigelsen for en generel population

Følgende eksempel demonstrerer, hvordan man finder standardafvigelsen for populationsdata.

Investorer betragter ofte aktier som risikable aktiver på grund af deres høje prisvolatilitet sammenlignet med andre investeringsklasser. Antag, at en investeringsforvalter ønsker at analysere volatiliteten af specifikke aktier over den foregående måned. Han beslutter sig for, at han ikke vil anbefale nogen aktie til sine kunder, hvis dens standardafvigelse er større end eller lig med dens gennemsnit, og klassificerer sådanne aktiver som "for risikable".

Nedenfor er alle de daglige lukkekurser (i USD) for en bestemt aktie i løbet af den foregående måned. Lad os beregne standardafvigelsen for at afgøre, om forvalteren vil anse denne aktie for at være for risikabel:

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

Fordi forvalteren kun er interesseret i aktiekurserne fra den foregående måned, og vi har alle de registrerede kurser for den specifikke tidsramme, arbejder vi med hele populationen. Derfor vil vi bruge formlen for populationens standardafvigelse.

For at finde standardafvigelsen skal vi først beregne gennemsnittet (μ). Husk, at gennemsnittet findes ved at dividere den samlede sum af tallene med det samlede antal tal.

$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

Dernæst subtraheres gennemsnittet fra hvert enkelt datapunkt, og forskellen kvadreres. Læg alle disse kvadrerede forskelle sammen, og divider resultatet med det samlede antal. Dette resultat er variansen (σ²).

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

Til sidst tages kvadratroden af variansen for at bestemme populationens standardafvigelse.

$$\sigma=\sqrt{0.045031}\approx0.21$$

Som du kan se, er standardafvigelsen for denne akties kurser for den foregående måned (0.21) mindre end gennemsnittet (1.097). Derfor vil forvalteren ikke anse denne aktie for at være "for risikabel".

Stikprøvens standardafvigelse

Du bør beregne stikprøvens standardafvigelse, når dit datasæt blot er en stikprøve (en mindre undergruppe) trukket fra en større population af interesse. Stikprøvens standardafvigelse betegnes med bogstavet s og beregnes ved hjælp af følgende formel:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Hvor:

  • Σ betegner summation;
  • xᵢ repræsenterer hvert enkelt datapunkt;
  • repræsenterer stikprøvens gennemsnit;
  • n er stikprøvens størrelse.

Lad os illustrere, hvordan man finder stikprøvens standardafvigelse ved hjælp af en variation af det foregående eksempel. Antag, at investeringsforvalteren ønsker at analysere den samme aktie, men denne gang har han ikke adgang til lukkekurserne for hver eneste handelsdag i den foregående måned. I stedet har han kun lukkekurserne for en tilfældig stikprøve på 5 dage. Han bliver nødt til at estimere aktiens standardafvigelse ved hjælp af disse begrænsede stikprøvedata.

Lad os antage, at de 5 registrerede lukkekurser er:

1.31, 1.40, 0.86, 0.88, 1.40

Selvom forvalterens ultimative interesse ligger i hele den foregående måned, besidder han kun et datasæt bestående af 5 dage. Fordi vi har at gøre med en stikprøve i stedet for den fulde population, skal vi beregne standardafvigelsen ved hjælp af formlen for stikprøvens standardafvigelse.

Først beregnes stikprøvens gennemsnit ().

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

Dernæst beregnes stikprøvens varians ().

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

Til sidst tages kvadratroden af variansen for at få stikprøvens standardafvigelse.

$$s=\sqrt{0.0764}\approx 0.28$$

Fejlmargin

En af de mest værdifulde anvendelser af standardafvigelse er beregningen af et "acceptabelt" værdiområde, hvilket spiller en afgørende rolle i prædiktiv analyse og industriel statistisk kvalitetssikring. Hvis de underliggende data følger en normalfordeling, kendes dette område som konfidensintervallet (beskrevet detaljeret i næste afsnit). Disse intervaller beregnes på forskellige konfidensniveauer, normalt udtrykt som procenter.

Fejlmarginen er en nøglekomponent i konfidensintervallet, der dikterer dets samlede bredde. Grundlæggende fastsætter fejlmarginen de maksimale og minimale acceptable værdier for den metrik, du analyserer.

Fejlmarginen beregnes ved hjælp af denne formel:

$$Margin\ of\ error\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Vi anvender denne formel, når populationens standardafvigelse (σ) er kendt, forudsat at stikprøvestørrelsen er tilstrækkelig stor (typisk n > 30).

Når populationens standardafvigelse er ukendt, og stikprøven er lille (typisk n ≤ 30), bruger vi i stedet følgende formel:

$$Margin\ of\ error\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

I dette scenarie erstatter vi populationens standardafvigelse (σ) med stikprøvens standardafvigelse (s).

Komponenterne \$z_{\alpha/2}\$ og \$t_{n-1, \alpha/2}\$ kendes som kritiske værdier. De bestemmes ved hjælp af henholdsvis z-statistik og t-statistik og fungerer som konstanter knyttet til dit valgte konfidensniveau.

De mest almindelige konfidensniveauer brugt i statistisk analyse er 90 %, 95 % og 99 %. Deres tilsvarende \$z_{\alpha/2}\$ kritiske værdier er 1.645 (for 90 %), 1.96 (for 95 %) og 2.575 (for 99 %).

Komponenterne \$\frac{\sigma}{\sqrt n}\$ og \$\frac{s}{\sqrt n}\$ repræsenterer standardfejlen.

  • \$\frac{\sigma}{\sqrt n}\$ bruges, når vi kender populationens standardafvigelse (σ) og har en stor stikprøvestørrelse (typisk n > 30).
  • \$\frac{s}{\sqrt n}\$ bruges, når vi ikke kender populationens standardafvigelse og arbejder med en lille stikprøvestørrelse (typisk n ≤ 30). Da σ er ukendt, må vi basere os på standardafvigelsen af vores tilgængelige stikprøve (s).

Konfidensintervallet

Som nævnt ovenfor er konfidensintervallet et statistisk værdiområde, inden for hvilket en given populationsparameter forventes at falde, baseret på et specifikt konfidensniveau.

For eksempel kan en statistiker angive, at gennemsnitshøjden for 13-årige piger falder mellem 59 tommer og 66 tommer ved et 90 % konfidensniveau. Det betyder, at hvis vi tog flere tilfældige stikprøver af 13-årige piger, ville deres gennemsnitshøjde i omkring 90 % af tilfældene ligge mellem disse to grænser.

Når populationens standardafvigelse er kendt, beregnes konfidensintervallet ved hjælp af følgende formel:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • er stikprøvens gennemsnit,
  • \$z_{\alpha/2}\$ er den kritiske værdi,
  • σ er populationens standardafvigelse,
  • n er antallet af observationer.

Hvis vi ikke kender populationens standardafvigelse (σ) og i stedet skal bruge stikprøvens standardafvigelse (s), bruger vi denne alternative formel:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • er stikprøvens gennemsnit,
  • \$t_{n-1,\alpha/2}\$ er den kritiske værdi,
  • s er stikprøvens standardafvigelse,
  • n er antallet af observationer.

Som beskrevet i det foregående afsnit repræsenterer udtrykkene \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ og \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ fejlmarginerne.

Eksempel på beregning af konfidensinterval

Antag, at vi ved, at de daglige aktiekurser, vi analyserer, følger en normalfordeling. Vi har følgende stikprøve på 10 aktiekurser til vores rådighed:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

Vi ønsker at beregne det område, inden for hvilket den sande gennemsnitlige aktiekurs vil svinge, med et 95 % konfidensniveau.

Da dette er en lille stikprøve, og populationens standardafvigelse er ukendt, vil vi bruge stikprøvens standardafvigelse og den tilsvarende t-statistikformel:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • er stikprøvens gennemsnit: 1.10
  • \$t_{n-1,\alpha/2}\$ er den kritiske værdi: \$t_{9, 0.025}\$ = 2.26 (kritiske værdier for en given stikprøvestørrelse og konfidensniveau findes typisk ved hjælp af en standard t-tabel eller z-tabel)
  • s er stikprøvens standardafvigelse: 0.23
  • n er antallet af observationer: 10
  • \$\frac{s}{\sqrt n}\$ er standardfejlen: \$\frac{0.23}{\sqrt{10}}=0.07\$

Nu indsætter vi disse tal i vores formel for konfidensinterval:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Ved at beregne de nedre og øvre grænser får vi:

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

Dette resultat betyder, at vi kan være 95 % sikre på, at den sande gennemsnitlige aktiekurs for denne aktie ligger inden for konfidensintervallet (0.94, 1.26).