Statistische Rekenmachines
Variantiecalculator


Variantiecalculator

Gebruik onze variantiecalculator om snel de variantie, het gemiddelde en de standaardafwijking van je dataset te berekenen. Inclusief stapsgewijze uitleg!

Steekproef Populatie
Variantie σ2 = 28.5 s2 = 24.9375
Standaarddeviatie σ = 5.3385 s = 4.9937
Aantal n = 8 n = 8
Gemiddelde μ = 18.25 x̄ = 18.25
Som van Kwadraten SS = 199.5 SS = 199.5

Er was een fout met uw berekening.

Inhoudsopgave

  1. Variantie als maat voor variabiliteit
  2. Instructies voor het gebruik van de variantie calculator
  3. De formule voor variantie: populatievariantie versus steekproefvariantie
    1. Populatievariantie
    2. Steekproefvariantie
  4. Stappen voor het berekenen van de variantie
  5. Voorbeeld van variantieberekening voor een steekproef
  6. De betekenis van variantie

Variantiecalculator

Variantie als maat voor variabiliteit

Een cruciaal onderdeel van statistische data-analyse is het bepalen van de spreiding: in hoeverre wijken datapunten af van het gemiddelde? De meest gebruikte statistische maatstaven om deze spreiding of variabiliteit te meten, zijn:

  • Variantie: het gemiddelde van de gekwadrateerde afwijkingen ten opzichte van het gemiddelde.
  • Standaardafwijking: de wortel van de variantie. Dit is een veelgebruikte statistische maatstaf om spreiding te bepalen.
  • Variatiecoëfficiënt: ook wel bekend als de relatieve standaardafwijking. Deze wordt berekend als de verhouding tussen de standaardafwijking σ en het gemiddelde μ, oftewel \$(C_v=\frac{σ}{μ})\$.

Met deze handige variantie calculator bereken je snel de variantie van een dataset. Bovendien toont de tool overzichtelijk alle wiskundige stappen die bij de berekening komen kijken.

Instructies voor het gebruik van de variantie calculator

De calculator accepteert een lijst met getallen, gescheiden door een leesteken. In de onderstaande tabel zie je enkele voorbeelden van mogelijke invoerformaten.

rij-invoer kolominvoer kolominvoer kolominvoer
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

De getallen mogen gescheiden worden door een komma, een spatie, een enter (regeleinde) of een combinatie hiervan. Je kunt zowel een rij- als kolomopmaak gebruiken. Bij alle bovenstaande voorbeelden verwerkt de calculator de invoer correct als de dataset: 44, 63, 72, 75, 80, 86, 87 en 89.

Na het invoeren van de data selecteer je of het gaat om een steekproef (sample) of een populatie. Zodra je op de berekenknop klikt, toont de calculator direct vijf belangrijke statistische waarden van de dataset: het aantal observaties (n), het gemiddelde, de som van de gekwadrateerde afwijkingen, de variantie en de standaardafwijking.

Deze online tool is niet alleen ontworpen om razendsnel de variantie te berekenen, maar helpt je ook de theorie erachter te begrijpen door de volledige wiskundige uitwerking stap voor stap te tonen.

Voor betrouwbare statistische conclusies werk je het liefst met een zo groot mogelijke dataset. In de praktijk is het echter vaak onmogelijk of te duur om data van een complete populatie te verzamelen. Daarom trekt men meestal een representatieve steekproef uit de populatie. De uiteindelijke conclusies over de gehele populatie worden vervolgens gebaseerd op deze steekproefdata.

De variantie meet de gemiddelde spreiding van een dataset ten opzichte van het gemiddelde. Voor een populatie wordt dit aangeduid met σ², en voor een steekproef met . Een grotere waarde van σ² of wijst op een bredere spreiding van de datapunten rondom het gemiddelde, en vice versa.

Bekijk ter illustratie de volgende twee datasets:

(Set I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Set II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Als we Set I invoeren in de variantie calculator, krijgen we de volgende resultaten:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

voor een steekproef, en

n=11

μ=16

SS=704

σ²=64

σ=8

voor de populatie.

Op vergelijkbare wijze levert het invoeren van Set II in de calculator de volgende output op:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

voor een steekproef, en

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

voor de populatie.

  • In Set I wijken de getallen aanzienlijk af van het gemiddelde:

s²=70,4

σ²=64

  • In Set II is de spreiding (variabiliteit) veel kleiner:

s²=5,6

σ²=5,09

De formule voor variantie: populatievariantie versus steekproefvariantie

Populatievariantie

Een populatie verwijst in de statistiek naar álle mogelijke waarnemingen binnen een onderzoek of experiment. Voor N waarnemingen is de formule voor de populatievariantie als volgt:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\mu)}^2}}{N}$$

waarbij:

  • σ² de populatievariantie is,
  • Σ voor de sommatie staat,
  • xᵢ elke individuele waarneming is,
  • μ het populatiegemiddelde is,
  • N het totale aantal waarnemingen in de populatie is.

Steekproefvariantie

De formule voor de steekproefvariantie is gedefinieerd als:

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\bar{x})}^2}}{n-1}$$

waarbij:

  • de steekproefvariantie is,
  • Σ voor de sommatie staat,
  • xᵢ elke individuele waarneming is,
  • het steekproefgemiddelde is,
  • n het aantal waarnemingen in de steekproef is.

Stappen voor het berekenen van de variantie

Het handmatig berekenen van de variantie doe je in de volgende stappen:

Stap 1: Bereken het steekproef- of populatiegemiddelde. Dit is de som van alle datapunten gedeeld door het totaal aantal datapunten (n voor een steekproef en N voor een populatie), oftewel:

Steekproefgemiddelde:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Populatiegemiddelde:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Stap 2: Bereken de afwijkingen door het gemiddelde af te trekken van elk individueel datapunt.

Steekproefafwijkingen:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

Populatieafwijkingen:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

Stap 3: Bereken de kwadraten van deze afwijkingen (de gekwadrateerde afwijkingen) voor elk datapunt.

Gekwadrateerde steekproefafwijkingen:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

Gekwadrateerde populatieafwijkingen:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

Stap 4: Bereken de som van alle gekwadrateerde afwijkingen (Sum of Squares, SS).

Som van de gekwadrateerde steekproefafwijkingen:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Som van de gekwadrateerde populatieafwijkingen:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Stap 5: Deel de som van de gekwadrateerde afwijkingen door \$ n-1 \$ voor een steekproef, of door \$ N \$ voor de populatie, om de uiteindelijke variantie te berekenen.

Steekproefvariantie:

$$s^2=\frac{SS}{n-1}$$

Populatievariantie:

$$\sigma^2=\frac{SS}{N}$$

Voorbeeld van variantieberekening voor een steekproef

Laten we kijken naar een voorbeeld met de volgende dataset: 1, 2, 4, 5, 6 en 12. Om de steekproefvariantie te berekenen, doorlopen we deze stappen:

Stap 1: Bereken het steekproefgemiddelde.

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Stap 2: Bereken de afwijking van het gemiddelde voor elk datapunt.

x₁-̅x x₂-̅x x₃-̅x x₄-̅x x₅-̅x x₆-̅x
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Stap 3: Bereken de kwadraten van deze afwijkingen.

(x₁-̅x)² (x₂-̅x)² (x₃-̅x)² (x₄-̅x)² (x₅-̅x)² (x₆-̅x)²
16 9 1 0 1 49

Stap 4: Tel de gekwadrateerde afwijkingen bij elkaar op.

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2=16+9+1+0+1+49=76$$

Stap 5: Bereken de steekproefvariantie door de som van de gekwadrateerde afwijkingen te delen door het aantal vrijheidsgraden (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$

Voor een populatie zouden we de som delen door n (het totale aantal datapunten) in plaats van n-1, om zo de populatievariantie te berekenen.

De betekenis van variantie

In de financiële wereld en bij beleggen is spreiding (dispersie) een cruciaal concept. Het helpt vermogensbeheerders om de prestaties van hun investeringen te optimaliseren. Financiële analisten gebruiken de variantie om de prestaties en risico's van individuele componenten binnen een beleggingsportefeuille te beoordelen.

Beleggers berekenen de variantie voordat ze een nieuwe aankoop doen, om in te schatten of het verwachte rendement opweegt tegen het risico. Variantie biedt analisten een kwantificeerbare maatstaf voor onzekerheid, iets wat zonder deze statistische formules erg lastig te bepalen is.

Hoewel onzekerheid op zichzelf niet direct meetbaar is, maken de variantie en de standaardafwijking (de vierkantswortel van de variantie) het mogelijk om de waarschijnlijke impact van een specifiek aandeel op een bredere portefeuille te berekenen.

Ook wetenschappers, statistici, wiskundigen en data-analisten maken volop gebruik van de variantie. Het levert essentiële informatie op over de eigenschappen van een experiment of steekproef.

Wetenschappers analyseren bijvoorbeeld de variantie om te bepalen of testgroepen vergelijkbaar genoeg zijn om een hypothese succesvol te toetsen. Hoe hoger de variantie, hoe sterker de waarden in de dataset verspreid liggen. Data-analisten gebruiken deze kennis om te beoordelen in hoeverre het gemiddelde een betrouwbare en representatieve afspiegeling is van de gehele dataset.

Een nadeel van het gebruik van variantie is de gevoeligheid voor grote uitschieters (outliers). Extreme waarden kunnen de data vertekenen, omdat het effect van een uitschieter door het kwadrateren in de formule exponentieel wordt uitvergroot.

Vanwege dit effect geven veel onderzoekers er de voorkeur aan om te werken met de standaardafwijking. De standaardafwijking wordt minder drastisch beïnvloed door uitschieters, levert een kleiner en overzichtelijker getal op en is daardoor in de praktijk veel gemakkelijker te interpreteren.