Calcolatrici Statistiche
Deviazione Standard

Deviazione Standard

Dato un insieme di dati discreti, il calcolatore calcola la media, la varianza e la deviazione standard di un campione o di una popolazione e mostra tutti i passaggi intermedi dei calcoli.

Risultato
Deviazione standard s = 4.5
Varianza s2 = 20.24
Contare n = 7
Significare x̄ = 14.29
Somma dei quadrati SS = 100

C'è stato un errore con il tuo calcolo.

Sommario

  1. La deviazione standard come misura statistica
  2. Le regole per utilizzare questo calcolatore
  3. I problemi che questo calcolatore è progettato per risolvere
  4. Formule per il calcolo della deviazione standard
  5. Calcolo della Deviazione Standard
  6. Esempio di calcolo della deviazione standard di un campione
  7. Applicazioni della Deviazione Standard

Deviazione Standard

La deviazione standard come misura statistica

La deviazione standard è uno dei parametri statistici più comunemente utilizzati per caratterizzare le statistiche di un dato insieme di dati. La deviazione standard, in termini semplici, è una misura di quanto siano dispersi i dati. Calcolando la deviazione standard, si può scoprire se i numeri sono vicini o lontani dalla media. Se i punti dati sono lontani dalla media, allora c'è una grande deviazione nell'insieme dei dati. Quindi, maggiore è la dispersione nei dati, maggiore è la deviazione standard.

Questo calcolatore definisce la deviazione standard di un dato insieme di dati e mostra i passaggi matematici coinvolti nel calcolo.

Le regole per utilizzare questo calcolatore

Il calcolatore accetta l'input come un elenco di numeri separati da un delimitatore. Alcuni esempi di input possibili sono mostrati nella tabella sottostante.

input in riga input in colonna input in colonna input in colonna
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44;63;72
44 63 72 75 80 86 87 89 63 63, 75;80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86;87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

I numeri possono essere separati da una virgola/spazio/a capo o una combinazione di essi e possono essere inseriti sia in formato riga che in formato colonna. Per tutti i formati mostrati nella tabella sopra, il calcolatore elabora l'input come 44, 63, 72, 75, 80, 86, 87 e 89.

Dopo aver inserito i dati, selezionare se si tratta di dati di un campione o di una popolazione e premere invio. Il calcolatore mostra cinque parametri statistici del set di dati: conteggio (numero di osservazioni), media, somma delle deviazioni quadrate, varianza e deviazione standard.

I problemi che questo calcolatore è progettato per risolvere

Il calcolatore è progettato per calcolare la deviazione standard di un insieme di dati discreti e fornisce una visione della teoria dietro il calcolo.

I dati possono consistere in una popolazione che comprende tutte le possibili osservazioni di un esperimento (di qualsiasi tipo) nelle condizioni specificate. In molti casi, è impossibile campionare ogni membro della popolazione.

Nella pratica statistica, è comune lavorare con un sottoinsieme di una 'popolazione' più grande, che definiamo come un 'campione'. Questo perché spesso è impraticabile o impossibile raccogliere dati da ogni individuo della popolazione. Facciamo stime o inferenze sulla popolazione basate sulle informazioni raccolte dal campione.

Quando calcoliamo la deviazione standard, la formula che usiamo è aggiustata a seconda che stiamo trattando con un campione o con l'intera popolazione. Questa modifica è realizzata attraverso un fattore noto come 'gradi di libertà'. Per un campione, dividiamo per n - 1 (dove n è la dimensione del campione) invece di n quando calcoliamo la varianza, che poi viene elevata al quadrato per trovare la deviazione standard. Questa correzione compensa il fatto che stiamo usando i dati del campione per stimare la deviazione standard della popolazione e garantisce che la nostra stima sia non distorta.

La deviazione standard misura la dispersione/deviazione/variabilità media di un insieme di dati rispetto alla media. È spesso indicata dalla lettera greca σ per una popolazione o s per un campione. Un valore maggiore di σ o s implica una maggiore dispersione dei punti dati dalla media del campione e viceversa.

Consideriamo i seguenti esempi di insiemi di dati.

(Insieme I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(Insieme II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20 Sostituendo questi insiemi di dati nel calcolatore, otteniamo per l'insieme I

  • x̄=16 - il valore medio
  • s=8,3904708 - deviazione standard

Per l'insieme II

  • x̄=16 - il valore medio
  • s=2,3664319 - deviazione standard

Nell'Insieme I, i numeri si discostano significativamente dalla media del campione (s=8,39), mentre nell'Insieme II la variabilità è piccola (s=2,36) rispetto all'Insieme I.

Formule per il calcolo della deviazione standard

Questa formula viene applicata quando vengono analizzati tutti i valori della popolazione.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ è la deviazione standard della popolazione,
  • xᵢ è il valore di un singolo dato della popolazione,
  • μ è la media aritmetica della popolazione,
  • N è la dimensione della popolazione.

La formula sottostante è utilizzata quando si ha una dimensione molto grande della popolazione e viene preso per l'analisi solo un suo campione.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s è la deviazione standard del campione,
  • xᵢ è il valore di un singolo dato del campione,
  • è la media del campione,
  • n è la dimensione del campione.

Calcolo della Deviazione Standard

I seguenti passaggi sono coinvolti nel calcolo della deviazione standard.

Passo 1: Calcolare la media del campione/della popolazione. È la somma di tutti i punti dati divisa per il numero di conteggi N o n, cioè.

Media del campione:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

Media della popolazione

$$μ=\frac{x₁+x₂+x₃+........+x_N}{N}$$

Passo 2: Calcolare le deviazioni sottraendo la media del campione/della popolazione da ogni punto dati, cioè.

Deviazioni del campione:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x})…………………… (x_n-\bar{x})$$

Deviazioni della popolazione:

$$(x₁-μ), (x₂-μ), (x₃-μ)……………….. (x_N-μ)$$

Passo 3: Calcolare le deviazioni quadrate per ogni punto dati.

Deviazioni quadrate del campione:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2…………………… (x_n-\bar{x})^2$$

Deviazioni quadrate della popolazione:

$$(x₁-μ)^2, (x₂-μ)^2, (x₃-μ)^2……………….. (x_N-μ)^2$$

Passo 4: Calcolare la somma delle deviazioni quadrate sommando tutte le deviazioni quadrate individuali

Somma delle deviazioni quadrate del campione:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

Somma delle deviazioni quadrate della popolazione:

$$SS=(x₁-μ)^2+ (x₂-μ)^2+(x₃-μ)^2……………….+ (x_N-μ)^2$$

Passo 5: Dividere la somma delle deviazioni quadrate per il numero di gradi di libertà per ottenere la varianza. Per una popolazione, dividere per N, e per un campione, dividere per n-1.

Varianza del campione

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Varianza della popolazione

$$ σ^2 = \frac{\sum_{i=1}^{N}(xᵢ - μ)^2}{N} $$

Quando calcoliamo la varianza per un campione, potremmo supporre che useremo l'espressione per i calcoli:

$$\frac{(x-\bar{x})^2}{n}$$

dove

x̄ è la media del campione e n è la dimensione del campione. Tuttavia, tale formula non viene utilizzata.

Tale espressione non fornirebbe una buona stima della varianza della popolazione. Quando la popolazione generale è molto grande e il campione è molto piccolo, la varianza calcolata da questa formula sottovaluterebbe la varianza della popolazione. Questo mostrerebbe una varianza troppo piccola a causa della mancanza di dati. Quindi, usando l'espressione n-1 aumentiamo il valore potenziale della varianza.

Invece di dividere per n, troviamo la varianza del campione dividendo per n-1. Questa operazione fornisce un valore di varianza leggermente maggiore, più vicino al valore reale.

Passo 6: Estrarre la radice quadrata del numero risultante. La deviazione standard è la radice quadrata della varianza.

Deviazione standard del campione

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i=1}^{n}{{(x_i-\ \bar{x})}^2}}{n-1}}$$

Deviazione standard della popolazione

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i=1}^{N}{{(x_i-\ \mu)}^2}}{N}}$$

Esempio di calcolo della deviazione standard di un campione

Prendiamo in considerazione i seguenti voti di n=8 studenti all'esame finale di Fisica:

45, 67, 70, 75, 80, 81, 82 e 84

Il calcolatore calcola la deviazione standard del campione seguendo i passaggi:

Passo 1: Calcolare la media.

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}=\frac{45+67+70+75+80+81+82+84}{8}=73$$

Passo 2: Calcolare le deviazioni

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Passo 3: Calcolare i quadrati delle deviazioni

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Passo 4: Sommare i quadrati delle deviazioni.

$$SS=\sum_{i=1}^{n}{{(x_i-\ \bar{x})}^2}=784+36+9+4+49+64+81+121=1148$$

Passo 5: Calcolare la varianza dividendo la somma dei quadrati delle deviazioni per i gradi di libertà (n-1). Per una popolazione, in questo passaggio la varianza sarebbe divisa per N invece che per N-1. In questo caso, abbiamo un campione, ovvero dati su una parte della popolazione degli studenti, non sull'intera popolazione.

$$s^2=\frac{\sum_{i=1}^{n}{{(x_i-\ \bar{x})}^2}}{n-1}=\frac{1148}{8-1}=164$$

Passo 6: Prendere la radice quadrata della varianza per ottenere la deviazione standard.

$$s=\sqrt{s^2}=\sqrt{164}\approx12,80$$

Applicazioni della Deviazione Standard

La dispersione e la deviazione standard possono essere usate per determinare la dispersione dei dati. Se la varianza o la deviazione standard è grande, i dati sono più dispersi. Queste informazioni sono utili quando si confrontano due o più insiemi di dati per determinare quale è più (o il più) variabile.

In ambito industriale, la deviazione standard è ampiamente utilizzata per il controllo di qualità. Nella produzione su larga scala, certe caratteristiche del prodotto devono rientrare in un intervallo definito che può essere accessibile calcolando la deviazione standard. Per esempio, nella produzione di dadi e bulloni, la variazione dei loro diametri deve essere piccola, altrimenti le parti non si adatteranno.

La deviazione standard è utilizzata in finanza e in molti altri ambiti per valutare il rischio. Nell'analisi tecnica, la deviazione standard è usata per costruire le linee di Bollinger e calcolare la volatilità.

Inoltre, la deviazione standard è utilizzata in finanza come misura di volatilità e in sociologia è usata nei sondaggi di opinione pubblica per aiutare a calcolare l'incertezza.

La varianza e la deviazione standard sono utilizzate per determinare il numero di valori dei dati che cadono all'interno di un dato intervallo di distribuzione. Ad esempio, il teorema di Chebyshev mostra che per qualsiasi distribuzione, almeno il 75% dei valori dei dati sarà entro 2 deviazioni standard dalla media.

Prendiamo un semplice esempio con il clima. Supponiamo di studiare la temperatura giornaliera massima di due città nella stessa regione. Una città è sulla costa e l'altra è nell'entroterra. La temperatura massima media giornaliera in queste due città potrebbe essere la stessa. Ma la deviazione standard, ovvero la dispersione delle temperature massime giornaliere, sarà maggiore per la città situata nel continente e la città costiera avrà una deviazione standard minore delle temperature massime giornaliere.

Questo significa che una città continentale avrà una maggiore variazione della temperatura massima dell'aria in un qualsiasi giorno dell'anno rispetto a una città costiera. Ovvero, la città costiera avrà un clima più mite.