Calculadoras de Estatísticas
Calculadora de Variância


Calculadora de Variância

Dado um conjunto de dados discreto representando uma amostra ou uma população, a calculadora calcula a média, a variância e o desvio padrão e exibe o fluxo de trabalho envolvido no cálculo.

Amostra População
Variância σ2 = 28.5 s2 = 24.9375
Desvio Padrão σ = 5.3385 s = 4.9937
Contagem n = 8 n = 8
Média μ = 18.25 x̄ = 18.25
Soma dos Quadrados SS = 199.5 SS = 199.5

Houve um erro com seu cálculo.

Índice

  1. A variância como uma medida de variabilidade
  2. As regras para o uso desta calculadora
  3. A fórmula da variância: variância da população vs. variância da amostra
    1. Variação da população
    2. Variância da amostra
  4. Passos para calcular a variância
  5. Exemplo de Cálculo de Variância para uma Amostra
  6. O significado de variância

Calculadora de Variância

A variância como uma medida de variabilidade

Um dos aspectos fundamentais da inferência estatística de um determinado conjunto de dados é medir uma métrica que caracteriza a variabilidade dos dados a partir de sua média. As métricas mais populares que medem a variabilidade são:

  • A variância é a média dos desvios quadráticos em relação à média.
  • Desvio padrão - é a raiz quadrada da variância. O desvio padrão é uma métrica comumente usada para medir a dispersão/variabilidade.
  • O coeficiente de variação, que também é conhecido como desvio padrão relativo. O coeficiente de variação é calculado como a razão entre o desvio padrão σ e a média μ ou \$(C_v=\frac{σ}{μ})\$.

Esta calculadora encontra a variação de um determinado conjunto de dados e exibe as etapas envolvidas no cálculo.

As regras para o uso desta calculadora

A calculadora de variância aceita a entrada como uma lista de números separados por um delimitador. Alguns exemplos de possíveis entradas são mostrados na tabela abaixo.

entrada de linha entrada de coluna entrada de coluna entrada de coluna
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Os números podem ser separados por uma vírgula, um espaço, uma quebra de linha, ou uma mistura de mais de um tipo de delimitador. Pode-se usar tanto o formato de linha quanto o de coluna. Para todos os formatos mostrados na tabela acima, a calculadora processa a entrada como 44, 63, 72, 75, 80, 86, 87, e 89.

Uma vez inseridos os dados, você pode selecionar se são dados de amostra ou dados de população. Ao pressionar o botão calcular, a calculadora exibe cinco parâmetros estatísticos do conjunto de dados: contagem (número de observações), média, soma dos desvios quadrados, variância e o desvio padrão.

A calculadora é projetada para calcular a variância de um conjunto de dados. Ela também fornece uma visão da teoria por trás do cálculo e mostra todas as etapas envolvidas.

Ao fazer inferências, é preferível utilizar um grande conjunto de dados para obter boas estatísticas. Mas muitas vezes é difícil obter dados populacionais que representem todas as observações possíveis. Portanto, como regra geral, uma "amostra" é retirada da população. E as conclusões sobre a população são geralmente tiradas dos dados da amostra.

A variância mede a dispersão média de um conjunto de dados em relação à média. É frequentemente denotada por σ² para uma população e por para uma amostra. Um valor maior de σ² ou implica uma dispersão maior de pontos de dados em relação à média da amostra e vice-versa.

Considere os seguintes exemplos de conjuntos de dados.

(Conjunto I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

( Conjunto II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Colocando o Conjunto I na calculadora de variância:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

para uma amostra, e

n=11

μ=16

SS=704

σ²=64

σ=8

para a população.

Da mesma forma, colocando o Conjuntando II na calculadora resulta:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

para uma amostra, e

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

Para a população.

  • No Conjunto I, os números se desviaram significativamente da média da amostra

s²=70,4

σ²=64

  • No Conjunto II, a variabilidade é pequena

s²=5,6

σ²=5,09

A fórmula da variância: variância da população vs. variância da amostra

Variação da população

A população em estatística refere-se a todas as observações possíveis em um experimento. Para N observações, a variância da população é:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

onde

  • σ² é variância da população,
  • Σ é a soma,
  • xᵢ é cada observação,
  • μ é a média da população,
  • n é o número de observações na população.

Variância da amostra

A variância da amostra é definida como

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

onde

  • é a variância da amostra,
  • Σ é a soma,
  • xᵢ é cada observação,
  • é a média da amostra,
  • n é o número de observações na amostra.

Passos para calcular a variância

Os seguintes passos estão envolvidos no cálculo da variância.

Passo 1: Calcule a média da amostra/população. Isso é a soma de todos os pontos de dados dividida pelo número de pontos de dados (n para uma amostra e N para a população), ou seja,

Média da amostra:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Média da população:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Passo 2: Calcule os desvios subtraindo a média da amostra/população de cada ponto de dados, ou seja,

Desvios da amostra:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

Desvios da população:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

Passo 3: Calcule os desvios ao quadrado para cada ponto de dados.

Desvios ao quadrado da amostra:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

Desvios ao quadrado da população:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

Passo 4: Calcule a soma dos desvios ao quadrado.

Soma dos desvios ao quadrado da amostra:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Soma dos desvios ao quadrado da população:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Passo 5: Divida a soma dos desvios ao quadrado por n-1 para uma amostra e N para a população para calcular a variância.

Variância da amostra:

$$s^2=\frac{SS}{n-1}$$

Variância da população:

$$\sigma^2=\frac{SS}{N}$$

Exemplo de Cálculo de Variância para uma Amostra

Vamos considerar o seguinte conjunto de dados: 1, 2, 4, 5, 6 e 12. Para calcular a variância da amostra, seguimos estes passos:

Passo 1: Calcular a média amostral (média).

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Passo 2: Calcular os desvios da média para cada ponto de dado.

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Passo 3: Calcular os quadrados dos desvios.

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

Passo 4: Somar os desvios ao quadrado.

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

Passo 5: Calcular a variância amostral dividindo a soma dos desvios ao quadrado pelos graus de liberdade (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$

Para uma população, nós dividiríamos pela n (o número total de pontos de dados), em vez de n-1, para calcular a variância populacional.

O significado de variância

A dispersão é utilizada para investir. Ela ajuda os gestores de ativos a melhorar o desempenho de seus investimentos. Os analistas financeiros podem usar a dispersão para avaliar o desempenho individual dos componentes de uma carteira de investimentos.

Os investidores calculam o desvio ao considerar uma nova compra para decidir se o investimento vale o risco. A dispersão ajuda os analistas a determinar uma medida de incerteza, que é difícil de quantificar sem variância e desvio padrão.

A incerteza não é diretamente mensurável. Mas a variância e o desvio padrão (a raiz quadrada da variância) ajudam a determinar o impacto percebido de uma determinada ação em uma carteira.

Cientistas, estatísticos, matemáticos e analistas de dados também podem usar a variância. Ela ajuda a fornecer informações úteis sobre um experimento ou população de amostra.

Os cientistas podem procurar diferenças entre grupos de teste para determinar se eles são suficientemente similares para testar uma hipótese com sucesso. Quanto maior a variância do conjunto de dados, mais dispersos ficam os valores no conjunto de dados. Os pesquisadores de dados podem usar esta informação para ver o quão bem a média representa o conjunto de dados.

A desvantagem do uso da variância é que grandes anomalias em um conjunto podem levar a alguma distorção dos dados. Isto porque as anomalias podem aumentar ainda mais seu peso uma vez ao quadrado.

Muitos pesquisadores preferem trabalhar com o desvio padrão, calculado como a raiz quadrada da variância. O desvio padrão é menos afetado por anomalias, é um número menor e é mais fácil de interpretar.