Nenhum resultado encontrado
Não podemos encontrar nada com esse termo no momento, tente procurar algo diferente.
Dado um conjunto de dados discreto representando uma amostra ou uma população, a calculadora calcula a média, a variância e o desvio padrão e exibe o fluxo de trabalho envolvido no cálculo.
Amostra | População | |
---|---|---|
Variância | σ2 = 28.5 | s2 = 24.9375 |
Desvio Padrão | σ = 5.3385 | s = 4.9937 |
Contagem | n = 8 | n = 8 |
Média | μ = 18.25 | x̄ = 18.25 |
Soma dos Quadrados | SS = 199.5 | SS = 199.5 |
Houve um erro com seu cálculo.
Um dos aspectos fundamentais da inferência estatística de um determinado conjunto de dados é medir uma métrica que caracteriza a variabilidade dos dados a partir de sua média. As métricas mais populares que medem a variabilidade são:
Esta calculadora encontra a variação de um determinado conjunto de dados e exibe as etapas envolvidas no cálculo.
A calculadora de variância aceita a entrada como uma lista de números separados por um delimitador. Alguns exemplos de possíveis entradas são mostrados na tabela abaixo.
entrada de linha | entrada de coluna | entrada de coluna | entrada de coluna |
---|---|---|---|
44, 63, 72, 75, 80, 86, 87, 89 | 44 | 44, | 44,63,72 |
44 63 72 75 80 86 87 89 | 63 | 63, | 75,80 |
44,, 63,, 72, 75, 80, 86, 87, 89 | 72 | 72, | 86,87 |
44 63 72 75, 80, 86, 87, 89 | 75 | 75, | 89 |
44; 63; 72, 75,, 80, 86, 87, 89 | 80 | 80, | |
44,,, 63,, 72, 75, 80, 86, 87, 89 | 86 | 86, | |
44 63,, 72,,,, 75, 80, 86, 87, 89 | 87 | 87, | |
89 | 89, |
Os números podem ser separados por uma vírgula, um espaço, uma quebra de linha, ou uma mistura de mais de um tipo de delimitador. Pode-se usar tanto o formato de linha quanto o de coluna. Para todos os formatos mostrados na tabela acima, a calculadora processa a entrada como 44, 63, 72, 75, 80, 86, 87, e 89.
Uma vez inseridos os dados, você pode selecionar se são dados de amostra ou dados de população. Ao pressionar o botão calcular, a calculadora exibe cinco parâmetros estatísticos do conjunto de dados: contagem (número de observações), média, soma dos desvios quadrados, variância e o desvio padrão.
A calculadora é projetada para calcular a variância de um conjunto de dados. Ela também fornece uma visão da teoria por trás do cálculo e mostra todas as etapas envolvidas.
Ao fazer inferências, é preferível utilizar um grande conjunto de dados para obter boas estatísticas. Mas muitas vezes é difícil obter dados populacionais que representem todas as observações possíveis. Portanto, como regra geral, uma "amostra" é retirada da população. E as conclusões sobre a população são geralmente tiradas dos dados da amostra.
A variância mede a dispersão média de um conjunto de dados em relação à média. É frequentemente denotada por σ² para uma população e por s² para uma amostra. Um valor maior de σ² ou s² implica uma dispersão maior de pontos de dados em relação à média da amostra e vice-versa.
Considere os seguintes exemplos de conjuntos de dados.
(Conjunto I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,
( Conjunto II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20
Colocando o Conjunto I na calculadora de variância:
n=11
x̄=16
SS=704
s²=70,4
s=8,39
para uma amostra, e
n=11
μ=16
SS=704
σ²=64
σ=8
para a população.
Da mesma forma, colocando o Conjuntando II na calculadora resulta:
n=11
x̄=16
SS=56
s²=5,6
s=2,36
para uma amostra, e
n=11
μ=16
SS=56
σ²=5,09
σ=2,25
Para a população.
s²=70,4
σ²=64
s²=5,6
σ²=5,09
A população em estatística refere-se a todas as observações possíveis em um experimento. Para N observações, a variância da população é:
$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$
onde
A variância da amostra é definida como
$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$
onde
Os seguintes passos estão envolvidos no cálculo da variância.
Passo 1: Calcule a média da amostra/população. Isso é a soma de todos os pontos de dados dividida pelo número de pontos de dados (n para uma amostra e N para a população), ou seja,
Média da amostra:
$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$
Média da população:
$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$
Passo 2: Calcule os desvios subtraindo a média da amostra/população de cada ponto de dados, ou seja,
Desvios da amostra:
$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$
Desvios da população:
$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$
Passo 3: Calcule os desvios ao quadrado para cada ponto de dados.
Desvios ao quadrado da amostra:
$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$
Desvios ao quadrado da população:
$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$
Passo 4: Calcule a soma dos desvios ao quadrado.
Soma dos desvios ao quadrado da amostra:
$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$
Soma dos desvios ao quadrado da população:
$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$
Passo 5: Divida a soma dos desvios ao quadrado por n-1 para uma amostra e N para a população para calcular a variância.
Variância da amostra:
$$s^2=\frac{SS}{n-1}$$
Variância da população:
$$\sigma^2=\frac{SS}{N}$$
Vamos considerar o seguinte conjunto de dados: 1, 2, 4, 5, 6 e 12. Para calcular a variância da amostra, seguimos estes passos:
Passo 1: Calcular a média amostral (média).
$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$
Passo 2: Calcular os desvios da média para cada ponto de dado.
x₁-x̄ | x₂-x̄ | x₃-x̄ | x₄-x̄ | x₅-x̄ | x₆-x̄ |
---|---|---|---|---|---|
1 - 5 | 2 - 5 | 4 - 5 | 5 - 5 | 6 - 5 | 12 - 5 |
-4 | -3 | -1 | 0 | 1 | 7 |
Passo 3: Calcular os quadrados dos desvios.
(x₁-x̄)² | (x₂-x̄)² | (x₃-x̄)² | (x₄-x̄)² | (x₅-x̄)² | (x₆-x̄)² |
---|---|---|---|---|---|
16 | 9 | 1 | 0 | 1 | 49 |
Passo 4: Somar os desvios ao quadrado.
$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$
Passo 5: Calcular a variância amostral dividindo a soma dos desvios ao quadrado pelos graus de liberdade (n-1).
$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$
Para uma população, nós dividiríamos pela n (o número total de pontos de dados), em vez de n-1, para calcular a variância populacional.
A dispersão é utilizada para investir. Ela ajuda os gestores de ativos a melhorar o desempenho de seus investimentos. Os analistas financeiros podem usar a dispersão para avaliar o desempenho individual dos componentes de uma carteira de investimentos.
Os investidores calculam o desvio ao considerar uma nova compra para decidir se o investimento vale o risco. A dispersão ajuda os analistas a determinar uma medida de incerteza, que é difícil de quantificar sem variância e desvio padrão.
A incerteza não é diretamente mensurável. Mas a variância e o desvio padrão (a raiz quadrada da variância) ajudam a determinar o impacto percebido de uma determinada ação em uma carteira.
Cientistas, estatísticos, matemáticos e analistas de dados também podem usar a variância. Ela ajuda a fornecer informações úteis sobre um experimento ou população de amostra.
Os cientistas podem procurar diferenças entre grupos de teste para determinar se eles são suficientemente similares para testar uma hipótese com sucesso. Quanto maior a variância do conjunto de dados, mais dispersos ficam os valores no conjunto de dados. Os pesquisadores de dados podem usar esta informação para ver o quão bem a média representa o conjunto de dados.
A desvantagem do uso da variância é que grandes anomalias em um conjunto podem levar a alguma distorção dos dados. Isto porque as anomalias podem aumentar ainda mais seu peso uma vez ao quadrado.
Muitos pesquisadores preferem trabalhar com o desvio padrão, calculado como a raiz quadrada da variância. O desvio padrão é menos afetado por anomalias, é um número menor e é mais fácil de interpretar.