Calculadoras Estadísticas
Calculadora de varianza

Calculadora de varianza

Dado un conjunto de datos discretos que representan una muestra o una población, la calculadora determina la media, la varianza y la desviación estándar e indica los pasos seguidos en el cálculo.

Muestra Población
Diferencia σ2 = 28.5 s2 = 24.9375
Desviación Estándar σ = 5.3385 s = 4.9937
Contar n = 8 n = 8
Significar μ = 18.25 x̄ = 18.25
Suma de cuadrados SS = 199.5 SS = 199.5

Hubo un error con tu cálculo.

Tabla de contenido

  1. La varianza como medida de variabilidad
  2. Las reglas para usar esta calculadora
  3. La fórmula de la varianza: varianza de la población frente a varianza de la muestra
    1. Varianza de la población
    2. Varianza de la muestra
  4. Pasos para calcular la varianza
  5. Ejemplo de cálculo de la varianza para una muestra
  6. La importancia de la varianza

Calculadora de varianza

La varianza como medida de variabilidad

Uno de los aspectos fundamentales de la inferencia estadística de un determinado conjunto de datos es medir una métrica que caracterice la variabilidad de los datos a partir de su promedio. Varias métricas miden la variabilidad:

  • La varianza es el promedio de las desviaciones al cuadrado sobre la media.
  • Desviación estándar: calculada como la raíz cuadrada de la varianza. La desviación estándar es una métrica de uso común para medir la dispersión/variabilidad.
  • El coeficiente de variación, también se conoce como desviación estándar relativa. El coeficiente de variación se calcula como la relación entre la desviación estándar σ y la media μ o \$(C_v=\frac{σ}{μ})\$.

Esta calculadora determina la varianza de un conjunto de datos dado y muestra el flujo de trabajo involucrado en el cálculo.

Las reglas para usar esta calculadora

La calculadora de varianza acepta la entrada como una lista de números separados por un delimitador. En la siguiente tabla se muestran algunos ejemplos de posibles entradas.

entrada de fila entrada de columna entrada de columna entrada de columna
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Los números pueden estar separados por una coma, un espacio, un salto de línea o una combinación de más de un tipo de delimitador. Puede utilizar el formato de fila o de columna. Para todos los formatos que se muestran en la tabla anterior, la calculadora procesa la entrada como 44, 63, 72, 75, 80, 86, 87 y 89.

Una vez ingresados los datos, puede seleccionar si son datos de muestra o datos de población. Cuando presiona el botón Calcular, la calculadora muestra cinco parámetros estadísticos del conjunto de datos: conteo (número de observaciones), media, suma de desviaciones al cuadrado, varianza y desviación estándar.

La calculadora está diseñada para calcular la varianza de un conjunto de datos. También proporciona una idea de la teoría detrás del cálculo y muestra todos los pasos involucrados.

Al hacer inferencias, se desea un gran conjunto de datos para una buena estadística. A menudo es difícil obtener datos de población que representen todas las observaciones posibles en un experimento bajo las condiciones especificadas. Generalmente, se extrae una "muestra" de la población; las inferencias sobre la población generalmente se hacen a partir de la muestra.

La varianza mide la dispersión promedio de un conjunto de datos en relación con la media. A menudo se denota por σ² para una población y por para una muestra. Un valor mayor de σ² o implica una mayor dispersión de los puntos de datos de la media de la muestra y viceversa. Consider the following example data sets.

(Conjunto I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Conjunto II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Introduciendo Conjunto I en la calculadora de varianza se obtiene:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

para una muestra y

n=11

μ=16

SS=704

σ²=64

σ=8

para la población

De manera similar, al introducir Conjunto II en la calculadora se obtiene:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

para una muestra y

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

Para la población.

  • En el Conjunto I, los números se desviaron significativamente de la media muestral

s²=70,4

σ²=64

  • En el Conjunto II la variabilidad es pequeña

s²=5,6

σ²=5,09

La fórmula de la varianza: varianza de la población frente a varianza de la muestra

Varianza de la población

La población en estadística se refiere a todas las observaciones posibles en un experimento. Para N observaciones, la varianza de la población es:

$$\sigma^2=\frac{\sum_{i}^{N}{{(X_i-\ \mu)}^2\ }}{N}$$

donde

  • σ² es la varianza de la población,
  • Σ es la suma,
  • xᵢ es cada observación,
  • μ es la media de la población,
  • n es el número de observaciones en la población.

Varianza de la muestra

La varianza muestral se define como

$$s^2=\frac{\sum_{i}^{N}{{(X_i-\ \bar{X})}^2\ }}{n-1}$$

donde

  • es la varianza de la muestra,
  • Σ es la suma,
  • xᵢ es cada observación,
  • es la media de la muestra,
  • n es el número de observaciones de la muestra.

Pasos para calcular la varianza

Los siguientes pasos están involucrados en el cálculo de la varianza.

Paso 1: Calcular la media de la muestra/población. Esto es la suma de todos los puntos de datos dividida por el número de puntos de datos (n para una muestra y N para la población), es decir,

Media de la muestra:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Media de la población:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Paso 2: Calcular las desviaciones restando la media de la muestra/población de cada punto de datos, es decir,

Desviaciones de la muestra:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

Desviaciones de la población:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

Paso 3: Calcular las desviaciones al cuadrado para cada punto de datos.

Desviaciones al cuadrado de la muestra:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

Desviaciones al cuadrado de la población:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

Paso 4: Calcular la suma de las desviaciones al cuadrado.

Suma de las desviaciones al cuadrado de la muestra:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Suma de las desviaciones al cuadrado de la población:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Paso 5: Dividir la suma de las desviaciones al cuadrado por n-1 para una muestra y N para la población para calcular la varianza.

Varianza de la muestra:

$$s^2=\frac{SS}{n-1}$$

Varianza de la población:

$$\sigma^2=\frac{SS}{N}$$

Ejemplo de cálculo de la varianza para una muestra

Consideremos el siguiente conjunto de datos: 1, 2, 4, 5, 6 y 12. Para calcular la varianza de la muestra, seguimos estos pasos:

Paso 1: Calcular la media de la muestra (promedio).

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Paso 2: Calcular las desviaciones de la media para cada punto de datos.

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Paso 3: Calcular los cuadrados de las desviaciones.

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

Paso 4: Sumar las desviaciones al cuadrado.

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

Paso 5: Calcular la varianza de la muestra dividiendo la suma de las desviaciones al cuadrado por los grados de libertad (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$

Para una población, dividiríamos por n (el número total de puntos de datos), en lugar de n-1, para calcular la varianza de la población.

La importancia de la varianza

La dispersión se utiliza en la inversión. Ayuda a los administradores de activos a mejorar el rendimiento de sus inversiones. Los analistas financieros pueden utilizar la varianza para evaluar el rendimiento individual de los componentes de una cartera de inversiones.

Los inversores calculan la varianza al considerar una nueva compra para decidir si la inversión vale la pena el riesgo. La dispersión ayuda a los analistas a determinar una medida de incertidumbre, que es difícil de cuantificar sin varianza y desviación estándar.

La incertidumbre no se puede medir directamente. Pero la varianza y la desviación estándar (la raíz cuadrada de la varianza) ayudan a determinar el impacto percibido de una acción en particular en una cartera.

Los científicos, estadísticos, matemáticos y analistas de datos también pueden usar la varianza. Ayuda a proporcionar información útil sobre un experimento o muestra de población.

Los científicos pueden buscar diferencias entre los grupos de prueba para determinar si son lo suficientemente similares para probar una hipótesis con éxito. Cuanto mayor sea la varianza del conjunto de datos, más dispersos serán los valores en el conjunto de datos. Los investigadores de datos pueden usar esta información para ver qué tan bien la media representa el conjunto de datos.

La desventaja de usar la varianza es que los grandes valores atípicos en un conjunto pueden provocar cierta distorsión de los datos. Esto se debe a que los valores atípicos pueden aumentar su peso aún más una vez elevados al cuadrado.

Muchos investigadores prefieren trabajar con la desviación estándar, calculada como la raíz cuadrada de la varianza. La desviación estándar se ve menos afectada por los valores atípicos, es una cifra más pequeña y es más fácil de interpretar.