Calculadoras Estadísticas
Calculadora de desviación estándar

Calculadora de desviación estándar

Dado un conjunto de datos discretos, la calculadora calcula la media, la varianza y la desviación estándar de una muestra o población e indica todos los pasos intermedios de los cálculos.

Resultado
Desviación Estándar s = 4.5
Diferencia s2 = 20.24
Contar n = 7
Significar x̄ = 14.29
Suma de cuadrados SS = 100

Hubo un error con tu cálculo.

Tabla de contenido

  1. Desviación estándar como medida estadística
  2. Las reglas para usar esta calculadora.
  3. Los problemas que esta calculadora está diseñada para resolver
  4. Fórmulas para calcular la desviación estándar
  5. Cálculo de desviación estándar
  6. Ejemplo de cálculo de la desviación estándar de una muestra
  7. Aplicaciones de la desviación estándar
  8. Aplicación de la desviación estándar

Calculadora de desviación estándar

Desviación estándar como medida estadística

La desviación estándar es una de las métricas más utilizadas para caracterizar las estadísticas de un conjunto de datos determinado. La desviación estándar, en términos simples, es una medida de cuán disperso está el conjunto de datos. Al calcular la desviación estándar, puede averiguar si los números están cerca o lejos de la media. Si los puntos de datos están lejos de la media, se dice que hay una gran desviación en el conjunto de datos. Por lo tanto, cuanto mayor sea la dispersión en los datos, mayor será la desviación estándar.

Esta calculadora determina la desviación estándar de un conjunto de datos dado y muestra los pasos matemáticos involucrados en el cálculo.

Las reglas para usar esta calculadora.

La calculadora acepta la entrada de una lista de números separados por un delimitador. En la siguiente tabla se muestran algunos ejemplos de posibles entradas.

entrada de fila entrada de columna entrada de columna entrada de columna
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Los números pueden estar separados por una coma/espacio/salto de línea o una combinación de ellos y pueden insertarse en el formato de fila o columna. Para todos los formatos que se muestran en la tabla anterior, la calculadora procesa la entrada como 44, 63, 72, 75, 80, 86, 87 y 89.

Una vez que ingrese los datos, seleccione si se trata de una muestra o datos de población y presione enter. La calculadora muestra cinco parámetros estadísticos del conjunto de datos: recuento (número de observaciones), media, suma de desviaciones al cuadrado, varianza y desviación estándar.

Los problemas que esta calculadora está diseñada para resolver

La calculadora está diseñada para calcular la desviación estándar de un conjunto de datos discretos y proporciona una idea de la teoría detrás del cálculo.

Los datos pueden consistir en una población compuesta por todas las observaciones posibles en un experimento (de cualquier tipo) bajo las condiciones especificadas. En muchos casos, es imposible muestrear a cada miembro de la población.

En la práctica estadística, es habitual trabajar con un subconjunto de una "población" mayor, que denominamos "muestra". Esto se debe a que a menudo resulta poco práctico o imposible recopilar datos de todos los individuos de la población. Hacemos estimaciones o inferencias sobre la población basándonos en la información obtenida de la muestra.

Al calcular la desviación típica, la fórmula que utilizamos se ajusta en función de si se trata de una muestra o de toda la población. Este ajuste se realiza mediante un factor conocido como "grados de libertad". Para una muestra, dividimos por n - 1 (donde n es el tamaño de la muestra) en lugar de n al calcular la varianza, que luego se eleva al cuadrado para hallar la desviación típica. Esta corrección compensa el hecho de que estamos utilizando datos de la muestra para estimar la desviación típica de la población y garantiza que nuestra estimación sea insesgada.

La desviación estándar mide la dispersión/desviación/variabilidad promedio de un conjunto de datos en relación con la media. A menudo se denota con la letra griega σ para una población o s para una muestra. Un valor mayor de σ o s implica una mayor dispersión de los puntos de datos de la media de la muestra y viceversa.

Considere los siguientes ejemplos de conjuntos de datos.

(Conjunto I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(Conjunto II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Sustituyendo estos conjuntos de datos en la calculadora, obtenemos el conjunto I

  • x̄=16 - el valor medio
  • s=8,3904708 - desviación estándar

Para el conunto II

  • x̄=16 - el valor medio
  • s=2,3664319 - desviación estándar

En el Conjunto I, los números se desviaron significativamente de la media muestral (s=8,39) mientras que en el Conjunto II la variabilidad es pequeña (s=2,36) en comparación con el Conjunto I.

Fórmulas para calcular la desviación estándar

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

σ es la desviación estándar de la población, xᵢ es el valor de un valor individual de la población, μ es la media aritmética de la población, n es el tamaño de la población.

Esta fórmula se aplica cuando se analizan todos los valores de la población.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

s es la desviación estándar de la muestra, xᵢ es el valor de un valor de muestra individual, es la media de la muestra, n es el tamaño de la muestra.

Esta fórmula se utiliza cuando existe un tamaño de población muy grande y solo se toma su muestra para el análisis.

Cálculo de desviación estándar

Los siguientes pasos están involucrados en el cálculo de la desviación estándar.

Paso 1: Calcule la media de la muestra/población. Es simplemente la suma de todos los puntos de datos dividida por el número de conteos n o n, es decir.

Muestra promedio:

$$\bar{X}=\frac{x₁+x₂+X_3+........+X_n}{n}$$

Media poblacional

$$\mu=\frac{x₁+x₂+X_3+........+X_N}{N}$$

Paso 2: Calcule la desviación restando la media de muestra/población de cada punto de datos, es decir.

Desviación de la muestra:

$$(x₁-\bar{X}), (x₂-\bar{X}), (X_3-\bar{X})…………………… (X_n-\bar{X})$$

Desviación de la población:

$$(x₁-\ \mu), (x₂-\ \mu), (X_3-\ \mu)……………….. (X_N-\ \mu)$$

Paso 3: Calcule las desviaciones al cuadrado para cada punto de datos.

Ejemplo de desviaciones al cuadrado:

$$(x₁-\bar{X})^2, (x₂-\bar{X})^2, (X_3-\bar{X})^2…………………… (X_n-\bar{X})^2$$

Desviaciones al cuadrado de la población:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (X_3-\ \mu)^2……………….. (X_N-\ \mu)^2$$

Paso 4: Calcule la suma de las desviaciones al cuadrado sumando todas las desviaciones al cuadrado individuales

Ejemplo de suma de desviaciones al cuadrado:

$$SS=(x₁-\bar{X})^2+ (x₂-\bar{X})^2+(X_3-\bar{X})^2……………………+(X_n-\bar{X})^2$$

Población suma de desviaciones al cuadrado:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(X_3-\ \mu)^2……………….+ (X_N-\ \mu)^2$$

Paso 5: Divida la suma de las desviaciones al cuadrado por el número de grados de libertad para obtener la varianza. Para una población, dividir por N, y para una muestra, dividir por n-1.

Varianza de la muestra

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Varianza de la población

$$ \sigma^2 = \frac{\suma_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

Al calcular la varianza de una muestra, podríamos suponer que usaremos la expresión para los cálculos:

$$\frac{(X-\bar{X})^2}{n}$$

dónde x̄ es la media de la muestra y n es el volumen de la muestra. Pero tal formula no se utiliza.

Tal expresión no daría una buena estimación de la varianza de la población. Cuando la población general es muy grande y la muestra es muy pequeña, la varianza calculada por esta fórmula subestimaría la varianza de la población. Mostraría una variación demasiado pequeña debido a la falta de datos. Entonces, al usar la expresión n-1, aumentamos el valor de la varianza potencial.

En lugar de dividir por n, encontramos la varianza de la muestra dividiendo por $n - 1$. Esta operación da un valor de varianza ligeramente mayor, más cercano al valor real.

Paso 6: Extrae la raíz cuadrada del número resultante. La desviación estándar es la raíz cuadrada de la varianza.

Desviación estándar de la muestra

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(X_i-\ \bar{X})}^2\ }}{n-1}}$$

Desviación estándar de población

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(X_i-\ \bar{\mu})}^2\ }}{N}}$$

Ejemplo de cálculo de la desviación estándar de una muestra

Consideremos las siguientes puntuaciones de N=8 estudiantes en el final de Física:

45, 67, 70, 75, 80, 81, 82, and 84

La calculadora calcula la desviación estándar de la muestra utilizando los siguientes pasos:

Paso 1: Calcule la media.

$$\bar{X}=\frac{\sum_{i} X_i}{N}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

Paso 2: Calcule las desviaciones

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Paso 3: Calcule los cuadrados de las desviaciones

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Paso 4: Suma las desviaciones al cuadrado.

$$SS=\sum_{i}^{N}{{(X_i-\ \bar{X})}^2=784+36+9+4+49+64+81+121}=1148$$

Paso 5: Calcule la varianza dividiendo la suma de las desviaciones al cuadrado por los grados de libertad (N-1). Para una población, la varianza en este paso se divide por N en lugar de N-1. En este caso, tenemos una muestra, es decir, datos de una parte de la población estudiantil, no de toda la población.

$$s^2=\ \frac{\sum_{i}^{N}{{(X_i-\ \bar{X})}^2\ }}{N-1}=\frac{1148}{8-1}=164$$

Paso 6: Calcula la raíz cuadrada de la varianza para obtener la desviación estándar.

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

Aplicaciones de la desviación estándar

Aplicación de la desviación estándar

La dispersión y la desviación estándar se pueden utilizar para determinar la dispersión de los datos. Si la varianza o desviación estándar es grande, los datos están más dispersos. Esta información es útil cuando se comparan dos (o más) conjuntos de datos para determinar cuál es más (la mayoría) variable.

En la industria, la desviación estándar se usa ampliamente para el control de calidad. En la producción a gran escala, ciertas características del producto deben estar dentro de un rango definido al que se puede acceder calculando la desviación estándar. Por ejemplo, en la producción de tuercas y tornillos, la variación en sus diámetros debe ser pequeña, de lo contrario, las piezas no encajarán entre sí.

La desviación estándar se usa en finanzas y muchas otras áreas para evaluar el riesgo. En análisis técnico, la desviación estándar se usa para construir líneas de Bollinger y calcular la volatilidad.

Además, la desviación estándar se usa en finanzas como medida de volatilidad, y en sociología se usa en encuestas de opinión pública para ayudar a calcular la incertidumbre.

La varianza y la desviación estándar se utilizan para determinar la cantidad de valores de datos que se encuentran dentro de un intervalo de distribución dado. Por ejemplo, el teorema de Chebyshev muestra que para cualquier distribución, al menos el 75 % de los valores de los datos estarán dentro de 2 desviaciones estándar de la media.

Tomemos un ejemplo simple con el clima. Supongamos que estudiamos la temperatura diaria de dos ciudades en la misma región. Una ciudad está en la costa y la otra en el interior. La temperatura diaria máxima promedio en estas dos ciudades puede ser la misma. Pero la desviación estándar, es decir, la dispersión de las temperaturas máximas diarias será mayor para la ciudad ubicada en el continente, y la ciudad costera tendrá una desviación estándar menor de las temperaturas máximas diarias.

Esto significa que una ciudad continental tendrá una mayor variación en la temperatura máxima del aire en cualquier día del año que una ciudad costera. Es decir, la ciudad costera tendrá un clima más estable.