统计计算器
标准差

标准差

给定一个离散数据集,计算器可计算样本或总体的平均值、方差和标准差,并显示所有中间计算步骤。

结果
标准偏差 s = 4.5
方差 s2 = 20.24
数数 n = 7
意思是 x̄ = 14.29
平方和 SS = 100

你的计算有误。

目录

  1. 标准差是一种统计指标
  2. 使用本计算器的规则
  3. 本计算器用于解决的问题
  4. 计算标准差的公式
  5. 标准差计算
  6. 样本标准差计算示例
  7. 标准差的应用

标准差

标准差是一种统计指标

标准差是描述给定数据集统计特性最常用指标之一。简单来说,标准差是衡量数据集离散程度的指标。通过计算标准差,可以找出数据是接近平均值还是远离平均值。如果数据点远离平均值,那么数据集的偏差就很大。因此,数据越分散,标准差就越大。

该计算器可计算给定数据集的标准差,并显示计算步骤。

使用本计算器的规则

该计算器接受以分隔符分隔的数字列表作为输入数据。下表列举了一些可能的输入示例。

行输入 列输入 列输入 列输入
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

数字可以用逗号/空格/换行符分隔,也可以混合使用,还可以按行或列格式插入。对于上表中的所有格式,计算器处理的输入值为 44、63、72、75、80、86、87 和 89。

输入数据后,选择是样本数据还是总体数据,然后点击回车。计算器会显示数据集的五个统计参数:计数(观察数)、平均数、平方差总和、方差和标准差。

本计算器用于解决的问题

计算器旨在计算离散数据集的标准差,并提供计算背后的步骤。

数据可能包括在指定条件下实验的所有可能观察结果构成的总体。在许多情况下,不可能对每个总体个体进行抽样。

这就是为什么统计学经常从 "总体 "中抽取一个子集,并称之为 "样本"。对总体的推断通常是通过样本进行的。样本和总体的标准差计算略有不同。其不同之处在于自由度因子。

标准差衡量数据集相对于平均值的平均离散度/偏差/变异性。通常用希腊字母 σ 表示总体标准差,用 s 表示样本标准差。σs 的值越大,意味着数据点与总体或样本平均值的离散度越大,反之亦然。

请看下面的数据集示例。

(数据集I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(数据集II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

将这些数据集代入计算器后,我们得到数据集I的结果:

  • x̄=16* - 平均值
  • s=8.3904708 - 标准差

对于数据集II:

  • x̄=16* - 平均值
  • s=2.3664319 - 标准差

在数据集I中,数值与样本均值(s=8.39)相差较大,而在数据集II中,变异性相对较小(s=2.36),与数据集I相比。

计算标准差的公式

当分析总体的所有值时,使用以下公式:

$$σ = \sqrt{frac{sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ 是总体的标准差、
  • xᵢ 是总体中的个体值、
  • μ 是总体的算术平均值、
  • n 是总体数量。

当总体很大,只采用其样本进行分析时,使用下面的公式:

$$s = \sqrt{frac{sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s 是样本的标准差,、
  • xᵢ 是样本中的个体样本值、
  • 是样本的平均值、
  • n 是样本数量。

标准差计算

计算标准差的步骤如下:

步骤1: 计算样本/总体平均值。它是所有数据点的总和除以数量数量 N 或 n,即

样本平均值:

$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$

总体平均值

$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$

步骤2: 从每个数据点减去样本/总体平均值,计算偏差,即

样本偏差:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$

总体偏差:

$$(x₁-\ \mu), (x₂-\ \mu), (x_3-\ \mu)……………….. (x_N-\ \mu)$$

步骤3: 计算每个数据点的平方差。

样本平方差:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$

总体平方差:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x_3-\ \mu)^2……………….. (x_N-\ \mu)^2$$

步骤4: 将所有单个平方差相加,计算平方差之和

样本平方差总和:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$

总体平方差总和:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x_3-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

步骤5: 将这个数值除以总体或样本的大小,即可得到方差。计算器通过平方差之和除以自由度的数量来计算方差:样本为 N,总体为 n-1。

样本差异

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

总体差异

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

在计算样本方差时,我们可以假设我们将使用以下表达式进行计算:

$$\frac{(x-\bar{x})^2}{n}$$

其中

x̄ 是样本平均数,n 是样本容量。但实际上不使用这样的公式。

这样的表达式不能很好地估计总体的方差。当总体非常庞大而样本非常小的情况下,通过这个公式计算出的方差会低估总体的方差。这将由于数据不足而显示出太小的方差。因此,通过使用表达式 n-1,我们增加了潜在的方差值。

我们不除以 n,而是通过除以 n-1 来求得样本的方差。这一操作得出的方差值略大,更接近实际值。

步骤6: 求出所得数字的平方根。标准差就是方差的平方根。

样本标准差

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

总体标准差

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

样本标准差计算示例

让我们来看看 n=8 名学生的物理期末考试成绩:

45、67、70、75、80、81、82 和 84

计算器通过以下步骤计算总体的标准差:

步骤 1: 计算平均值。

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

步骤2: 计算偏差

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

步骤3: 计算偏差的平方

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

步骤4: 求偏差平方和。

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

步骤5: 用平方差之和除以自由度 (n-1),计算方差。对于一个总体,这一步的方差将除以 N,而不是 N-1。在这种情况下,我们得到的是样本,即部分学生的数据,而不是整个总体的数据。

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

步骤: 求方差的平方根,得到标准差。

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

标准差的应用

离散度和标准差可用于确定数据的分散程度。如果方差或标准差较大,则数据较为分散。在比较两个(或更多)数据集以确定哪个更具变异性时,此信息非常有用。

在工业领域,标准差被广泛用于质量控制。在大规模生产中,某些产品的特性必须在一个确定的范围内,通过计算标准差就可以获得这个范围。例如,在生产螺母和螺栓时,其直径的变化必须很小,否则,零件就无法安装在一起。

标准差用于金融和许多其他领域的风险评估。在技术分析中,标准差用于构建布林线和计算波动率。

此外,标准差在金融领域中被用来衡量波动性,而在社会学中,标准差被用于民意调查,以帮助计算不确定性。

方差和标准差用于确定落入给定分布间隔的数据值数量。例如,切比雪夫的定理显示,对于任何分布,至少有 75% 的数据值将落入均值的 2 个标准差之内。

让我们用一个气候的简单例子来说明。假设我们研究同一地区两个城市的日气温。一个城市位于沿海,另一个城市位于内陆。这两个城市的日平均最高气温可能相同。但是,内陆城市的标准差,即最高日气温的分散度会更大,而沿海城市的最高日气温标准差会更小。

这意味着内陆城市在一年中的任何给定天的最高气温变化更大。也就是说,沿海城市的气候更温和。