統計計算機
標準偏差計算機


標準偏差計算機

数値を入力するだけで、標本および母集団の標準偏差、平均、分散を瞬時に自動計算する無料ツールです。計算の途中式やステップも分かりやすく表示されるため、統計学の学習やデータ分析に最適です。ブラウザですぐにご利用いただけます。

結果
標準偏差 s = 4.5
分散 s2 = 20.24
カウント n = 7
平均 x̄ = 14.29
二乗和 SS = 100

計算にエラーがありました。

目次

  1. 統計的指標としての標準偏差
  2. この標準偏差計算機の使い方
  3. 本計算機が解決する課題と統計学的背景
  4. 標準偏差の計算式
  5. 標準偏差の計算ステップ
  6. 標本標準偏差の計算例
  7. 標準偏差の活用例

標準偏差計算機

統計的指標としての標準偏差

標準偏差(Standard Deviation)は、特定のデータセットの特性を把握するために最も一般的に使用される統計指標の一つです。簡単に言えば、データセット内の数値がどれだけ「ばらついているか」を示す尺度です。標準偏差を計算することで、各データが平均値にどれほど近いか、あるいは遠く離れているかを確認できます。データポイントが平均値から大きく離れている場合、そのデータセットは大きな偏差を持っていると言えます。したがって、データのばらつきが大きいほど、標準偏差の値も大きくなります。

この計算機(ツール)は、入力された特定のデータセットの標準偏差を迅速に計算し、その結果に至るまでの数学的な計算プロセスを分かりやすく表示します。

この標準偏差計算機の使い方

本計算機は、区切り文字で区切られた数値のリストを入力として受け付けます。入力可能なデータ形式の例を以下の表に示します。

行入力 列入力 列入力 列入力
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

数値は、カンマ、スペース、改行、またはそれらの組み合わせで区切ることができ、行または列の形式で入力可能です。上記の表に示されているすべてのフォーマットにおいて、計算機は入力を「44, 63, 72, 75, 80, 86, 87, 89」として正確に処理します。

データを入力したら、それが「標本データ(サンプル)」か「母集団データ」かを選択し、Enterキーを押してください。計算機は、データセットに関する5つの重要な統計パラメータ(データの個数、平均値、偏差平方和、分散、標準偏差)を算出・表示します。

本計算機が解決する課題と統計学的背景

この計算機は、離散データセットの標準偏差を正確に計算するだけでなく、その計算の背後にある統計学的理論への理解を深めるために設計されています。

データセットは、特定の条件下での実験等におけるすべての可能な観測値からなる「母集団」を形成することがあります。しかし、現実の調査において、母集団のすべてのメンバーからデータを収集(全数調査)することは困難または不可能な場合が少なくありません。

そのため統計実務では、より大きな母集団の一部を抽出した「標本(サンプル)」を扱うのが一般的です。私たちは、標本から得られた情報に基づいて、母集団の特性を推定・推論します。

標準偏差を計算する際、対象となるデータが「標本」か「母集団全体」かによって、使用する計算式が異なります。この違いを調整するのが「自由度」と呼ばれる概念です。標本の分散を計算する場合、データの個数 n の代わりに (n - 1) で割り、その平方根をとって標本標準偏差を求めます。これは、標本データを用いて母集団の標準偏差を推定する際の偏りを補正し、推定値が「不偏推定量」となるようにするための重要な調整です。

標準偏差は、平均値に対するデータの「平均的なばらつき・変動」を測定します。統計学において、母集団の標準偏差はギリシャ文字の σ(シグマ)で、標本の標準偏差は s で表されるのが一般的です。σs の値が大きいほど、データポイントが平均値から広く分散していることを意味し、逆もまた同様です。

以下のデータセットの例を見てみましょう。

(セットI)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(セットII)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

これらのデータセットを計算機に入力すると、以下の結果が得られます。

セットI の結果:

  • x̄ = 16 (平均値)
  • s = 8.3904708 (標準偏差)

セットII の結果:

  • x̄ = 16 (平均値)
  • s = 2.3664319 (標準偏差)

セットI では、数値が平均値から大きくばらついています(s = 8.39)。一方、セットII では、セットI と比較してデータが平均値の近くに集中しており、ばらつきが小さいことがわかります(s = 2.36)。

標準偏差の計算式

母集団のすべての値が分析される場合、以下の母標準偏差の式が適用されます。

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ は母集団の標準偏差です
  • xᵢ は母集団の各データポイントの値です
  • μ は母集団の平均値(算術平均)です
  • N は母集団のサイズ(データの総数)です

一方、母集団のサイズが非常に大きく、その一部を標本として抽出して分析する場合、以下の標本標準偏差の式が使用されます。

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s は標本の標準偏差です
  • xᵢ は標本の各データポイントの値です
  • は標本の平均値です
  • n は標本サイズ(データの個数)です

標準偏差の計算ステップ

標準偏差を手計算する場合、以下のステップに従います。

ステップ 1: 標本平均または母集団平均を計算します。これは、すべてのデータポイントの合計を、データの個数(n または N)で割った値です。

標本平均:

$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$

母平均:

$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$

ステップ 2: 各データポイントから平均値を引き、偏差(平均からのズレ)を計算します。

標本の偏差:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$

母集団の偏差:

$$(x₁-\ \mu), (x₂-\ \mu), (x_3-\ \mu)……………….. (x_N-\ \mu)$$

ステップ 3: 各データポイントの偏差を2乗します。

標本の偏差平方:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$

母集団の偏差平方:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x_3-\ \mu)^2……………….. (x_N-\ \mu)^2$$

ステップ 4: すべての個々の偏差平方を足し合わせて、偏差平方和(SS: Sum of Squares)を計算します。

標本の偏差平方和:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$

母集団の偏差平方和:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x_3-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

ステップ 5: 偏差平方和を自由度で割り、分散を求めます。母集団の場合は N で割り、標本の場合は (n - 1) で割ります。

標本分散:

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

母分散:

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

標本分散を計算する際、直感的には以下の式を使うと思うかもしれません。

$$\frac{(x-\bar{x})^2}{n}$$

ここで は標本平均、n は標本サイズです。しかし、統計学においては通常この式は使用されません。

なぜなら、この式で計算された分散は、母集団の分散を過小評価してしまうからです(特に母集団が大きく、標本が小さい場合)。これを防ぎ、分散の推定値をより実際の母集団の値に近づける(不偏推定量にする)ために、分母に n ではなく (n - 1) (自由度)を使用して計算値を大きく補正します。

ステップ 6: 最後に、得られた分散の平方根を計算します。分散の平方根が標準偏差となります。

標本標準偏差:

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

母標準偏差:

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

標本標準偏差の計算例

物理学の期末試験における n = 8 人の学生のスコアを例として考えてみましょう。

45, 67, 70, 75, 80, 81, 82, 84

本計算機は、以下のステップを用いて標本の標準偏差を算出します。

ステップ 1: 平均を計算する。

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

ステップ 2: 偏差を計算する。

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

ステップ 3: 偏差の2乗を計算する。

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

ステップ 4: 偏差平方和(SS)を計算する。

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

ステップ 5: 偏差平方和を自由度 (n - 1) で割って分散を計算する。もしこれが母集団データであれば N で割りますが、今回は全学生ではなく一部の標本データとして扱うため (n - 1) で割ります。

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

ステップ 6: 分散の平方根をとり、標準偏差を求める。

$$s=\sqrt{s^2}=\ \sqrt{164} \approx 12.80$$

標準偏差の活用例

分散と標準偏差は、データのばらつきを定量的に評価するために欠かせない指標です。標準偏差が大きいほど、データポイントは平均値から広く分散しています。この特性は、2つ以上のデータセットを比較し、どちらの変動(ボラティリティ)が大きいかを判断する際に非常に役立ちます。

産業界では、標準偏差は品質管理の分野で広く活用されています。例えば、大量生産においては、製品の寸法などの特性が一定の許容範囲内に収まっている必要があります。ナットやボルトの製造において、直径のばらつき(標準偏差)が大きすぎると、部品同士がうまく噛み合いません。標準偏差を継続的に計算・監視することで、製品品質を一定に保つことができます。

また、標準偏差は金融や投資の分野でリスク(ボラティリティ)を評価する指標としても多用されます。テクニカル分析では、価格変動の標準偏差を用いてボリンジャーバンドを描画し、市場のボラティリティを可視化します。さらに社会学やマーケティングのリサーチにおいては、世論調査やアンケート結果の不確実性(誤差の範囲)を計算するためにも使用されます。

統計学的な観点では、分散と標準偏差は、特定の区間にデータがどれくらい含まれているかを予測する基準となります。たとえばチェビシェフの定理によれば、どのようなデータ分布であっても「少なくとも75%のデータは、平均値から標準偏差の2倍(±2σ)の範囲内に収まる」ことが示されています。

最後に、身近な気候の例を考えてみましょう。同じ地域にあり、1年間の「平均最高気温」が同じである2つの都市(沿岸部の都市と内陸部の都市)を比較します。平均気温は同じでも、内陸部の都市は気温の変動幅が大きく、最高気温の標準偏差は高くなります。一方、海沿いの都市は気温が安定しているため、最高気温の標準偏差は小さくなります。 標準偏差を比較することで、「平均値は同じでも、沿岸部の都市の方が気温の変化が少なく、より穏やかな気候である」という事実を統計的に裏付けることができるのです。