統計計算機
標準偏差計算機

標準偏差計算機

離散データセットを指定すると、計算機はサンプルまたは母集団の平均、分散、および標準偏差を計算し、計算のすべての中間ステップを表示します。

結果
標準偏差 s = 4.5
分散 s2 = 20.24
カウント n = 7
平均 x̄ = 14.29
平方和 SS = 100

計算に誤りがありました。

目次

  1. 統計的尺度としての標準偏差
  2. この計算機を使用するためのルール
  3. この計算機が解決するように設計された問題
  4. 標準偏差の計算式
  5. 標準偏差の計算
  6. サンプルの標準偏差計算の例
  7. 標準偏差の応用

標準偏差計算機

統計的尺度としての標準偏差

標準偏差は、特定のデータセットの統計を特徴付けるために最も一般的に使用されるメトリックの1つです。標準偏差は、簡単に言えば、データセットがどれだけ散在しているかを示す尺度です。標準偏差を計算することで、数値が平均に近いか遠いかを調べることができます。データポイントが平均からかけ離れている場合は、データセットに大きな偏差があります。したがって、データのばらつきが大きいほど、標準偏差は高くなります。

この計算機は、特定のデータセットの標準偏差を定義し、計算に関連する数学的ステップを表示します。

この計算機を使用するためのルール

電卓は、区切り文字で区切られた数値のリストとして入力を受け入れます。可能な入力の例をいくつか次の表に示します。

行入力 列入力 列入力 列入力
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

数値は、コンマ/スペース/改行またはそれらの組み合わせで区切ることができ、行または列の形式で挿入できます。上記の表に示されているすべての形式について、計算機は入力を44、63、72、75、80、86、87、および89として処理します。

データを入力したら、それがサンプルデータか母集団データかを選択し、Enterキーを押します。計算機には、データセットの5つの統計パラメータが表示されます:度数(観測値の数)、平均、偏差の平方和、分散、および標準偏差。

この計算機が解決するように設計された問題

計算機は、離散データセットの標準偏差を計算するように設計されており、計算の背後にある理論への洞察を提供します。

データは、指定された条件下での実験 (あらゆる種類の) におけるすべての可能な観測値からなる母集団からなることができる。多くの場合、各母集団メンバーをサンプリングすることは不可能です。

統計の実務では、より大きな「母集団」の部分集合を扱うのが一般的で、私たちはこれを「標本」と呼んでいる。これは、母集団のすべての個人からデータを収集することが現実的でなかったり、不可能であったりすることが多いからである。私たちは、標本から集めた情報に基づいて、母集団についての推定や推論を行います。

標準偏差を計算する場合、サンプルか母集団全体かによって、使用する計算式が調整されます。この調整は、「自由度」として知られる係数によって行われる。標本の場合、分散を計算するときにnの代わりにn - 1(nは標本サイズ)で割り、それを2乗して標準偏差を求めます。この補正は、母集団の標準偏差を推定するために標本データを使っているという事実を補正し、推定値が不偏であることを保証します。

標準偏差は、平均に対するデータセットの平均分散/偏差/変動を測定します。多くの場合、母集団の場合はギリシャ文字のσ、サンプルの場合はsで表されます。σ または s の値が大きいほど、サンプル平均からのデータポイントの分散が大きくなり、その逆も同様です。

以下のデータ・セットの例を考えてみましょう。

(セットI)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(セットII)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20 これらのデータセットを計算機に代入すると、セットIが得られます

  • x̄=16 -平均値
  • s=8.3904708 -標準偏差

セット用II

  • x̄=16 -平均値
  • s=2.3664319 -標準偏差

セットIでは、数値はサンプル平均から有意に逸脱していますが(s = 8.39)、セットIIでは、セットIと比較して変動が小さい(s = 2.36)。

標準偏差の計算式

この式は、母集団のすべての値が分析されるときに適用されます。

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σは母集団の標準偏差です,
  • xᵢは、母集団の個々の値の値です,
  • μは母集団の算術平均です,
  • nは人口の大きさです。

以下の式は、母集団のサイズが非常に大きく、そのサンプルのみが分析のために取得される場合に使用されます。

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • sはサンプルの標準偏差です,
  • xᵢは、個々のサンプル値の値です,
  • は標本の平均です,
  • nはサンプルサイズです。

標準偏差の計算

標準偏差の計算には、次の手順が含まれます。

ステップ1: サンプル/母平均を計算します。これは、すべてのデータポイントの合計をカウント数Nまたはnで割ったものです。

サンプル平均:

$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$

母平均

$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$

ステップ 2: 各データポイントからサンプル/母平均を減算して偏差を計算します。

サンプル偏差:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$

人口偏差:

$$(x₁-\ \mu), (x₂-\ \mu), (x_3-\ \mu)……………….. (x_N-\ \mu)$$

ステップ 3: 各データポイントの偏差の二乗を計算します。

サンプル二乗偏差:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$

母集団の二乗偏差:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x_3-\ \mu)^2……………….. (x_N-\ \mu)^2$$

ステップ 4: すべての個々の平方偏差を加算して、偏差の平方和を計算します

偏差の平方和のサンプル:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$

偏差の二乗母和:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x_3-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

ステップ5: 二乗偏差の合計を自由度数で割って分散を求めます。母集団の場合はNで割り,標本の場合はn-1で割る。

標本の分散

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

母分散

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

サンプルの分散を計算するとき、計算に式を使用すると仮定できます:

$$\frac{(x-\bar{x})^2}{n}$$

どこ

x̄はサンプル平均、n はサンプルサイズです。しかし、そのような式は使用されていません。

そのような表現は、母集団の分散の良い推定値を与えません。一般母集団が非常に大きく、サンプルが非常に小さい場合、この式で計算された分散は母集団の分散を過小評価します。これは、データが不足しているため、分散が小さすぎることを示します。したがって、式n-1を使用して、潜在的な分散値を増やします。

nで割る代わりに、n-1で割ってサンプルの分散を求めます。この操作では、分散値がわずかに大きくなり、実際の値に近くなります。

ステップ 6: 結果の数値の平方根を抽出します。標準偏差は分散の平方根です。

サンプル標準偏差

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

母標準偏差

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

サンプルの標準偏差計算の例

物理学の決勝戦でのn = 8人の学生の次のスコアを考えてみましょう:

45, 67, 70, 75, 80, 81, 82, と 84

計算機は以下のステップを使用してサンプルの標準偏差を計算します:

ステップ 1: 平均を計算します。

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

ステップ 2: 偏差を計算する

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

ステップ 3: 偏差の二乗を計算する

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

ステップ 4: 偏差の二乗を合計します。

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

ステップ 5: 偏差の平方和を自由度(n-1)で割って分散を計算します。母集団の場合、このステップの分散はN-1ではなくNで除算されます。この場合、サンプル、つまり、母集団全体ではなく、学生母集団の一部に関するデータがあります。

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

ステップ6: 分散の平方根を取り、標準偏差を取得します。

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

標準偏差の応用

分散と標準偏差を使用して、データのばらつきを決定できます。分散または標準偏差が大きい場合、データはよりばらばらになります。この情報は、2 つ (またはそれ以上) のデータセットを比較して、どちらがより多い (最も) 変数が多いかを判断するときに役立ちます。

業界では、標準偏差は品質管理に広く使用されています。大規模生産では、特定の製品特性は、標準偏差を計算することによってアクセスできる定義された範囲内にある必要があります。例えば、ナットとボルトの製造では、それらの直径の変化は小さくなければなりません、さもなければ、部品は一緒にはまりません。

標準偏差は、リスクを評価するために財務および他の多くの分野で使用されます。テクニカル分析では、標準偏差を使用してボリンジャーラインを作成し、ボラティリティを計算します。

また、標準偏差は金融ではボラティリティの尺度として使用され、社会学では世論調査で不確実性の計算に使用されます。

分散と標準偏差は、特定の分布区間内にあるデータ値の数を決定するために使用されます。たとえば、チェビシェフの定理は、どの分布でも、データ値の少なくとも75%が平均の2標準偏差以内にあることを示しています。

気候の簡単な例を見てみましょう。同じ地域の2つの都市の毎日の気温を調べるとします。1つの都市は海岸にあり、もう1つの都市は内陸にあります。これら2つの都市の毎日の平均最高気温は同じかもしれません。しかし、標準偏差、つまり最高日気温の広がりは、大陸に位置する都市ほど大きくなり、沿岸都市は最高日気温の標準偏差が小さくなります。 これは、大陸の都市は、沿岸の都市よりも、一年の特定の日の最高気温の変動が大きいことを意味します。つまり、沿岸都市はより穏やかな気候になります。