結果が見つかりません
現在、その用語では何も見つかりません。他の検索を試してください。
データセットを入力するだけで、標本・母集団の標準偏差、平均、分散、誤差幅を瞬時に算出する無料の計算ツールです。計算の途中式やステップも詳細に表示されるため、統計の学習や実務でのデータ分析に最適です。データのばらつきや信頼区間を正確に把握しましょう。
| 標本 | 母集団 | |
|---|---|---|
| 標準偏差 | σ = 5.3385 | s = 4.9937 |
| 分散 | σ2 = 28.5 | s2 = 24.9375 |
| カウント | n = 8 | n = 8 |
| 平均 | μ = 18.25 | x̄ = 18.25 |
| 二乗の合計 | SS = 199.5 | SS = 199.5 |
計算にエラーがありました。
この標準偏差計算ツールは、入力された一連の数値データから標準偏差を瞬時に計算します。さらに、平均や分散といった統計分析に不可欠な追加情報も提供します。また、さまざまな信頼水準におけるデータセットの信頼区間や誤差範囲を算出し、度数分布表も作成できます。
本ツールの使い方は非常に簡単です。数値をコンマで区切って入力フィールドに入力し、そのデータが「母集団」と「サンプル(標本)」のどちらを表すかを選択して、【計算】ボタンをクリックするだけです。【クリア】ボタンを押せば入力内容がリセットされ、すぐに別のデータセットを計算できます。
標準偏差(Standard Deviation)とは、特定のデータセットにおけるばらつきや変動の大きさを表す統計的な指標です。具体的には、各データポイントが平均値からどれくらい離れているかの平均的な距離を示します。標準偏差が小さいほど、データは平均値の近くに密集していることを意味し、逆に標準偏差が大きいほど、データは平均値から広く分散していることを示します。また、標準偏差は「分散」と呼ばれる別のばらつき指標の平方根として求められます。
標準偏差は、対象となるデータの性質に応じて計算方法が異なります。データセットが調査対象の全データ(母集団)を表す場合、計算される値は「母標準偏差」と呼ばれます。一方、データセットが母集団の一部を抽出した標本(サンプル)である場合、その値は「標本標準偏差(サンプル標準偏差)」と呼ばれます。
母標準偏差は、データセットが調査対象となる母集団全体を表している場合に計算されます。つまり、分析したいすべての観測データが揃っている状況で使用します。母標準偏差はギリシャ文字の σ(シグマ)で表されます。
σ は小文字のシグマです。母標準偏差は、以下の公式を使用して計算します:
$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$
ここで:
以下の例では、母集団データの標準偏差を求める手順を説明します。
一般的に、株式は他の資産クラスに比べて価格変動(ボラティリティ)が大きいため、投資家からリスクの高い資産と見なされています。ある投資マネージャーは、先月の特定の株式のボラティリティを分析しようとしています。彼は、標準偏差が平均より大きい株式を「リスクが高すぎる」と判断し、クライアントには推奨しない方針をとっています。
以下は、先月におけるその株式の全取引日の終値(米ドル)のリストです。標準偏差を計算して、このマネージャーが対象の株式を「リスクが高すぎる」と見なすかどうかを判定してみましょう:
1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81
ここで、マネージャーは「先月の株価」のみに関心があり、上記のデータは先月のすべての取引日の価格を網羅しています。つまり、必要な母集団全体が手元に揃っていることになります。したがって、母標準偏差の公式を使用して計算を行います。
標準偏差を求めるには、まず平均値を計算します。母平均 μ は、すべての数値の合計をデータの個数で割ることで算出されます。
$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$
次に、各データポイントから平均値を引き、その差を2乗します。それらをすべて足し合わせ、データの総数(20)で割ります。この結果得られる値は分散(σ²)と呼ばれます。
$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$
最後に、分散の平方根をとり、標準偏差を求めます。
$$\sigma=\sqrt{0.045031}\approx0.21$$
計算の結果、先月のこの株式の標準偏差は平均値よりも小さいことがわかります。したがって、マネージャーはこの株式を「リスクが高すぎる」とは見なしません。
標本標準偏差(サンプル標準偏差)は、分析対象のデータセットが母集団全体から抽出されたサンプルである場合に計算されます。つまり、データセットが全体の観測値の一部(サブセット)を表している状況で使用されます。標本標準偏差は s で表され、以下の公式を用いて計算します:
$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$
ここで:
母標準偏差のケースと同じ投資マネージャーの例を用いて、サンプルデータから標準偏差を求める方法を説明します。今回は、マネージャーが先月のすべての取引日の終値データを入手できなかったと仮定します。その代わり、ランダムに抽出された5日分の終値データを持っています。この場合、彼は手元にあるサンプルデータを使用して、株価の標準偏差を推定することになります。
彼が持っている5日間の終値が以下の通りだとします:
1.31, 1.40, 0.86, 0.88, 1.40
マネージャーの分析対象はあくまで「先月の株価全体」ですが、手元には5日分という一部のデータしかありません。つまり、これは母集団に対するサンプル(標本)として扱われます。そのため、標本標準偏差の公式を使用して計算を行います。
まず、サンプルの平均(標本平均)を計算します。
$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$
次に、標本分散 $s^2 $ を計算します。
$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$
最後に、この分散の平方根をとり、標本標準偏差を求めます。
$$s=\sqrt{0.0764}\approx 0.28$$
標準偏差の重要な用途の1つに、「許容可能な」値の範囲(誤差の範囲)を計算することが挙げられます。これは、製造業における統計的な品質保証や、ビジネスにおける予測分析などで非常に重要な役割を果たします。対象となる元のデータが正規分布に従っていると仮定した場合、この範囲は「信頼区間」と呼ばれます(詳しくは次のセクションで解説します)。これらの信頼区間は、さまざまな信頼水準(パーセンテージ)に基づいて算出されます。
許容誤差(誤差範囲・Margin of Error)は、信頼区間の幅を決定する要素です。言い換えれば、許容誤差は調査対象の値が変動しうる最大値と最小値のブレ幅を示しています。
許容誤差は、以下の公式を使用して計算します:
$$誤差の範囲 = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$
この公式は、母標準偏差 σ が既知の場合に適用されます。また同時に、サンプルサイズが十分に大きい(通常は n>30)必要があります。
母標準偏差が未知であり、かつサンプルサイズが小さい(通常は n≤30)場合は、次の公式を使用します:
$$誤差の範囲 = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
この公式では母標準偏差 σ が不明であるため、代わりに標本標準偏差 s を使用します。
\$z_{\alpha/2}\$ と $t_{n-1, \alpha/2}$ は、それぞれZ統計量とt統計量を使用して決定され、「臨界値(Critical Value)」と呼ばれます。これらは、設定された信頼水準に基づく定数です。
統計学において最も一般的に使用される信頼水準は、90%、95%、および99%です。それぞれの信頼水準に対応する \$z_{\alpha/2}\$ の値は、1.645(90%の場合)、1.96(95%の場合)、および 2.575(99%の場合)となります。
\$\frac{\sigma}{\sqrt n}\$ または \$\frac{s}{\sqrt n}\$ は、「標準誤差(Standard Error)」と呼ばれます。
$\frac{\sigma}{\sqrt n}$ は、母標準偏差 σ が既知であり、かつサンプルサイズが大きい(通常は n>30)場合に使用されます。
$\frac{s}{\sqrt n}$ は、母標準偏差が未知であり、かつサンプルサイズが小さい(通常は n≤30)場合に使用されます。つまり、未知の母標準偏差 σ の代わりに、手元にあるサンプルの標準偏差 s を代用します。
前のセクションで触れたように、信頼区間(Confidence Interval)とは、真の値(母数)が特定の信頼水準で含まれると推定される値の範囲(区間)のことです。
たとえば、「13歳の少女の身長」という特定のデータにおいて、「90%の信頼水準で59インチから66インチの間にある」と推定できたとします。これは、13歳の少女のグループをランダムに抽出した場合、約90%の確率でその平均身長がこの指定された範囲内に収まることを意味します。
信頼区間は、以下の公式を使用して計算します:
$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$
母標準偏差 σ が未知であり、代わりに標本標準偏差 s を使用する必要がある場合は、以下の公式を使用します:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
前のセクションで説明した通り、 \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ および \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ の部分は「許容誤差(誤差範囲)」を表しています。
分析対象となる日々の株価が正規分布に従っていると仮定します。手元には以下の株価のサンプルデータがあります:
1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80
このとき、平均株価がどの範囲に収まるかを95%の信頼水準で計算してみましょう。
これはサンプルサイズが小さく、母標準偏差も未知であるため、標本標準偏差と以下の公式を使用して計算を行います:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
これらの数値を公式に当てはめます。
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
計算結果は以下のようになります:
$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$
$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$
これは、真の平均株価が (0.94, 1.26) の信頼区間に収まることを95%の確率で確信できる(95%の信頼水準である)ということを意味しています。