統計計算機
サンプルサイズ計算機


サンプルサイズ計算機

アンケート調査や統計分析に必要な「最小サンプルサイズ(標本サイズ)」と「許容誤差」を簡単に計算できる無料ツールです。母集団の規模や信頼水準を入力するだけで、最適なデータ数を瞬時に算出します。信頼区間や誤差に関する基礎知識もわかりやすく解説しています。

標本の大きさ

385

誤差の範囲

9.8%

計算にエラーがありました。

目次

  1. サンプル(標本)とは
  2. 許容誤差(マージン・オブ・エラー)とは
  3. 信頼区間とは
  4. サンプルサイズ、許容誤差、信頼区間の相互関係
  5. サンプルサイズを計算する公式
  6. 例1
  7. 例2
  8. 許容誤差を計算する公式
  9. 例3
  10. 信頼区間を計算する公式
  11. 例4

サンプルサイズ計算機

当サイトの「サンプルサイズ計算ツール」は、2つの主要な機能を備えています。1つ目は最適なサンプルサイズ(標本サイズ)の計算、2つ目は許容誤差(マージン・オブ・エラー)の算出です。

サンプルサイズを決定する最初のステップとして、まずはドロップダウンリストから「信頼水準」を選択してください。次に「相対誤差幅」を入力します(絶対値の誤差幅を相対値に変換するには、誤差の絶対値を点推定値で割って求めます)。

続いて、母比率(母集団比率)がわかっている場合はその数値を入力し、不明な場合は「50%」のままにしておきます。最後に、母集団のサイズ(総人口)がわかっている場合は該当のセルに入力し、わからない場合は空白のままにして「計算」ボタンをクリックします。

ツールの2つ目の機能を利用すると、許容誤差を簡単に算出できます。まず、ドロップダウンメニューから「信頼水準」を選択します。次に、分析対象の「サンプルサイズ」と「母比率」を入力してください。最後に「母集団のサイズ」を入力しますが、不明な場合は空白のままで構いません。すべての入力が完了したら「計算」ボタンをクリックしてください。

サンプル(標本)とは

「サンプル(標本)」とは、母集団の一部を抽出したものを指します。ここでいう「母集団」とは、特定の調査や研究において関心を集める対象全体のデータのことです。調査対象となる母集団の全要素を調べる(全数調査)のが理想的ですが、現実にはさまざまな制約により、すべてを調べることは困難です。

たとえば、ジャングルに生息する昆虫の研究では、対象となる個体数(母集団)は無限に近いため、すべてを調査することは不可能です。また、品質検査などでテスト対象の製品が破壊されてしまうケースもあります。密閉された清涼飲料水のボトルを開封して容量を確認した場合、そのボトルを商品として市場に出荷することはできなくなります。

母集団全体を調査するには、膨大な時間やコスト、その他のリソースが必要になります。しかし多くの場合、限られたリソースの中で調査を完了させなければならず、全数調査を行うのは非現実的です。そこで、全体の中から一部の「サンプル(標本)」を抽出して調査・分析を行う「標本調査」が最適な解決策となります。

許容誤差(マージン・オブ・エラー)とは

前述の通り、ほとんどのケースで母集団の全データを調べることはできません。そのため、母数(母集団の持つ統計的な指標)を推定するために、標本統計量(サンプルから計算された測定値)がよく用いられます。標本統計量は、実際に抽出されたサンプルを観察・測定したデータに基づいています。このように、母数をひとつの数値で推定することを「点推定」と呼びます。

たとえば、生産ラインを流れる清涼飲料水ボトルの平均容量を推定したい場合、ランダムにいくつかのバッチを抽出し、そのバッチの平均容量を計算します。もし抽出したバッチの平均容量(x̄)が 250ml だった場合、生産ラインにあるすべてのボトルの平均容量 \$(\hat{μ})\$ も 250ml であると推定できます。

しかし現実には、実際の母数(真の値)と推定値が完全に一致することはありません。この差異は、母集団全体ではなくサンプルを用いて推定を行っているために生じるものです。

このとき、点推定値と実際の真の値との間に生じうる最大の差異(誤差の最大幅)を**許容誤差(マージン・オブ・エラー)**と定義します。これは「推定値の最大誤差」と呼ばれることもあります。

信頼区間とは

信頼区間とは、真の母数が含まれると推定される数値の範囲のことです。この範囲(信頼区間)は、特定の誤差の範囲内で母数が推定されたことを示しています。信頼区間の下限値は「点推定値から許容誤差を引いた値」となり、上限値は「点推定値に許容誤差を足した値」として算出されます。

サンプルサイズ、許容誤差、信頼区間の相互関係

全数調査を行う代わりにサンプルを調査して母数を推定しているため、どうしても推定値と実際の真の値との間には差異が生じます。この「点推定値と真の値との間に生じうる最大の差」が許容誤差です。

ここで重要なのは、サンプルサイズと許容誤差には反比例(逆相関)の関係があるということです。サンプルサイズを大きくすればするほど、母集団をより正確に反映できるようになるため、許容誤差(誤差の幅)は小さくなります。反対に、サンプルサイズを小さくすると許容誤差は大きくなります。

そして、この許容誤差を点推定値に当てはめることで、具体的な「信頼区間」を導き出すことができるのです。

サンプルサイズを計算する公式

入手可能なデータや情報に応じて、サンプルサイズを計算するためのさまざまな公式を使い分けることができます。

選択した「信頼水準」によって推定の確実性が決まり、「許容誤差の最大幅」によって区間推定で達成したい精度が決定されます。

もし母集団の標準偏差(σ)がわかっている場合は、以下の数式を使用して、目的の信頼区間を得るために必要な最小サンプルサイズを計算できます。

$$n=\left(\frac{z_{\alpha/2}×\sigma}{E}\right)^2$$

計算された最終的なサンプルサイズ $n$ は、最も近い整数に切り上げる必要があります。

また、**コクランの公式(Cochran's formula)**を使用すると、「目的の許容誤差」「目的の信頼水準」、そして「母集団に存在する属性の期待される割合(母比率)」に基づいて、最適な最小サンプルサイズを決定することができます。コクランの公式は以下の通りです。

$$n₀=\frac{z^2p(1-p)}{E^2}$$

  • z = 目的の信頼水準に基づくz表のZ値(zスコア)
  • p = 母集団における属性の期待される割合(母比率)
  • E = 許容誤差

例1

カナダの大学(学部課程)に在籍する留学生について調査を行うと仮定します。初期段階では詳細な情報がないため、留学生がカナダの全学部生の60%を占めると仮定します。つまり、母集団における属性の推定割合(母比率)は「60%」です。ここで「信頼水準95%」「許容誤差4%」で調査を行いたい場合、研究に必要な最小サンプルサイズは何人になるでしょうか?

$$(1-\alpha)=95\%$$

$$z_{α/2}=z_{{95\%}/2}=1.96$$

$$p=60\%$$

$$E=4\%$$

$$n₀=\frac{z²p(1-p)}{E²}=\frac{1.96²×60\%×(1-60\%)}{4\%²}=576.24≈577$$

計算の結果、95%の信頼水準と4%の許容誤差を達成するには、最低でも「577人」の学生を調査対象に含める必要があることがわかります。

上記の公式は、母集団のサイズが非常に大きい、あるいは無限である場合に使用されます。もし母集団のサイズが小さい、あるいは有限であることがわかっている場合は、サンプルサイズを調整する必要があります。この場合、以下の数式を用いてサンプルサイズの修正(有限母集団修正)を行います。

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}$$

  • n₀ = コクランの公式から計算された初期サンプルサイズ
  • N = 母集団のサイズ(総人口)
  • n = 有限母集団に対して調整された最終的なサンプルサイズ

例2

同じく、カナダの大学(学部課程)に在籍する留学生について、特定の大学内で調査を行うと仮定します。留学生が全学部生の60%を占める(母比率60%)と仮定します。今回調査する大学内の学生総数(母集団のサイズ)は「12,000人」であることがわかっています。「信頼水準95%」「許容誤差4%」の場合、最小サンプルサイズは何人になるでしょうか?

このケースでは、母集団が有限(12,000人)であるため、まずコクランの公式を使用して n₀ を計算し、その後サンプルサイズを調整(有限母集団修正)する必要があります。

$$n₀=\frac{z^2p(1-p)}{{E}^2}=\frac{1.96^2×{60\%}×(1-{60\%})}{{4\%}^2}=576.24$$

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}=\frac{576.24}{1+\left(\frac{576.24-1}{12,000}\right)}=549.88\approx550$$

結果として、最低でも「550人」の学生を調査する必要があることがわかります。

当サイトの最小サンプルサイズ計算機を活用すれば、このような複雑な計算も1秒足らずで正確に完了させることができます。

許容誤差を計算する公式

許容誤差(E)を求める公式は、最小サンプルサイズを求める公式を変形することで導き出すことができます。

まず、最小サンプルサイズの公式は以下の通りです。

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

この公式を、許容誤差(E)について解くように変形していきます。

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

$${n₀}×{E}^2=z^2p\left(1-p\right)$$

$$E^2=\frac{z^2p\left(1-p\right)}{n₀}$$

$$E=\sqrt{\frac{z^2p\left(1-p\right)}{n₀}}$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

例3

再びカナダの大学(学部課程)に在籍する留学生の調査を例に考えます。留学生が全学部生の60%を占める(母比率60%)と仮定します。今回は「95%の信頼水準」を維持しつつ、すでに「577人」の学生を調査対象(サンプルサイズ)として抽出したとします。この場合、研究の許容誤差はどのくらいになるでしょうか?

$$z_{95\%/2}=1.96$$

$$p=60\%$$

$$n₀=577$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n_0}}=1.96 \times \sqrt{\frac{60\% \times \left(1-60\%\right)}{577}}=4\%$$

計算の結果、許容誤差は「4%」となります。

もし母集団のサイズが有限である場合、許容誤差を求めるにはまず以下の数式を使用して n₀ を逆算する必要があります。

$$n₀=\frac{n-nN}{n-N}$$

その上で、算出された n₀ を用いて以下の公式に当てはめ、許容誤差を見つけます。

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

当サイトの計算機(2つ目のコンポーネント)を利用すれば、こうした複雑な手計算の手順をすべてスキップし、1秒未満で素早く正確な許容誤差を求めることができます。

信頼区間を計算する公式

許容誤差(誤差の幅)がわかっていれば、信頼区間を簡単に求めることができます。信頼区間の算出には、以下の公式を使用します。

信頼区間 = 点推定値 ± 許容誤差

信頼区間の上限 = 点推定値 + 許容誤差

信頼区間の下限 = 点推定値 - 許容誤差

母平均(μ)の信頼区間は、次のように表されます。

x̄ - E < μ < x̄ + E

(ここで、x̄ - E は下限値であり、x̄ + E は上限値です。)

母比率(P)の信頼区間は、次のように表されます。

p - E < P < p + E

例4

カナダで学ぶ留学生の「平均プログラム費用(学費)」について調査しているとします。1,000人の学生をサンプルとして抽出し、そのデータに基づいて「留学生の平均プログラム費用は 20,000 カナダドル(CAD)である」と推定しました(これが点推定値です)。また、この調査における許容誤差は 5,000 カナダドルであるとします。この場合、留学生の平均プログラム費用の信頼区間はどのように計算されるでしょうか?

上限値 = x̄ + E = 20,000 CAD + 5,000 CAD = 25,000 CAD

下限値 = x̄ - E = 20,000 CAD - 5,000 CAD = 15,000 CAD

したがって、この調査結果に基づく信頼区間は次のようになります。

x̄ - E < μ < x̄ + E

15,000 CAD < μ < 25,000 CAD