統計計算機
四分位数計算機


四分位数計算機

データの数値を入力するだけで、第1四分位数(Q1)、中央値(Q2)、第3四分位数(Q3)、四分位範囲(IQR)、最小値・最大値を瞬時に自動計算する無料ツールです。統計分析、箱ひげ図の作成、外れ値の確認など、データ分析にぜひご活用ください。

四分位統計
第一四分位 (Q1) 25
第二四分位 (Q2) 55
第三四分位 (Q3) 75
四分位範囲 (IQR) 50
中央値 = Q2 (x˜) 55
最小 10
最大 100
範囲 (R) 90

計算にエラーがありました。

目次

  1. 四分位数
  2. 四分位数の計算
  3. 四分位範囲
  4. 最小値と最大値
  5. セットの範囲
  6. 実社会での四分位数の活用例

四分位数計算機

四分位数計算機(Quartile Calculator)は、箱ひげ図の作成に必要な「5数要約」を求める際に非常に便利なツールです。この統計計算機を使用すると、指定したデータセットの第1四分位数(Q1)、第2四分位数(Q2、中央値)、第3四分位数(Q3)、最小値、および最大値を瞬時に計算できます。さらに、四分位範囲(IQR)やデータ全体の範囲(Range)も自動で算出します。 使い方は簡単で、データを直接入力するかコピー&ペーストして、「計算」ボタンをクリックするだけです。数値を入力する際は、必ずカンマ(,)またはスペースで区切ってください。

四分位数

四分位数は、統計学における位置の尺度(代表値)の一つです。データセット全体の中で、特定の値がどの位置にあるかを把握するのに役立ちます。

四分位数は、昇順(小さい順)に並べたデータを4つの等しいグループに分割するために使用されます。各グループには、同じ数のデータが含まれます。データセットに対して、以下の3つの四分位数を計算できます。

  • 第1四分位数 (Q1 または 下位四分位数)
  • 第2四分位数 (Q2 または 中央値)
  • 第3四分位数 (Q3 または 上位四分位数)

第1四分位数(Q1)は、昇順に並べたデータの下位25%と上位75%を分ける値です。つまり、Q1以下のデータが全体の25%、Q1以上のデータが全体の75%を占めます。これは、データセットの「25パーセンタイル」に相当します。

第2四分位数(Q2)は、昇順に並べたデータの下位50%と上位50%を分ける値です。つまり、Q2以下のデータが全体の50%、Q2以上のデータが全体の50%を占めます。第2四分位数は、データセットの「中央値」および「50パーセンタイル」と完全に一致します。

第3四分位数(Q3)は、昇順に並べたデータの下位75%と上位25%を分ける値です。つまり、Q3以下のデータが全体の75%、Q3以上のデータが全体の25%を占めます。これは、データセットの「75パーセンタイル」に相当します。

四分位数の計算

四分位数は、以下の手順で求めることができます。

  • データを昇順(小さい順)に並べ替えます。
  • データ全体の中央値を求めます。これが「第2四分位数(Q2)」です。
  • 第2四分位数より下半分にあるデータの中央値を求めます。これが「第1四分位数(Q1)」です。
  • 第2四分位数より上半分にあるデータの中央値を求めます。これが「第3四分位数(Q3)」です。

例 1

以下のデータセットは、大学を卒業したばかりの新卒会計士の初任給(ドル)を表しています。このデータから、初任給の中央値(Q2)、下位四分位数(Q1)、および上位四分位数(Q3)を求め、その結果を解釈してみましょう。

$55,000, $60,000, $52,000, $45,000, $74,000, $75,000, $48,000, $58,000, $72,000, $66,000, $45,000, $50,000, $54,000, $65,000, $71,000

解説

まず、データを昇順に並べ替えます。

$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000

次に、第2四分位数(中央値)の位置を求めます。

$$第2四分位数(Q2)=\left(\frac{N+1}{2}\right)番目の値=\left(\frac{15+1}{2}\right)番目の値=8^{th}item=58,000$$

続いて、Q2より下半分にあるデータの中央値を計算し、Q1を求めます。

$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000

第1四分位数 (Q1) = $50,000

最後に、Q2より上半分にあるデータの中央値を計算し、Q3を求めます。 $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000

第3四分位数 (Q3) = $71,000

得られた四分位数は、次のように解釈できます。

新卒の会計士のうち、25%は初任給が50,000ドル以下であり、上位25%は71,000ドル以上を得ています。また、50%は58,000ドル以上を得ており、残りの50%は58,000ドル以下であることがわかります。

上記の例から、データ数が奇数の場合、四分位数は元のデータセット内に存在する値になることがわかります。しかし、データ数が偶数の場合は、四分位数が元のデータセットに含まれない計算値となることがあります。これを理解するために、上記の例を少し修正してみましょう。

例 2

例1のデータセットに、もう1人分の給与データ($95,000)を追加したとします。この修正されたデータセットを用いて、初任給の中央値(Q2)、下位四分位数(Q1)、および上位四分位数(Q3)を求めます。

解説

まず、データを昇順に並べ替えます。

$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000, $95,000

次に、第2四分位数(中央値)の位置を求めます。

$$第2四分位数(Q2)=\left(\frac{N+1}{2}\right)番目の値=\left(\frac{16+1}{2}\right)番目の値=8.5\ 番目の値$$

$$第2四分位数(Q2)=\frac{8\ 番目の値+9\ 番目の値}{2}=\frac{58,000+60,000}{2}=59,000$$

次に、データセットをQ2を基準に2つのグループに分けます。Q2より下半分にあるデータの中央値を計算し、Q1を求めます。

$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000

第1四分位数 (Q1) = ($50,000 + $52,000)/2 = $51,000

最後に、Q2より上半分にあるデータの中央値を計算し、Q3を求めます。

$60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000, $95,000

第3四分位数 (Q3) = ($71,000 + $72,000)/2 = $71,500

四分位範囲

上位四分位数(Q3)と下位四分位数(Q1)の差は、「四分位範囲(IQR: Interquartile Range)」と呼ばれます。

  • 四分位範囲 (IQR) = 上位四分位数 - 下位四分位数
  • 四分位範囲 (IQR) = 第3四分位数 - 第1四分位数
  • 四分位範囲 (IQR) = Q3 - Q1

四分位範囲は、データセットの下位25%と上位25%を除外した部分の広がりを示します。つまり、データ全体の中央にある50%のデータのばらつきに焦点を当てています。四分位範囲の計算では、下位四分位数以下のデータと上位四分位数以上のデータが除外されるため、極端な値(極値)や外れ値の影響を受けにくくなります。これにより、通常の範囲(Range)計算が持つ「外れ値に弱い」という大きな欠点を補うことができます。

例 3

例1のデータの四分位範囲を求めます。

解説

例1の四分位数はすでに算出されています。

  • 第1四分位数 (Q1) = $50,000
  • 第2四分位数 (Q2) = $58,000
  • 第3四分位数 (Q3) = $71,000

これらの値を四分位範囲の公式に当てはめてみましょう。

四分位範囲 (IQR) = 第3四分位数 (Q3) - 第1四分位数 (Q1) = $71,000 - $50,000 = $21,000

例 4

例2のデータの四分位範囲を求めます。

解説

例2の四分位数はすでに算出されています。

  • 第1四分位数 (Q1) = $51,000
  • 第2四分位数 (Q2) = $59,000
  • 第3四分位数 (Q3) = $71,500

これらの値を四分位範囲の公式に当てはめてみましょう。

四分位範囲 (IQR) = 第3四分位数 (Q3) - 第1四分位数 (Q1) = $71,500 - $51,000 = $20,500

最小値と最大値

データセットの「最小値(Minimum)」とは、そのデータ群の中で最も小さい値のことです。データを昇順に並べ替えた際、先頭にくる値が最小値となります。

データセットの「最大値(Maximum)」とは、そのデータ群の中で最も大きい値のことです。データを昇順に並べ替えた際、最後にくる値が最大値となります。

最小値と最大値は、データセット全体の広がり(スケール)を把握するのに役立ちます。また、ばらつきを表す基本的な指標である「範囲(Range)」は、最小値と最大値を基に計算されます。

例 5

例1の新卒会計士の初任給データセットから、最小値と最大値を求めます。

解説

データセットを昇順に並べたものは以下の通りです。

$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000

最小の給与は、上記のデータ配列の最初の値です。したがって、 新卒会計士の最低初任給 = $45,000

最高の給与は、上記のデータ配列の最後の値です。したがって、 新卒会計士の最高初任給 = $75,000

例 6

例2の新卒会計士の初任給データセットから、最小値と最大値を求めます。

解説

データセットを昇順に並べたものは以下の通りです。 $45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000, $95,000

最小の給与は、上記のデータ配列の最初の値です。したがって、 新卒会計士の最低初任給 = $45,000

最高の給与は、上記のデータ配列の最後の値です。したがって、

新卒会計士の最高初任給 = $95,000

セットの範囲

統計学における「範囲(Range)」は、データセットのばらつき(分散)を示す最も基本的な指標です。これは、データセットの最大値と最小値の差として計算されます。

データセットの範囲 = 最大値 - 最小値

データセットの範囲 = 最大値 - 最小値

範囲は、データセットの両端(極値)間の距離、つまり全体の広がりを表します。これは、データのばらつきを大まかに把握するための尺度です。

ただし、範囲はデータセットの最大値と最小値の2つの極端な値のみに依存します。そのため、これらの極値に外れ値が含まれている場合、範囲は大きく歪み、誤った印象を与える可能性があります。

範囲はデータセット内のすべてのデータを考慮しているわけではないため、単独ではばらつきを正確に測る指標としては不十分と見なされることがよくあります。

例 7

例1の新卒会計士の初任給データセットから、全体の範囲を求めます。

解説

先に求めた通り、データセットの最小値と最大値は以下の通りです。

新卒会計士の最低初任給 = $45,000

新卒会計士の最高初任給 = $75,000

次に、これらの値を範囲の公式に当てはめます。

データセットの範囲 = 最大値 - 最小値 = $75,000 - $45,000 = $30,000

例 8

例2の新卒会計士の初任給データセットから、全体の範囲を求めます。

解説

先に求めた通り、データセットの最小値と最大値は以下の通りです。

新卒会計士の最低初任給 = $45,000

新卒会計士の最高初任給 = $95,000

次に、これらの値を範囲の公式に当てはめます。

データセットの範囲 = 最大値 - 最小値 = $95,000 - $45,000 = $50,000

実社会での四分位数の活用例

四分位数の計算は、データセットから極端な値(外れ値)を排除し、より正確なデータ分布を分析したい場合に非常に役立ちます。以下のリストは、四分位数が意思決定に活用されているいくつかの分野を示しています。

人事管理 - 企業の従業員の給与範囲(給与テーブル)を設定する際、給与の四分位数を分析します。これにより、研修生の極端に低い給与や、特殊なスキルや経験を持つ一部の従業員の非常に高い給与をデータから排除し、標準的な給与水準を正確に把握することができます。

財務・金融 - 毎月の支出計画を立てる際、過去の支出データの四分位数を計算し、コストがどのように分布しているかを把握します。これにより、極端な支出月に引きずられることなく、予算の過不足を防ぐことができます。

生産・運用管理 - 停電、ストライキ、または深刻な在庫切れの発生など、異常事態によって生じた極端なデータに影響されない「標準的な生産能力」の範囲を算出するのにも、四分位数が活用されます。

マーケティング - マーケターが市場における競合他社の価格帯を調査する際、製品価格の四分位数を算出します。これにより、極端に安い低品質な製品や、一部の超高級ブランドの価格設定を分析対象から除外し、現実的な市場価格の相場を捉えることが可能になります。