結果が見つかりません
現在、その用語では何も見つかりません。他の検索を試してください。
データの平均(算術平均)、中央値、最頻値(モード)、範囲をすばやく正確に計算できる無料の統計ツールです。データ分析や数学の学習に最適です。使い方や計算式も詳しく解説しています。今すぐ数値を入力して結果を確認しましょう!
| 結果 | |||
|---|---|---|---|
| 平均(平均) | 28.7 | 最大 | 48 |
| 中央値 | 13.5 | 最小 | 12 |
| 範囲 | 36 | 合計 | 287 |
| 最頻値 | 15、38はそれぞれ2回表示されました | カウント | 10 |
| 幾何平均 | 25.88779096735222 | ||
0
1
2
3
4
5
計算にエラーがありました。
平均・中央値・最頻値・範囲計算機(Mean Median Mode and Range Calculator)を使用すると、データセットの平均値(Mean)、中央値(Median)、最頻値(Mode)、および範囲(Range)を同時に簡単に求めることができます。対象となる生データを入力するか、コピーして入力ボックスに貼り付けるだけです。数値を区切る際は、必ずカンマ(,)を使用してください。入力が完了したら「計算」ボタンをクリックします。
すぐに結果が表示されます。当サイトの平均・中央値・最頻値・範囲計算機は、これらの基本的な統計量だけでなく、幾何平均(Geometric Mean)、最大値(Maximum)と最小値(Minimum)、合計(Sum)、データ数(Count)も自動的に計算し、昇順に並べ替えられたデータセットとともに結果を出力します。
平均値、中央値、最頻値を求める計算機を使用すれば、データセット全体の傾向を示す代表値を簡単に見つけることができます。また、範囲計算機はデータの散らばり具合(広がり)を把握するのに役立ちます。それでは、これらの統計指標が何を意味するのか、詳しく解説していきましょう。
平均(算術平均)とは、データセット内のすべての値を均した値のことです。つまり、データセットに含まれるすべての数値の合計を、データの総数(要素数)で割ったものを指します。統計学において、母集団の平均は「μ(ミュー)」、標本(サンプル)の平均は「x̄(エックスバー)」で表されます。
母集団の平均は、以下の数式を使用して計算できます。
$$\mu=\frac{データセットの値の総和}{母集団に含まれるデータ値の総数}=\frac{ΣX}{N}$$
標本の平均は、以下の数式を使用して計算できます。 $$\bar{X}=\frac{データセットの値の総和}{サンプルに含まれるデータ値の総数}=\frac{ΣX}{n}$$
具体的な例を用いて、平均の求め方を確認してみましょう。
ある大学のバスケットボール選手の身長(メートル)が以下の通りであるとします。このチームの平均身長はどれくらいでしょうか?
1.75 m, 1.96 m, 1.95 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
解答:
$$平均身長=\frac{\sum{}{}X}{N}=\frac{1.75\ m+1.96\ m+1.95\ m+2.00\ m+2.05\ m+2.05\ m+2.10\ m}{7}=\frac{13.86\ m}{7}=1.98\ m$$
このように、平均値はデータセット内のすべての数値を使用して計算されるため、データ全体の傾向を把握するための代表値として広く用いられます。
当サイトの平均計算ツールを使用すると、上記の算術平均だけでなく、データセットの「幾何平均(Geometric Mean)」も求めることができます。データセットに含まれるn個の数値の積に対するn乗根(累乗根)を幾何平均と呼びます。
$$幾何平均=\sqrt[n]{x₁ × x₂ × x₃ × \cdots × xₙ}$$
先ほどのバスケットボール選手の身長データを用いて、幾何平均を求めてみましょう。
$$幾何平均=\sqrt[7]{1.75×1.96×1.95×2.00×2.05×2.05×2.10}=\sqrt[7]{118.0554}=1.977$$
すべての数値が0以上の正の数である場合、幾何平均は常に算術平均以下の値になります。
今回の例でも、以下の通り成り立っています。
$$幾何平均 < 算術平均$$
$$1.977<1.98$$
中央値とは、データを昇順(小さい順)または降順(大きい順)に並べ替えたときに、ちょうど真ん中にくる値(中心点)のことです。中央値はデータセットをちょうど半分の2つのグループに分割します。
$$中央値=第\ \left(\frac{N+1}{2}\right)\ 番目の値$$
データの総数が「奇数」の場合、並べ替えたデータセットのちょうど真ん中にある値が中央値になります。当サイトの計算機は、このデータの並べ替えも自動で行うため便利です。一方、データの総数が「偶数」の場合、中央に位置する2つの値の平均が中央値となります。
先ほどのバスケットボール選手の例で中央値を求めてみましょう。
まず、データセットを昇順(小さい順)に並べ替えます。
1.75 m, 1.95 m, 1.96 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
次に、中心点(真ん中の値)を見つけます。 $$中央値=第\ \left(\frac{N+1}{2}\right)\ 番目の値=第\ \left(\frac{7+1}{2}\right)\ 番目の値=第\ 4\ 番目の値$$
並べ替えたデータセットの4番目の値は 2.00 m です。したがって、
中央値 = 2.00 m
ここで、バスケットボールチームに身長 1.90 m の新しい選手が加わったと想像してください。このとき、チームの身長の中央値はどのように変わるでしょうか?
現在の選手の身長データは以下の通りです。
1.75 m, 1.96 m, 1.95 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m, 1.90 m
先ほどと同様に、まずデータを昇順に並べ替えます。
1.75 m, 1.90 m, 1.95 m, 1.96 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
続いて、中心点を見つけます。 $$中央値=第\ \left(\frac{N+1}{2}\right)\ 番目の値=第\ \left(\frac{8+1}{2}\right)\ 番目の値=第\ 4.5\ 番目の値$$
選手の数が偶数(8人)になったため、中央に位置する2つの値の平均を求める必要があります。この例では、4番目と5番目の値の平均が中央値となります。
したがって、以下のようになります。
$$中央値=\frac{1.96\ m+2.00\ m}{2}=1.98\ m$$
中央値は、データセット内に極端な値(外れ値)が存在する場合に、データの中心傾向を把握する指標として非常に役立ちます。中央値は単純に真ん中の値だけを基準とするため、データ内の極端に大きい数値や小さい数値の影響を受けません。
特にデータセットに外れ値が含まれる場合、中央値は非常に「頑健(ロバスト)な代表値」として機能します。前述の通り、中央値の決定には極端な値が影響しないため、データの一般的な基準点を正確に提供してくれます。ただし、平均値のようにデータセット内のすべての値を計算に含めているわけではない点には注意が必要です。
最頻値(モード)とは、データセットの中で最も一般的に出現する値のことです。つまり、データの中で「最も頻繁に現れる数値」が最頻値となります。
それでは、先ほどのバスケットボール選手の身長データから最頻値を求めてみましょう。
データを確認すると、2.05 m以外の身長はすべて1回ずつしか登場していません。しかし、身長 2.05 m の選手だけはチームに2人います。したがって、この例において最も頻繁に出現する値は 2.05 m となります。
最頻値 = 2.05 m
このように、データセット内に最頻値が1つだけ存在する場合、そのデータセットは「単峰性(ユニモーダル)」と呼ばれます。データセットによっては、最頻値が複数存在することもあります。最頻値が2つある場合は「二峰性(バイモーダル)」、3つ以上ある場合は「多峰性(マルチモーダル)」と呼ばれます。また、すべての数値が1回ずつしか出現しないデータセットの場合、「最頻値は存在しない(モードなし)」となる点も覚えておきましょう。
最頻値は複雑な計算を行うことなく、データを見るだけで簡単に見つけることができます。しかし、平均値のようにデータ内のすべての数値を計算に加味しているわけではないため、全体の傾向を正確に表すとは限らないことに注意が必要です。
範囲(レンジ)とは、データセット内の「最大値」と「最小値」の差を指します。これは、データの散らばり具合(広がり)を把握するために計算できる最もシンプルな指標です。
範囲 = 最大値 - 最小値
先ほどの例を用いて、範囲の求め方を確認しましょう。
範囲を計算するには、まずデータセットの中から最大値と最小値を特定する必要があります。データが順序立てて並んでいない場合は、当サイトの範囲計算機を利用すれば、最大値と最小値を即座に見つけることができます。
最大値と最小値が特定できたら、その2つの数値の差を計算します。
最大値 = 2.10 m
最小値 = 1.75 m
したがって、 範囲 = 2.10 m - 1.75 m = 0.35 m
範囲は両端の極端な値(最大値と最小値)のみを考慮し、それ以外のすべてのデータを無視して計算されるため、外れ値によるバイアスやデータの歪みの影響を非常に受けやすい指標である点に留意してください。