統計計算機
Z-スコア計算機


Z-スコア計算機

Zスコア(標準偏差値)や確率を素早く正確に計算できる便利な「Z-スコア計算機」。Zスコアと確率の変換、2点間の確率計算に対応しており、正規分布を用いた統計分析やZ検定に最適です。登録不要で今すぐ使えます。

結果
Zスコア 1
の確率 x<5 0.84134
の確率 x>5 0.15866
の確率 3<x<5 0.34134
結果
Zスコア 2
P(x<Z) 0.97725
P(x>Z) 0.02275
P(0<x<Z) 0.47725
P(-Z<x<Z) 0.9545
P(x<-Z or x>Z) 0.0455
結果
P(-1<x<0) 0.34134
P(x<-1 or x>0) 0.65866
P(x<-1) 0.15866
P(x>0) 0.5

計算にエラーがありました。

目次

  1. Zスコアとは?
  2. Zスコアの計算式(求め方)
    1. 母集団のZスコア
    2. 標本(サンプル)のZスコア
  3. 得られたZスコアの解釈
  4. Zスコアと標準偏差の関係
  5. Zスコアと正規分布
  6. Zスコアの活用例:データの比較
  7. データの標準化(正規化)
  8. 仮説検定
  9. 特徴量のスケーリング(標準化)
  10. 予測モデリング
  11. 標準正規分布表(Z値表)の使い方
  12. Zスコアから確率を求める方法と計算例
  13. 指定された確率から元のデータ値を求める(逆算)

Z-スコア計算機

当サイトのZスコア計算機は、Zスコア(標準スコア)に関するあらゆる計算に対応する便利なツールです。最初の計算機に「データ値(素点:X)」「平均値(μ)」「標準偏差(σ)」を入力するだけで、Zスコアだけでなく、計算のステップや関連する確率もすばやく求めることができます。

また、「Zスコア・確率コンバーター」を使えば、面倒な標準正規分布表(Z表)を参照することなく、Zスコアから確率への変換が簡単にできます。計算結果には、指定したZスコアに基づき得るすべての確率が含まれます。さらに、3つ目の計算機では、2つのZスコア間にある確率を正確に算出可能です。

Zスコアとは?

**Zスコア(Z値・標準スコア)**とは、あるデータポイントがデータセットの平均値から「標準偏差の何個分」離れているかを示す統計的な指標です。個々のデータを全体の分布と比較するために用いられ、データを標準化することで、異なるデータセット間の比較や分析を容易にします。

Zスコアを計算することで、特定のデータが全体と比較してどの程度「標準的(平均的)」なのか、あるいは「例外的」なのかを客観的に判断できます。

  • 外れ値の検出: Zスコアは、他のデータから大きく外れた異常値を特定するのに役立ちます。金融や医学研究など、外れ値が重要なパターンや異常を示す分野で非常に有用です。
  • 異なるデータセットの比較: 単位やスケール(範囲)が異なるデータ同士でも、Zスコアに変換すれば平等に比較できます。これは、機械学習など、さまざまなソースからデータを収集・比較してモデルを構築する分野で重要です。
  • データの正規化(標準化): Zスコアに変換することでデータが標準化され、比較・分析がスムーズになります。データの視覚化など、情報をわかりやすく提示する必要がある場面で役立ちます。

Zスコアの計算式(求め方)

母集団のZスコア

Z = (データ値 - 母平均) / 母標準偏差

Z = (X - μ) / σ

標本(サンプル)のZスコア

Z = (データ値 - 標本平均) / 標本標準偏差

Z = (X - x̄) / s

得られたZスコアの解釈

正のZスコア: 正のZスコアは、そのデータポイントが平均値を上回っていることを意味します。つまり、観測された値がデータセットの一般的な値よりも高いことを示しています。

負のZスコア: 負のZスコアは、そのデータポイントが平均値を下回っていることを意味します。つまり、観測された値がデータセットの一般的な値よりも低いことを示しています。

Zスコアの絶対値: Zスコアの値の大きさ(絶対値)は、データが平均値からどれだけ離れているかを示します。Zスコアの絶対値が大きいほど、そのデータポイントは平均から遠く離れていることになります。

Zスコアと標準偏差の関係

Zスコアの計算には標準偏差が直接用いられるため、両者は密接に関連しています。実際、標準偏差はZスコアの計算式における非常に重要な要素です。

標準偏差は、データセットの「ばらつき」を示す指標です。各データが平均値からどれほど散らばっているかを表し、標準偏差が大きいほどデータの分散も大きくなります。

一方、Zスコアは特定の1つのデータが、平均値から「標準偏差いくつ分」離れているかを示します。標準偏差を用いてZスコアを計算することで、単一のデータポイントを全体と比較し、それがどれほど例外的か、あるいは一般的かを見極めることができます。

Zスコアと正規分布

正規分布は、自然界や現実世界の多くの現象でよく見られる確率分布の一種です。

これは、平均値付近にデータが集中し、左右対称の釣鐘型(ベルカーブ)を描く分布を指します。数学者カール・フリードリッヒ・ガウスにちなんで「ガウス分布」とも呼ばれています。

Zスコアは、標準偏差を基準としてデータセットの平均から特定のデータがどれだけ離れているかを測定する方法です。各データをZスコアに変換することで、個々のデータポイントを全体と比較し、その特異性を評価できます。

Zスコアと正規分布の最大の関連性は、Zスコアを使用することで任意の正規分布データを「標準正規分布(平均0、標準偏差1)」に変換できる点にあります。多くの統計手法はデータが正規分布に従うことを前提としているため、この標準化を行うことで、より正確な分析が可能になります。

Zスコアの活用例:データの比較

Zスコアは、標準偏差を基準として、特定のデータが平均からどれだけ離れているかを把握し、異なるデータを比較するのに役立ちます。

Zスコアを用いたデータの比較は、金融の分野でよく活用されます。たとえば、2つの異なる株式ポートフォリオのパフォーマンスを比較したいとします。ポートフォリオAは平均リターンが10%で標準偏差が2%、ポートフォリオBは平均リターンが8%で標準偏差が3%だとします。リターンをZスコアに変換することで、異なるリスク(標準偏差)を持つポートフォリオのパフォーマンスを同じ基準で比較し、どちらが優れているかを客観的に判断できます。

スポーツの分野でも実用的な例があります。たとえば、バスケットボール選手Aと選手Bのパフォーマンスを比較したいとします。選手Aは1試合平均20得点で標準偏差が5得点、選手Bは1試合平均18得点で標準偏差が3得点です。得点をZスコアに変換することで、それぞれのばらつきを考慮しつつ、どちらの選手がより安定して優れたパフォーマンスを発揮しているかを比較できます。

データの標準化(正規化)

データの標準化(正規化)とは、異なるデータセットを同じスケール(基準)に変換し、比較や分析を容易にするプロセスです。データはそれぞれ異なる単位やスケールを持つため、そのままでは比較が困難ですが、標準化によって同じ土俵で評価できるようになります。

各データポイントをZスコアに変換することで、データは「平均0、標準偏差1」という共通のスケールに標準化されます。

心理学の例:2種類のIQテスト(テストA、テストB)の結果を比較するとします。テストAは平均100、標準偏差15。テストBは平均110、標準偏差10です。スコアをZスコアに変換することで、異なる基準のテスト結果を単一のスケールに落とし込み、公平な比較・分析が可能になります。

教育の例:学生Aと学生Bの成績を比較するとします。学生Aの平均成績は80点で標準偏差は5、学生Bの平均成績は90点で標準偏差は3です。成績をZスコア(偏差値の基礎)に変換することで、難易度やばらつきの異なるテストの成績をすべて同じ基準に揃え、適切な評価が行えます。

仮説検定

仮説検定は、帰無仮説を棄却するのに十分な証拠があるか、または2つの変数間に関係がないという仮定が正しいかを判断するための統計的手法です。医療研究、社会科学、ビジネスなど、データに基づいた意思決定が求められる多くの分野で不可欠です。

仮説検定を行う際、Zスコアを使用して特定の結果が生じる確率(p値)を求めることができます。たとえば、ある特定のグループの平均体重が、全体の平均体重と異なるかどうかを検定する場合、Zスコアを計算することで、その差が「統計的に有意」であるかを判断できます。

医療分野の例:新薬が特定の病気の症状を軽減する効果があるかをテストします。Zスコアを用いることで、新薬を投与したグループと対照群(プラセボ)の症状の差が統計的に有意かどうかを評価できます。

金融分野の例:特定の株式のリターンが市場平均よりも高いかどうかを検定します。Zスコアを活用することで、リターンの差が単なる偶然なのか、統計的に有意なものなのかを判断できます。

特徴量のスケーリング(標準化)

特徴量スケーリングは、機械学習やデータ分析において、データセット内のすべての特徴量(変数)を同じスケールに揃えるための重要な前処理手法です。多くの機械学習アルゴリズムはデータのスケールに敏感であり、スケールが揃っていないと不正確なモデルが生成される可能性があるため、この手順は欠かせません。

特徴量をスケーリングする一般的な方法の一つが、Zスコア正規化(標準化)です。このプロセスでは、各特徴量の平均が0、標準偏差が1になるようにデータを変換します。計算式は以下の通りです:

Z = (X - 平均) / 標準偏差

(ここで、Xは特徴量の値、平均はその特徴量の平均値、標準偏差はその特徴量の標準偏差です)

コンピュータビジョンの例:画像データを扱う際、ピクセル値を0から1の範囲にスケーリングすることが一般的です。Zスコア正規化を用いて、ピクセル値の分布を平均0・標準偏差1に変換することで、学習効率を高めることができます。

自然言語処理(NLP)の例:テキストデータを扱う際、TF-IDF(単語の出現頻度と逆文書頻度)の値をスケーリングすることがよくあります。ここでもZスコア正規化を適用し、特徴量の重みを適切に調整することが可能です。

予測モデリング

予測モデリングは、機械学習やデータ分析において、過去の履歴データに基づいて未来の出来事を予測する手法です。データセットを用いてモデルをトレーニングし、そのモデルを使って未知の新しいデータに対する予測を行います。

予測モデリングの重要なステップに「特徴量選択」があります。これは、モデルの予測精度を高めるために、データセットから最も関連性の高い特徴量を選び出すプロセスです。ターゲット変数との相関性が高い特徴量ほど、有用な予測因子となるため優先的に選択されます。

高いZスコアを持つデータはターゲット変数に大きな影響を与える可能性が高いため、Zスコアを使用して重要な特徴量を特定することができます。特徴量のZスコアを計算する式は以下の通りです:

Z = (X - 平均) / 標準偏差

金融分野の例:株価の予測において、過去のパフォーマンスのZスコアを算出し、将来のリターンを予測します。Zスコアが高い(過去の平均を大きく上回る)場合、その傾向を基に将来の価格上昇を予測する手がかりとなります。

ヘルスケア分野の例:患者の治療経過(転帰)を予測する際、検査値などのZスコアを使用します。Zスコアが異常に高い(または低い)場合は、患者の健康状態が平均から大きく逸脱していることを示しており、将来的なリスクが高いと予測することができます。

標準正規分布表(Z値表)の使い方

Z表は、標準正規分布表またはZ値表とも呼ばれ、特定のZスコアが標準正規分布の曲線においてどの確率(面積)に対応するかを示す標準化された表です。指定したデータが特定の範囲に収まる確率を計算するために使用されます。

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.0279 0.03188 0.03586
0.1 0.03983 0.0438 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0.3 0.11791 0.12172 0.12552 0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
0.4 0.15542 0.1591 0.16276 0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
0.5 0.19146 0.19497 0.19847 0.20194 0.2054 0.20884 0.21226 0.21566 0.21904 0.2224
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.2549
0.7 0.25804 0.26115 0.26424 0.2673 0.27035 0.27337 0.27637 0.27935 0.2823 0.28524
0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.3665 0.36864 0.37076 0.37286 0.37493 0.37698 0.379 0.381 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
1.3 0.4032 0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.4452 0.4463 0.44738 0.44845 0.4495 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.4608 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.4732 0.47381 0.47441 0.475 0.47558 0.47615 0.4767
2 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.4803 0.48077 0.48124 0.48169
2.1 0.48214 0.48257 0.483 0.48341 0.48382 0.48422 0.48461 0.485 0.48537 0.48574
2.2 0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.4884 0.4887 0.48899
2.3 0.48928 0.48956 0.48983 0.4901 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158
2.4 0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.4943 0.49446 0.49461 0.49477 0.49492 0.49506 0.4952
2.6 0.49534 0.49547 0.4956 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643
2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.4972 0.49728 0.49736
2.8 0.49744 0.49752 0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861
3 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.499
3.1 0.49903 0.49906 0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3.2 0.49931 0.49934 0.49936 0.49938 0.4994 0.49942 0.49944 0.49946 0.49948 0.4995
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.4996 0.49961 0.49962 0.49964 0.49965
3.4 0.49966 0.49968 0.49969 0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3.5 0.49977 0.49978 0.49978 0.49979 0.4998 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.4999 0.4999 0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
4 0.49997 0.49997 0.49997 0.49997 0.49997 0.49997 0.49998 0.49998 0.49998 0.49998

Z表(Z値表)を使用するには、計算したZスコアの「小数第1位」までに対応する行を左端から見つけ、次に「小数第2位」に対応する列を上端から見つけます。それらが交差するセルの値が、標準正規曲線の対象となる面積(確率)を表しています。

例として、Zスコアが「1.96」の場合、Z表の左端で「1.9」の行を探し、上端で「0.06」の列を探します。交差するセルの値は約「0.475」となります。これは、平均(中心)から1.96までの面積を示しており、累積確率(左端から1.96以下すべて)を求める場合は0.5を足して約0.975となります。つまり、全体の約97.5%のデータが1.96以下の領域に含まれることを意味します。

注意点として、Z表は平均が0、標準偏差が1の「標準正規分布」専用です。実際のデータがこの分布に従わない場合は、まずデータをZスコアに変換して標準化する必要があります。

Zスコアから確率を求める方法と計算例

正規分布に従う変数をZスコアに変換すると、Z表(標準正規分布表)を使用して正規曲線下の面積の割合(確率)を求めることができます。標準正規曲線の下の総面積は「1」です。したがって、特定の範囲の曲線下の面積は、その範囲にデータが含まれる確率と等しくなります。

例1

あるボクシング選手の体重は、平均75kg、標準偏差3kgで正規分布しているとします。ランダムに選ばれた選手の体重が以下の条件を満たす確率はどれくらいでしょうか?

  • a) 78 kg以上
  • b) 69 kg未満
  • c) 72 kg以上
  • d) 79.5 kg未満
  • e) 72 kgから76.5 kgの間
  • f) 72 kgから73.5 kgの間

a) ランダムに選ばれた選手の体重が78 kgを超える確率はどれくらいですか?

  • X > 78
  • μ = 75
  • σ = 3

$$P(X>78)=P\left(Z>\frac{X-μ}{σ}\right)=P\left(Z>\frac{78-75}{3}\right)=P(Z>1)$$

まず、これをZ曲線(正規分布曲線)で描画します。

 Zスコア計算機

次に、Z表を使用して、計算されたZスコアに関連する確率を見つけます。 ここでの説明は、「平均からZスコアまでの面積」を示すZ表を使用している前提です。グラフで強調表示された領域の確率を得るには、0.5からその確率を引く必要があります。(曲線下の合計面積は1であり、平均を境に左右対称に0.5ずつ分かれているためです)。

  • P (X > 78) = P (Z > 1)
  • P (X > 78) = 0.5 - P(0 < Z < 1)
  • P (X > 78) = 0.5 - 0.3413
  • P (X > 78) = 0.1587

したがって、ランダムに選ばれた選手の体重が78 kgを超える確率は「0.1587(15.87%)」です。

b) ランダムに選ばれた選手の体重が69 kg未満である確率はどれくらいですか?

  • X < 69
  • μ = 75
  • σ = 3

$$P(X<69)=P\left(Z>\frac{X-μ}{σ}\right)=P\left(Z>\frac{69-75}{3}\right)=P(Z<-2)$$

まず、これをZ曲線で描画します。

 Zスコア計算機

次に、Z表を使用して、計算されたZスコアに関連する確率を見つけます。 ここでも、平均からZスコアまでの面積を示すZ表を使用します。グラフで強調表示された領域(左側の裾)の確率を得るには、0.5から平均〜Z間の確率を引きます。

  • P (X < 69) = P (Z < -2)
  • P (X < 69) = 0.5 - P (0 > Z > -2)
  • P (X < 69) = 0.5 - 0.4772
  • P (X < 69) = 0.0228

したがって、ランダムに選ばれた選手の体重が69 kg未満である確率は「0.0228(2.28%)」です。

c) ランダムに選ばれた選手の体重が72 kgから76.5 kgの間である確率はどれくらいですか?

  • 72 < X < 76.5
  • μ = 75
  • σ = 3

$$P(72 \lt X \lt 76.5)=P\left(\frac{X-μ}{σ} \lt Z \lt \frac{X-μ}{σ}\right)=P\left(\frac{72-75}{3} \lt Z \lt \frac{76.5-75}{3}\right)=P(-1 \lt Z \lt 0.5)$$

まず、これをZ曲線で描画します。

 Zスコア計算機

次に、Z表を使用して、計算されたZスコアに関連する確率を見つけます。 平均(Z=0)をまたぐ範囲の確率を求めるため、グラフで強調表示された領域の確率を得るには、2つのZスコアの確率(平均からの面積)を足し合わせます。

  • P (72 < X < 76.5) = P (-1 < Z < 0.5)
  • P (72 < X < 76.5) = 0.3413 + 0.1915
  • P (72 < X < 76.5) = 0.5328

したがって、ランダムに選ばれた選手の体重が72 kgから76.5 kgの間である確率は「0.5328(53.28%)」です。 このような計算をすばやく正確に行うには、当サイトの「Zスコア計算機」を利用するのが非常に便利です。

指定された確率から元のデータ値を求める(逆算)

データが正規分布に従うことがわかっている場合、Zスコアを利用して、特定の確率(パーセンテージ)に対応する元のデータ値(X)を逆算することができます。

例 2

ある競争試験の受験者の点数はほぼ正規分布しており、平均点が55点、標準偏差が10点でした。上位30%の受験者がテストに合格した場合、合格最低点は何点になりますか?

解答

この場合、まず指定された確率(上位30%)に対応するZスコアを求める必要があります。

 Zスコア計算機

Zスコアを見つけるには、Z表に照らし合わせるための基準となる領域(平均からZスコアまでの面積)の確率を計算します。

右半分の全体の確率0.50から、上位の0.30を引きます。したがって、求める領域(平均からZスコアまで)の確率は「0.20」となります。

次に、Z表の中で「0.20」に最も近い確率を探します。対応するZスコアは「0.524」となります。 最後に、Zスコアの計算式を変形して、元のデータ値(X)を求めます。

  • Z = (X - μ) / σ
  • 0.524 = (X - 55) / 10
  • X = (0.524 × 10) + 55
  • X = 60.24

したがって、この試験の合格最低点は「60.24点」となります。