Статистические Калькуляторы
Калькулятор Z-оценки


Калькулятор Z-оценки

Точный онлайн-калькулятор Z-оценки. Быстро рассчитывайте стандартную оценку нормального распределения, переводите Z-оценку в вероятность и находите p-значение.

Результат
Z-значение 1
Вероятность x<5 0.84134
Вероятность x>5 0.15866
Вероятность 3<x<5 0.34134
Результат
Z-значение 2
P(x<Z) 0.97725
P(x>Z) 0.02275
P(0<x<Z) 0.47725
P(-Z<x<Z) 0.9545
P(x<-Z or x>Z) 0.0455
Результат
P(-1<x<0) 0.34134
P(x<-1 or x>0) 0.65866
P(x<-1) 0.15866
P(x>0) 0.5

Произошла ошибка при расчете.

Содержание

  1. Что такое Z-оценка?
  2. Формула Z-оценки
    1. Z-оценка для генеральной совокупности (популяции)
    2. Z-оценка для выборки
  3. Интерпретация полученных результатов Z-оценок
  4. Z-оценка и стандартное отклонение
  5. Z-оценка и нормальное распределение
  6. Применение Z-оценок
  7. Обнаружение выбросов
  8. Сравнение точек данных
  9. Нормализация данных
  10. Проверка гипотез
  11. Масштабирование признаков
  12. Прогностическое моделирование
  13. Использование таблицы Z-оценок
  14. Нахождение вероятности по Z-оценке
  15. Нахождение исходных значений по заданной вероятности

Калькулятор Z-оценки

Удобный онлайн-калькулятор Z-оценки (Z-score) предназначен для любых статистических расчетов, связанных со стандартизацией данных. Введя исходное значение (X), среднее значение генеральной совокупности (μ) и стандартное отклонение (σ) в первую форму калькулятора, вы получите пошаговый расчет Z-оценки и определите соответствующие вероятности для заданного значения.

Встроенный конвертер Z-оценок и вероятностей позволяет быстро переводить значения без необходимости вручную искать данные в таблице Z-оценок. Результаты включают все возможные варианты расчета вероятности для указанного значения. Кроме того, этот инструмент идеально подходит для вычисления вероятности нахождения значения между двумя заданными Z-оценками.

Что такое Z-оценка?

Z-оценка (стандартная оценка) — это статистическая метрика, показывающая, на сколько стандартных отклонений конкретное значение (точка данных) удалено от среднего значения всего набора данных. Расчет Z-оценки применяется для сравнения отдельного показателя с общей выборкой и помогает стандартизировать данные для их удобного сопоставления и глубокого анализа.

С помощью Z-оценки мы можем точно определить, насколько «типичным» или, наоборот, «аномальным» является конкретное значение на фоне всей совокупности.

Ценность Z-оценки заключается в том, что она дает ключ к пониманию структуры данных. Использование этого показателя позволяет:

  • Выявлять аномалии и выбросы: Z-оценки помогают находить точки данных, которые радикально отличаются от нормы. Это критически важно в таких сферах, как финансы, аналитика рисков и медицинские исследования, где аномалии могут указывать на скрытые закономерности или ошибки.
  • Сопоставлять данные из разных наборов: Стандартизация через Z-оценку дает возможность сравнивать выборки с разными единицами измерения или диапазонами. Это незаменимо в машинном обучении и Data Science, где модели строятся на разнородной информации.
  • Нормализовать данные: Преобразование метрик в Z-оценки приводит их к единой шкале, что упрощает статистический анализ и делает визуализацию данных более наглядной и понятной.

Формула Z-оценки

Z-оценка для генеральной совокупности (популяции)

Z = Исходное значение - Среднее значение генеральной совокупности / Стандартное отклонение генеральной совокупности

Z = (X - μ) / σ

Z-оценка для выборки

Z = Исходное значение - Среднее значение выборки / Стандартное отклонение выборки

Z = (X - x̄) / s

Интерпретация полученных результатов Z-оценок

Положительные Z-оценки: Значение больше нуля означает, что ваша точка данных находится выше среднего показателя по выборке. Иными словами, наблюдаемое значение превышает типичный уровень в данном наборе данных.

Отрицательные Z-оценки: Значение меньше нуля указывает на то, что точка данных находится ниже среднего. То есть ваш показатель меньше типичного значения.

Величина Z-оценки (модуль): Само число (без учета знака) показывает степень удаленности точки данных от среднего значения. Чем выше величина Z-оценки, тем дальше и «нетипичнее» наблюдаемый показатель по сравнению с нормой.

Z-оценка и стандартное отклонение

Z-оценка и стандартное отклонение (σ) неразрывно связаны, поскольку стандартное отклонение выступает ключевым компонентом формулы при расчете Z-оценки.

Стандартное отклонение — это мера разброса значений в наборе данных. Оно показывает, насколько сильно в среднем каждая точка данных отклоняется от математического ожидания (среднего значения). Чем выше стандартное отклонение, тем сильнее разбросаны данные.

Z-оценка, в свою очередь, выражает это отклонение конкретной точки в относительных единицах — в количестве стандартных отклонений. Благодаря этому мы можем абстрагироваться от абсолютных величин и понять, насколько уникальным или рядовым является конкретное значение.

Z-оценка и нормальное распределение

Нормальное распределение (или распределение Гаусса) — это фундаментальная концепция в статистике, описывающая распределение вероятностей, которое часто встречается в природе и обществе. На графике оно выглядит как симметричная колоколообразная кривая, где большинство значений группируется вокруг среднего, а частота экстремальных отклонений плавно стремится к нулю.

Z-оценка позволяет измерить позицию любого значения на этой кривой относительно среднего показателя, выражая дистанцию в стандартных отклонениях.

Связь между Z-оценкой и нормальным распределением состоит в том, что расчет Z-оценок используется для стандартизации любого нормального распределения, превращая его в стандартное нормальное распределение (где среднее равно 0, а стандартное отклонение равно 1). Это крайне полезно в статистическом анализе: поскольку многие параметрические методы требуют нормального распределения данных, стандартизация значений помогает применять эти алгоритмы с высокой точностью.

Применение Z-оценок

Обнаружение выбросов

Выброс — это значение, которое аномально сильно выделяется на фоне остальных данных выборки. Причиной выбросов могут быть ошибки при сборе и вводе информации или же объективные экстремальные явления.

Так как Z-оценка показывает удаленность точки от среднего в стандартных отклонениях, преобразование набора данных в Z-оценки является одним из самых надежных способов поиска аномалий.

На практике выбросы часто определяют с помощью фиксированного порога. Например, классическим правилом является порог в 3 стандартных отклонения. Любая точка данных, чья Z-оценка превышает 3 или меньше -3, классифицируется как выброс.

Еще один пример — производственный контроль качества. Допустим, средний вес выпускаемой детали составляет 10 унций со стандартным отклонением 0,5 унции. Деталь весом более 11 унций (Z-оценка = 2) или менее 9 унций (Z-оценка = -2) будет считаться браком или отклонением, требующим дополнительной проверки.

Сравнение точек данных

Z-оценка решает проблему сравнения «яблок с апельсинами», приводя разные метрики к общему знаменателю.

Рассмотрим пример из финансового сектора. Представьте, что вы инвестировали в два разных портфеля и хотите объективно оценить их эффективность. Средняя историческая доходность портфеля А составляет 10% (стандартное отклонение 2%), а портфеля Б — 8% (стандартное отклонение 3%). Переведя текущую доходность каждого портфеля в формат Z-оценок, вы сможете корректно сопоставить их результаты с учетом волатильности (риска) каждого актива.

В спортивной аналитике этот метод также популярен. Например, необходимо сравнить двух баскетболистов из разных лиг. Игрок А набирает в среднем 20 очков за матч (стандартное отклонение 5), а Игрок Б — 18 очков (стандартное отклонение 3). Рассчитав Z-оценки их текущих результатов, скауты могут математически точно определить, кто из спортсменов выступает стабильнее и эффективнее на фоне своих лиг.

Нормализация данных

Нормализация данных — это процесс приведения переменных к единой шкале для корректного машинного и статистического анализа. Исходные данные часто имеют разный масштаб (например, возраст в годах и доход в миллионах), что может исказить результаты исследований.

Конвертируя значения в Z-оценки, мы стандартизируем их. Полученная шкала всегда имеет среднее значение 0 и стандартное отклонение 1.

В психометрии это помогает сравнивать результаты разных тестирований. Например, кандидат прошел Тест А (средний балл 100, σ = 15) и Тест Б (средний балл 110, σ = 10). Прямое сравнение баллов некорректно, но преобразование их в Z-оценки покажет истинный уровень интеллекта кандидата относительно других участников в обоих тестах.

В сфере образования метод применяется для оценки успеваемости. У Студента А средний балл 80 (σ = 5) по одному предмету, а у Студента Б средний балл 90 (σ = 3) по другому. Z-оценка стандартизирует эти баллы, позволяя деканату честно определить лучшего студента потока.

Проверка гипотез

Проверка статистических гипотез — это метод анализа данных, помогающий решить, достаточно ли эмпирических доказательств для отклонения нулевой гипотезы (предположения об отсутствии связи или эффекта). Этот инструмент критически важен в доказательной медицине, маркетинге и науке о данных.

Z-критерий (Z-test) использует Z-оценки для расчета p-value и определения статистической значимости. Например, если нужно узнать, отличается ли средний рост определенной группы от роста всей популяции, Z-оценка покажет, является ли выявленная разница случайностью или закономерностью.

В клинических исследованиях Z-оценка помогает доказать эффективность нового препарата. Сравнивая показатели контрольной группы и группы, принимавшей лекарство, исследователи определяют статистическую значимость улучшений.

В трейдинге и инвестициях с помощью проверок гипотез на базе Z-оценок аналитики тестируют торговые стратегии, выясняя, действительно ли выбранная акция стабильно обгоняет среднюю доходность рынка, или же это лишь временная флуктуация.

Масштабирование признаков

В Data Science и машинном обучении (Machine Learning) масштабирование признаков (Feature Scaling) необходимо для того, чтобы алгоритмы не придавали избыточный вес переменным с большими абсолютными значениями. Алгоритмы, основанные на дистанции (например, K-means, SVM), очень чувствительны к масштабу данных.

Стандартизация на основе Z-оценки (Z-score normalization) центрирует данные вокруг нуля со стандартным отклонением, равным единице.

Формула масштабирования признака:

Z = (значение признака - среднее значение признака) / стандартное отклонение признака

В компьютерном зрении (Computer Vision) при обработке изображений значения пикселей часто масштабируются для ускорения сходимости нейронных сетей. Нормализация через Z-оценку эффективно приводит тензоры изображений к оптимальному для обучения виду.

В обработке естественного языка (NLP) при работе с матрицами TF-IDF (частота слова — обратная частота документа) стандартизация Z-оценок помогает алгоритмам лучше находить скрытые паттерны в текстовых корпусах.

Прогностическое моделирование

Прогностическое (предиктивное) моделирование использует исторические данные для предсказания будущих событий. Ключевым этапом здесь является Feature Selection — отбор признаков, оказывающих наибольшее влияние на целевую переменную.

С помощью Z-оценки можно выявлять признаки с высокой корреляцией. Экстремальные значения Z-оценок в обучающей выборке могут сигнализировать о наличии сильных предикторов.

Формула расчета:

Z = (значение признака - среднее значение признака) / стандартное отклонение признака

В алгоритмическом трейдинге исторические Z-оценки изменения цен или объема торгов служат мощными индикаторами. Высокая Z-оценка говорит о нетипичном поведении актива, что предиктивная модель может расценить как сигнал к скорому развороту тренда (mean reversion).

В здравоохранении и предиктивной медицине Z-оценки биомаркеров пациента (анализы крови, давление) используются для прогнозирования рисков. Если Z-оценка жизненно важного показателя сильно отклоняется от нормы, алгоритм помечает пациента как находящегося в группе высокого риска, требующего превентивного лечения.

Использование таблицы Z-оценок

Таблица Z-оценок (стандартная нормальная таблица) — это математический справочник, содержащий значения совокупной площади под стандартной нормальной кривой. Она позволяет найти вероятность того, что случайная величина примет значение меньше, больше или в диапазоне между рассчитанными Z-оценками.

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.0279 0.03188 0.03586
0.1 0.03983 0.0438 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0.3 0.11791 0.12172 0.12552 0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
0.4 0.15542 0.1591 0.16276 0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
0.5 0.19146 0.19497 0.19847 0.20194 0.2054 0.20884 0.21226 0.21566 0.21904 0.2224
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.2549
0.7 0.25804 0.26115 0.26424 0.2673 0.27035 0.27337 0.27637 0.27935 0.2823 0.28524
0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.3665 0.36864 0.37076 0.37286 0.37493 0.37698 0.379 0.381 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
1.3 0.4032 0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.4452 0.4463 0.44738 0.44845 0.4495 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.4608 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.4732 0.47381 0.47441 0.475 0.47558 0.47615 0.4767
2 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.4803 0.48077 0.48124 0.48169
2.1 0.48214 0.48257 0.483 0.48341 0.48382 0.48422 0.48461 0.485 0.48537 0.48574
2.2 0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.4884 0.4887 0.48899
2.3 0.48928 0.48956 0.48983 0.4901 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158
2.4 0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.4943 0.49446 0.49461 0.49477 0.49492 0.49506 0.4952
2.6 0.49534 0.49547 0.4956 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643
2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.4972 0.49728 0.49736
2.8 0.49744 0.49752 0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861
3 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.499
3.1 0.49903 0.49906 0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3.2 0.49931 0.49934 0.49936 0.49938 0.4994 0.49942 0.49944 0.49946 0.49948 0.4995
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.4996 0.49961 0.49962 0.49964 0.49965
3.4 0.49966 0.49968 0.49969 0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3.5 0.49977 0.49978 0.49978 0.49979 0.4998 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.4999 0.4999 0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
4 0.49997 0.49997 0.49997 0.49997 0.49997 0.49997 0.49998 0.49998 0.49998 0.49998

Чтобы воспользоваться Z-таблицей, сперва найдите строку, которая соответствует целой части и первой десятой доле вашей Z-оценки. Затем найдите столбец, соответствующий сотым долям. Пересечение строки и столбца покажет площадь (вероятность) под кривой стандартного нормального распределения (от нуля до Z). С помощью этого значения вы сможете вычислить итоговую вероятность наступления события.

Например, если ваша вычисленная Z-оценка равна 1,96, найдите строку 1.9 и столбец 0.06. Значение на пересечении (0,4750) — это площадь под кривой между средним значением и 1,96. Добавив 0,5 (левую половину распределения), вы получите примерно 0,975. Это означает, что 97,5% всех данных в этой нормальной выборке будут меньше или равны Z-оценке 1,96.

Обратите внимание: Z-таблица применима исключительно к стандартизированному нормальному распределению (где μ = 0 и σ = 1). Если ваши «сырые» данные не стандартизированы, их сперва необходимо перевести в Z-оценки.

Нахождение вероятности по Z-оценке

Преобразовав любую нормально распределенную переменную в Z-оценку, мы можем использовать таблицу Z-оценок для нахождения площади под колоколообразной кривой. Поскольку общая площадь под всей нормальной кривой всегда равна 1 (или 100%), любая доля этой площади отражает вероятность (P) для заданного диапазона значений.

Пример 1

Вес профессиональных боксеров нормально распределен со средним значением (μ) 75 кг и стандартным отклонением (σ) 3 кг. Какова вероятность того, что вес случайно выбранного спортсмена составит:

  • a) Больше 78 кг?
  • b) Меньше 69 кг?
  • c) Больше 72 кг?
  • d) Менее 79,5 кг?
  • e) От 72 до 76,5 кг?
  • f) От 72 кг до 73,5 кг?

a) Какова вероятность того, что вес случайно выбранного боксера больше 78 кг?

  • X > 78
  • μ = 75
  • σ = 3

$$P(X>78)=P\left(Z>\frac{X-μ}{σ}\right)=P\left(Z>\frac{78-75}{3}\right)=P(Z>1)$$

Отобразим это графически на Z-кривой:

Z-score-calculator

Используя таблицу выше, найдем вероятность, соответствующую Z-оценке = 1.

Важный момент: данная Z-таблица показывает вероятность нахождения значения строго между центром (0) и самой Z-оценкой. Поскольку весь правый «хвост» графика (от 0 до бесконечности) равен 0,5, то для нахождения вероятности закрашенной области справа от Z-оценки нужно вычесть табличное значение из 0,5.

  • P (X > 78) = P (Z > 1)
  • P (X > 78) = 0,5 - P(0 < Z < 1)
  • P (X > 78) = 0,5 - 0,3413
  • P (X > 78) = 0,1587

Вероятность того, что случайно выбранный боксер весит больше 78 кг, составляет 0,1587 (или 15,87%).

b) Какова вероятность того, что вес случайно выбранного боксера меньше 69 кг?

  • X < 69
  • μ = 75
  • σ = 3

$$P(X<69)=P\left(Z>\frac{X-μ}{σ}\right)=P\left(Z>\frac{69-75}{3}\right)=P(Z<-2)$$

Отобразим это на графике:

Z-score-calculator

Снова обращаемся к Z-таблице. Нормальное распределение симметрично, поэтому площадь от 0 до -2 равна площади от 0 до 2.

Чтобы найти вероятность закрашенного левого «хвоста», мы также вычитаем табличное значение из 0,5 (так как площадь всей левой половины равна 0,5).

  • P (X < 69) = P (Z < -2)
  • P (X < 69) = 0,5 - P (0 > Z > -2)
  • P (X < 69) = 0,5 - 0,4772
  • P (X < 69) = 0,0228

Таким образом, вероятность встретить боксера весом менее 69 кг равна всего 0,0228 (2,28%).

с) Какова вероятность того, что вес случайно выбранного боксера находится в диапазоне между 72 кг и 76,5 кг?

  • 72 < X < 76,5
  • μ = 75
  • σ = 3

$$P(72 \lt X \lt 76,5)=P\left(\frac{X-μ}{σ} \lt Z \lt \frac{X-μ}{σ}\right)=P\left(\frac{72-75}{3} \lt Z \lt \frac{76,5-75}{3}\right)=P(-1 \lt Z \lt 0,5)$$

Визуализируем область на графике:

Z-score-calculator

Находим табличные вероятности для обеих Z-оценкок (для Z=1 и Z=0.5).

Так как искомый диапазон пересекает нулевую ось, нам нужно просто сложить площади обеих частей, чтобы получить общую вероятность закрашенной зоны.

  • P (72 < X < 76,5) = P (-1 < Z < 0,5)
  • P (72 < X < 76,5) = 0,3413 + 0,1915
  • P (72 < X < 76,5) = 0,5328

Вероятность того, что вес боксера находится в пределах от 72 кг до 76,5 кг, составляет 0,5328 (53,28%).

Совет: Чтобы мгновенно получать результаты, просто используйте наш калькулятор «Вероятность между двумя Z-оценками».

Нахождение исходных значений по заданной вероятности

Если распределение выборки нормальное, мы можем решать и обратную задачу: вычислять конкретные (исходные) показатели (X) на основе известной вероятности, применяя обратный расчет Z-оценки.

Пример 2

Баллы абитуриентов на вступительном экзамене распределены нормально со средним значением 55 и стандартным отклонением 10. По правилам университета, только 30% лучших претендентов успешно сдают тест. Найдите минимальный проходной балл для зачисления.

Решение

Сначала нам нужно выяснить, какая Z-оценка соответствует границе лучших 30% результатов.

Z-score-calculator

На графике 30% лучших — это правый «хвост» (площадь 0,30). Поскольку вся правая половина графика равна 0,50, площадь от центра до искомой Z-оценки составит: 0,50 - 0,30 = 0,20.

Теперь мы ищем внутри таблицы Z-оценок значение вероятности, максимально близкое к 0,20. Ближайшее табличное значение (0,2019) соответствует Z-оценке 0,52 (или 0,524 при более точном расчете).

Зная Z-оценку, мы можем найти минимальный балл (X), подставив известные данные в формулу:

  • Z = (X - μ)/σ
  • 0,524 = (X - 55)/10
  • X = (0,524 × 10) + 55
  • X = 60,24

Следовательно, минимальный проходной балл, который позволит абитуриенту оказаться в числе 30% лучших, составляет 60,24.