Результатов не найдено
Мы не можем найти ничего по этому запросу сейчас, попробуйте поискать что-то другое.
Если задан дискретный набор данных, представляющий выборку или генеральную совокупность, калькулятор рассчитывает среднее значение, дисперсию и стандартное отклонение и отображает рабочий процесс, задействованный в расчете.
Выборка | Население | |
---|---|---|
Дисперсия | σ2 = 28.5 | s2 = 24.9375 |
Стандартное отклонение | σ = 5.3385 | s = 4.9937 |
Количество | n = 8 | n = 8 |
Среднее | μ = 18.25 | x̄ = 18.25 |
Сумма квадратов | SS = 199.5 | SS = 199.5 |
Произошла ошибка при расчете.
Одним из фундаментальных аспектов статистического вывода по заданному набору данных является измерение метрики, характеризующей изменчивость данных по сравнению с их средним значением.
Изменчивость, как правило, измеряется в статистике следующими метриками:
Этот калькулятор вычисляет дисперсию заданного набора данных и отображает рабочий процесс, задействованный в вычислении.
Калькулятор дисперсии принимает входные данные в виде списка чисел, разделенных разделителем. Несколько примеров возможного ввода показаны в таблице ниже.
строчный ввод | колоночный ввод | колоночный ввод | колоночный ввод |
---|---|---|---|
44, 63, 72, 75, 80, 86, 87, 89 | 44 | 44, | 44,63,72 |
44 63 72 75 80 86 87 89 | 63 | 63, | 75,80 |
44,, 63,, 72, 75, 80, 86, 87, 89 | 72 | 72, | 86,87 |
44 63 72 75, 80, 86, 87, 89 | 75 | 75, | 89 |
44; 63; 72, 75,, 80, 86, 87, 89 | 80 | 80, | |
44,,, 63,, 72, 75, 80, 86, 87, 89 | 86 | 86, | |
44 63,, 72,,,, 75, 80, 86, 87, 89 | 87 | 87, | |
89 | 89, |
Числа могут быть разделены запятой, пробелом, переводом строки или сочетанием нескольких типов разделителей. Вы можете использовать формат строки или столбца. Для всех форматов, приведенных в таблице выше, калькулятор обрабатывает вводимые данные как 44, 63, 72, 75, 80, 86, 87, 89.
После ввода данных вы можете выбрать, будут ли это данные выборки или данные генеральной совокупности. После нажатия кнопки вычислить калькулятор отображает пять статистических параметров набора данных: количество наблюдений, среднее значение, сумму квадратов отклонений, дисперсию и стандартное отклонение.
Для получения хорошей статистики при проведении выводов требуется большой набор данных. Часто бывает трудно получить данные о генеральной совокупности, представляющие все возможные наблюдения в эксперименте при заданных условиях. Как правило, из генеральной совокупности берется "выборка"; выводы о генеральной совокупности обычно делаются на основе выборки.
Дисперсия измеряет среднюю дисперсию набора данных относительно среднего значения. Она часто обозначается через σ² для генеральной совокупности и через s² для выборки. Большее значение σ² или s² подразумевает больший разброс точек данных от среднего значения выборки, и наоборот.
Рассмотрим следующие примеры наборов данных.
(Набор I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,
(Набор II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20
Вводя Набор I в калькулятор дисперсии мы получаем:
n=11
x̄=16
SS=704
s²=70,4
s=8,39
для выборки, и
n=11
μ=16
SS=704
σ²=64
σ=8
Для генеральной совокупности.
Вводя Набор II в калькулятор дисперсии мы получаем:
n=11
x̄=16
SS=56
s²=5,6
s=2,36
для выборки, и
n=11
μ=16
SS=56
σ²=5,09
σ=2,25
Для генеральной совокупности.
s²=70,4
σ²=64
s²=5,6
σ²=5,09
Генеральная совокупность в статистике относится ко всем возможным наблюдениям в эксперименте. Для N наблюдений дисперсия генеральной совокупности составляет:
$$\sigma^2=\frac{\sum_{i}^{N}{{(X_i-\ \mu)}^2\ }}{N}$$
где
Дисперсия выборки определяется как
$$s^2=\frac{\sum_{i}^{N}{{(X_i-\ \bar{X})}^2\ }}{n-1}$$
где
В расчете дисперсии участвуют следующие шаги.
Шаг 1: Рассчитайте среднее значение выборки/генеральной совокупности (популяции). Это сумма всех точек данных, деленная на количество точек данных (n для выборки и N для генеральной совокупности), т.е.,
Среднее выборки:
$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$
Среднее генеральной совокупности:
$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$
Шаг 2: Рассчитайте отклонения, вычитая среднее значение выборки/генеральной совокупности из каждой точки данных, т.е.,
Отклонения выборки:
$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), ..., (x_n-\bar{x})$$
Отклонения генеральной совокупности:
$$(x_1-\mu), (x_2-\mu), (x_3-\mu), ..., (x_N-\mu)$$
Шаг 3: Рассчитайте квадраты отклонений для каждой точки данных.
Квадраты отклонений выборки:
$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, ..., (x_n-\bar{x})^2$$
Квадраты отклонений генеральной совокупности:
$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, ..., (x_N-\mu)^2$$
Шаг 4: Рассчитайте сумму квадратов отклонений.
Сумма квадратов отклонений выборки:
$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$
Сумма квадратов отклонений генеральной совокупности:
$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$
Шаг 5: Разделите сумму квадратов отклонений на n-1 для выборки и на N для генеральной совокупности для расчета дисперсии.
Дисперсия выборки:
$$s^2=\frac{SS}{n-1}$$
Дисперсия генеральной совокупности:
$$\sigma^2=\frac{SS}{N}$$
Рассмотрим следующий набор данных: 1, 2, 4, 5, 6 и 12. Для расчёта дисперсии выборки выполним следующие шаги:
Шаг 1: Вычисляем среднее значение выборки (среднее арифметическое).
$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$
Шаг 2: Вычисляем отклонения от среднего для каждой точки данных.
x₁-x̄ | x₂-x̄ | x₃-x̄ | x₄-x̄ | x₅-x̄ | x₆-x̄ |
---|---|---|---|---|---|
1 - 5 | 2 - 5 | 4 - 5 | 5 - 5 | 6 - 5 | 12 - 5 |
-4 | -3 | -1 | 0 | 1 | 7 |
Шаг 3: Вычисляем квадраты отклонений.
(x₁-x̄)² | (x₂-x̄)² | (x₃-x̄)² | (x₄-x̄)² | (x₅-x̄)² | (x₆-x̄)² |
---|---|---|---|---|---|
16 | 9 | 1 | 0 | 1 | 49 |
Шаг 4: Суммируем квадраты отклонений.
$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$
Шаг 5: Вычисляем дисперсию выборки, разделив сумму квадратов отклонений на число степеней свободы (n-1).
$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$
Для генеральной совокупности мы бы разделили на n (общее количество точек данных), а не на n-1, чтобы вычислить дисперсию генеральной совокупности.
Дисперсия используется в инвестировании. Она помогает управляющим активами улучшить показатели эффективности инвестиций. Финансовые аналитики могут использовать дисперсию для оценки индивидуальных показателей компонентов инвестиционного портфеля.
Инвесторы рассчитывают дисперсию при рассмотрении новой покупки, чтобы решить, стоит ли инвестиция риска. Дисперсия помогает аналитикам определить меру неопределенности, которую трудно оценить количественно без дисперсии и стандартного отклонения.
Неопределенность не поддается прямому измерению. Но дисперсия и стандартное отклонение (квадратный корень из дисперсии) помогают определить предполагаемое влияние конкретной акции на портфель.
Ученые, статистики, математики и аналитики данных также могут использовать дисперсию. Она помогает получить полезную информацию об эксперименте или выборочной совокупности.
Ученые могут искать различия между тестовыми группами, чтобы определить, достаточно ли они похожи, чтобы успешно проверить гипотезу. Чем выше дисперсия набора данных, тем больше разброс значений в наборе данных. Исследователи данных могут использовать эту информацию, чтобы понять, насколько хорошо среднее значение отражает набор.
Недостатком использования дисперсии является то, что большие выбросы в наборе могут привести к некоторому искажению данных. Это происходит потому, что выбросы могут еще больше увеличить свой вес после возведения в квадрат.
Многие исследователи предпочитают работать со стандартным отклонением, которое рассчитывается как квадратный корень из дисперсии. На стандартное отклонение меньше влияют выбросы, оно меньше и его легче интерпретировать.