Статистические Калькуляторы
Калькулятор размера выборки


Калькулятор размера выборки

Этот калькулятор размера выборки позволяет рассчитать минимальный размер выборки и предел погрешности. Узнайте о размере выборки, пределе погрешности и доверительном интервале.

Размер выборки

385

Погрешность

9.8%

Произошла ошибка при расчете.

Содержание

  1. Выборка
  2. Предел погрешности
  3. Доверительный интервал
  4. Взаимосвязь между выборкой, пределом погрешности и доверительным интервалом
  5. Формула для расчета размера выборки
  6. Пример 1
  7. Пример 2
  8. Пример 3
  9. Формула для расчета доверительного интервала
  10. Пример 4

Калькулятор размера выборки

Калькулятор расчета размера выборки состоит из двух компонентов. Первый компонент - это расчет объема выборки, а второй - определение предела погрешности.

Выбор доверительного уровня из выпадающего списка - это первый шаг в определении размера выборки. Вставьте относительную погрешность. Предел погрешности можно перевести из абсолютного в относительное выражение, разделив абсолютное значение на точечную оценку.

Затем, если вы знаете пропорцию населения, введите ее. В противном случае оставьте 50%. Введите численность населения в последнюю ячейку, если она вам известна; в противном случае оставьте ее пустой. И нажмите кнопку "Рассчитать".

Используйте второй компонент калькулятора, чтобы получить предел погрешности. В качестве первого шага выберите уровень доверия из выпадающего меню. Во второй ячейке введите размер выборки вашего исследования. Затем введите долю населения. Введите размер популяции в последнюю ячейку. Если вы не знаете размер популяции, оставьте эту ячейку пустой. И наконец, нажмите кнопку "Рассчитать".

Выборка

Часть генеральной совокупности населения называется выборкой. Под генеральной совокупностью или популяцией понимаются все элементы, представляющие интерес в конкретном исследовании. Изучение каждого элемента популяции выбранного вами исследования - идеальный способ изучения генеральной совокупности. Однако в силу многих факторов часто бывает нецелесообразно изучать каждый элемент популяции. Например, если ваше исследование посвящено насекомым в джунглях, то популяция неограниченна. Поэтому вы не можете изучить всю популяцию. А иногда при тестировании объекты вашего исследования могут уничтожиться или повредиться.

Например, когда вы открываете бутылку напитка и проверяете этот напиток, вы не можете отправить эту бутылку обратно на прилавок.

Вам потребуется много времени, денег и других ресурсов, чтобы обследовать всю популяцию. В большинстве случаев вы должны завершить исследование, имея ограниченное время, деньги и другие ресурсы. Исследование всей популяции в большинстве случаев нецелесообразно. Решение состоит в том, чтобы определить выборку и провести исследование.

Предел погрешности

В большинстве случаев мы не можем исследовать все компоненты популяции. Поэтому статистики выборки (показатели, рассчитанные по выборке) часто используются для оценки параметров популяции (показателей, рассчитанных по популяции). Выборочная статистика выводится из фактических данных, наблюдаемых или измеренных на выборке. Такая оценика одного числа для изучения параметра популяции называется точечной оценкой.

Например, если вы хотите оценить средний объем бутылки напитка на производственной линии, вы можете выбрать случайную партию и найти средний объем этой партии. Представим, что партия имеет средний объем x̄ 250 мл. Таким образом, вы оцениваете, что каждая бутылка на производственной линии имеет средний объем \$(\hat{μ})\$ в 250 мл.

На практике фактический параметр и оценочный параметр не равны. Разница возникает в результате оценки параметра по выборке, а не по всей совокупности.

Предел погрешности определяется как максимально вероятная разница между точечной оценкой параметра и его фактическим значением. Это часто называют максимальной ошибкой оценки.

Доверительный интервал

Доверительный интервал представляет собой диапазон оценок. Доверительный интервал предполагает, что параметр оценивался в пределах определенной погрешности. Чтобы определить нижнюю границу доверительного интервала, из точечной оценки вычитается предел погрешности. Чтобы определить верхнюю границу доверительного интервала, предел ошибки прибавляется к точечной оценке.

Взаимосвязь между выборкой, пределом погрешности и доверительным интервалом

Вместо того чтобы исследовать всю популяцию, мы изучаем выборку. И уже по этой выборке оцениваем всю популяцию. Следовательно, может существовать разница между оцененным параметром популяции и фактическим параметром популяции. Предел ошибки - это максимально вероятная разница между точечной оценкой параметра и его фактическим значением. Есть обратная связь между размером выборки и пределом погрешности. Увеличение объема выборки приводит к более точному представлению популяции, что снижает предел погрешности. Аналогично, уменьшение размера выборки увеличивает предел погрешности.

Доверительный интервал можно получить, если применить предел погрешности к точечной оценке.

Формула для расчета размера выборки

Для расчета объема выборки существуют различные формулы в зависимости от имеющейся у вас информации.

Доверительный интервал определяет степень точности, а максимальный диапазон на границе ошибки определяет степень точности, которой мы хотим достичь при оценке диапазона.

Мы можем рассчитать минимальный размер выборки, необходимый для получения необходимого доверительного интервала, если мы также знаем стандартное отклонение популяции, используя приведенную ниже формулу.

$$n=\left(\frac{z_{\alpha/2}×\sigma}{E}\right)^2$$

Окончательный результат n следует округлить до ближайшего целого числа.

Формула Кохрана позволяет определить минимальный размер выборки на основе желаемого уровня погрешности, необходимого доверительного уровня и ожидаемой доли признака, присутствующего в популяции. Формула Кохрана имеет вид,

$$n₀=\frac{z^2p(1-p)}{E^2}$$

  • z = значение Z из z-таблицы на основе необходимого доверительного уровня
  • p = предполагаемая доля признака, присутствующего в популяции
  • E = предел погрешности

Пример 1

Представьте себе, что мы изучаем иностранных студентов, поступивших на бакалавриат в Канаде. На начальном этапе у нас не так много информации. Поэтому мы предполагаем, что иностранные студенты составляют 60% всех студентов бакалавриата в Канаде. В результате, предполагаемая доля признака в популяции составляет 60%. Мы хотим получить уровень достоверности 95% и погрешность 4%. Сколько студентов должно быть включено в минимальный объем выборки исследования?

$$(1-\alpha)=95\%$$

$$z_{α/2}=z_{{95\%}/2}=1,96$$

$$p=60\%$$

$$E=4\%$$

$$n₀=\frac{z²p(1-p)}{E²}=\frac{1,96²×60\%×(1-60\%)}{4\%²}=576,24≈577$$

Таким образом, чтобы получить 95% доверительный уровень и 4% погрешность необходимо включить в исследование как минимум 577 студентов.

Приведенная выше формула используется, когда размер генеральной совокупности велик или бесконечен. Если размер генеральной совокупности мал или конечен, то нужно скорректировать размер выборки. Размер выборки корректируется по приведенной ниже формуле.

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}$$

  • n₀ = размер выборки, рассчитанный по формуле Кохрана
  • N = размер генеральной совокупности
  • n = скорректированный размер выборки для конечной совокупности

Пример 2

Мы исследуем иностранных студентов, зачисленных на курсы бакалавриата в колледж, в котором вы учитесь в Канаде. На начальном этапе у нас не так много информации. Поэтому мы предполагаем, что иностранные студенты составляют 60% всех студентов старших курсов в вашем колледже. Таким образом, предполагаемая доля этого признака в генеральной совокупности составляет 60%. Общее количество студентов в вашем колледже составляет 12.000 человек. Мы хотим получить доверительный уровень 95% и погрешность 4%. Сколько студентов нужно включить в минимальный объем выборки исследования?

В этом случае нужно сначала вычислить n₀ по формуле Кохрана, а затем скорректировать размер выборки, поскольку популяция конечна.

$$n₀=\frac{z^2p(1-p)}{{E}^2}=\frac{1,96^2×{60\%}×(1-{60\%})}{{4\%}^2}=576,24$$

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}=\frac{576,24}{1+\left(\frac{576,24-1}{12.000}\right)}=549,88\approx550$$

С помощью калькулятора минимального размера выборки вы можете выполнить вышеупомянутые сложные расчеты менее чем за секунду.

Формула для расчета предела погрешности

Вы можете перестроить формулу для размера выборки, чтобы найти формулу для предела погрешности.

Формула минимального размера выборки такова,

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

Сделаем E или предел погрешности объектом вышеприведенной формулы.

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

$${n₀}×{E}^2=z^2p\left(1-p\right)$$

$$E^2=\frac{z^2p\left(1-p\right)}{n₀}$$

$$E=\sqrt{\frac{z^2p\left(1-p\right)}{n₀}}$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

Пример 3

Представьте себе, что мы изучаем иностранных студентов, поступивших на бакалавриат в Канаде. На начальном этапе у нас не так много информации. Поэтому мы предполагаем, что иностранные студенты составляют 60% всех студентов бакалавриата в Канаде. В результате, предполагаемая доля этого свойства в населении составляет 60%. Допустим, мы хотим получить доверительный уровень 95%, и вы отбираете 577 студентов для своего исследования. Какова погрешность для этого исследования?

$$z_{{95\%}/2}=1,96$$

$$p=60\%$$

$$n₀=577$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n_0}}=1.96 \times \sqrt{\frac{60\% \times \left(1-60\%\right)}{577}}=4\%$$

Если популяция конечна, нужно сначала найти n₀, используя приведенную ниже формулу.

$$n₀=\frac{n-nN}{n-N}$$

А затем нужно применить ответ в следующей формуле, чтобы определить предел погрешности.

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

Второй компонент калькулятора минимального размера выборки поможет вам пропустить все эти шаги и рассчитать предел погрешности менее чем за секунду.

Формула для расчета доверительного интервала

Доверительный интервал легко определить, если вы знаете предел погрешности. Для расчета доверительного интервала используется приведенная ниже формула.

Доверительный интервал = Точечная оценка ± Предел погрешности

Верхняя граница доверительного интервала = Точечная оценка + Предел погрешности

Нижняя граница доверительного интервала = Точечная оценка - Предел погрешности

Доверительный интервал для среднего значения μ составляет,

x̄ - E < μ < x̄ + E

x̄ - E - нижний предел, а x̄ + E - верхний предел.

Доверительный интервал для P составляет,

p - E < P < p + E

Пример 4

Вы исследуете среднюю стоимость программы для иностранных студентов, обучающихся в Канаде. Вы отобрали 1.000 студентов для своей выборки, и на основе своей выборки вы подсчитали, что средняя стоимость программы для иностранных студентов, обучающихся в Канаде, составляет 20.000 канадских долларов (CAD). Погрешность составляет 5.000 канадских долларов. Найдите доверительный интервал для средней стоимости программы для иностранных студентов, обучающихся в Канаде.

Верхний предел = x̄ + E = CAD 20.000 + CAD 5.000 = CAD 25.000

Нижний предел = x̄ - E = CAD 20.000 - CAD 5.000 = CAD 15.000

Таким образом, доверительный интервал составляет,

x̄ - E < μ < x̄ + E

CAD 15.000 < μ < CAD 25.000