통계 계산기
표본 크기 계산기


표본 크기 계산기

설문조사 및 연구에 필요한 최소 표본 크기와 오차 범위를 빠르고 간편하게 계산하세요. 신뢰수준과 모집단 크기를 바탕으로 정확한 통계적 표본 수를 도출하는 무료 표본 크기 계산기입니다.

표본 크기

385

오차 범위

9.8%

계산에 오류가 있었습니다.

목차

  1. 표본
  2. 오차 범위
  3. 신뢰 구간
  4. 통계에서의 표본, 오차 범위 및 신뢰 구간 간의 상호 연결
  5. 표본 크기 계산 공식
  6. 예제 1
  7. 예제 2
  8. 예제 3
  9. 신뢰 구간을 계산하는 공식
  10. 예제 4

표본 크기 계산기

정확한 통계 분석을 위한 표본 크기 계산기는 두 가지 주요 기능을 제공합니다. 첫 번째는 연구에 필요한 최적의 표본 크기를 계산하는 것이고, 두 번째는 도출된 결과의 오차 범위를 확인하는 것입니다.

표본 크기를 결정하는 첫 번째 단계는 드롭다운 목록에서 원하는 '신뢰 수준'을 선택하는 것입니다. 다음으로 허용할 '오차 범위(상대 오차)'를 입력하세요. 점 추정치에서 절대 오차를 나누면 절대 오차를 상대적인 비율로 변환할 수 있습니다.

그런 다음, 예상되는 '모집단 비율'을 알고 있다면 입력하고, 모를 경우 기본값인 50%로 유지하세요. 마지막으로 '모집단 크기'를 알고 있다면 입력하고, 모른다면 비워 두어도 무방합니다. 모든 입력을 마친 후 "계산하기" 버튼을 클릭하세요.

계산기의 두 번째 기능을 사용하면 데이터의 오차 범위를 쉽게 구할 수 있습니다. 먼저 드롭다운 메뉴에서 '신뢰 수준'을 선택하세요. 두 번째 칸에 연구에 사용된 '표본 크기'를 입력하고, 이어서 '모집단 비율'을 입력하세요. 마지막 칸에 '모집단 크기'를 입력하되, 정확한 규모를 모른다면 비워 두세요. 완료 후 "계산하기"를 클릭하면 결과를 확인할 수 있습니다.

표본

통계학에서 모집단의 일부를 추출한 것을 **표본(Sample)**이라고 합니다. 여기서 모집단(Population)이란 특정 연구나 조사의 대상이 되는 모든 요소의 집합을 의미합니다. 연구 대상인 모집단 전체를 조사하는 전수조사(Census)가 가장 이상적인 방법이지만, 현실적으로는 여러 가지 제약으로 인해 모집단 전체를 조사하는 것이 불가능한 경우가 많습니다.

예를 들어, 정글에 서식하는 특정 곤충에 대해 연구한다면 모집단은 무한에 가깝기 때문에 전체를 조사할 수 없습니다. 또한, 제품 테스트 과정에서 연구 대상이 파괴되는 '파괴 검사'의 경우에도 전수조사는 불가능합니다. 밀봉된 음료수 병의 용량을 확인하기 위해 뚜껑을 열면, 해당 제품은 더 이상 시장에 판매할 수 없기 때문입니다.

더불어 전체 모집단을 조사하려면 막대한 시간과 비용, 그리고 인력이 소모됩니다. 대부분의 연구 프로젝트는 제한된 자원 내에서 완료되어야 하므로, 전체 모집단을 조사하는 것은 비효율적입니다. 이에 대한 가장 합리적인 해결책이 바로 모집단을 대표할 수 있는 표본을 추출하여 연구를 수행하는 것입니다.

오차 범위

전수조사가 불가능한 상황에서는 표본에서 계산된 측정값인 **표본 통계량(Sample Statistic)**을 사용하여 모집단의 측정값인 **모수(Population Parameter)**를 추정하게 됩니다. 표본 통계량은 표본에서 실제로 관찰되거나 측정된 데이터를 바탕으로 도출됩니다. 모집단의 모수를 하나의 단일 값으로 추정하는 것을 '점 추정(Point Estimation)'이라고 합니다.

예를 들어, 생산 라인에서 제조되는 음료수 병의 평균 용량을 추정하기 위해 무작위로 한 배치를 추출하고 그 배치의 평균 용량을 측정할 수 있습니다. 해당 배치의 평균 용량 x̄가 250ml라고 가정해 보겠습니다. 이를 바탕으로 생산 라인의 모든 병이 평균적으로 250ml의 용량을 가질 것이라고 추정($\hat{μ}$)하게 됩니다.

하지만 현실적으로 실제 모수와 표본을 통한 추정치가 완벽하게 일치할 수는 없습니다. 이러한 차이는 전체 모집단이 아닌 표본을 사용하여 모수를 추정할 때 필연적으로 발생하는 표본 오차입니다.

**오차 범위(Margin of Error)**는 모수의 점 추정치와 실제 값 사이에 발생할 수 있는 최대 허용 차이를 의미하며, 종종 추정의 최대 오차로 불립니다.

신뢰 구간

**신뢰 구간(Confidence Interval)**은 추정치가 포함될 것으로 기대되는 범위를 나타냅니다. 이 구간은 특정 오차 범위 내에서 모집단의 모수가 추정되었음을 의미합니다. 신뢰 구간의 하한(Lower Bound)을 구하려면 점 추정치에서 오차 범위를 빼고, 상한(Upper Bound)을 구하려면 점 추정치에 오차 범위를 더합니다.

통계에서의 표본, 오차 범위 및 신뢰 구간 간의 상호 연결

전체 모집단을 조사하는 대신 우리는 표본을 연구하여 모집단의 모수를 추정합니다. 이 과정에서 실제 모수와 추정치 사이에는 차이가 발생할 수 있으며, 이 최대 차이가 바로 오차 범위입니다.

여기서 주목해야 할 점은 표본 크기와 오차 범위 사이의 반비례 관계입니다. 표본 크기가 클수록 모집단을 더 정확하게 대표할 수 있으므로 오차 범위는 줄어듭니다. 반대로 표본 크기가 작아지면 오차 범위는 증가하게 됩니다.

이렇게 계산된 오차 범위를 점 추정치에 적용하여 더하거나 빼면, 최종적인 신뢰 구간을 얻을 수 있습니다.

표본 크기 계산 공식

연구자가 가지고 있는 정보의 종류에 따라 표본 크기를 계산하는 다양한 공식이 존재합니다.

원하는 '신뢰 수준'은 추정의 확실성 정도를 결정하며, '오차 범위'의 최대 한도는 구간 추정을 통해 달성하고자 하는 정밀도를 결정합니다.

모집단의 표준 편차를 알고 있는 경우, 아래 공식을 사용하여 원하는 신뢰 구간을 얻기 위한 최소 표본 크기를 계산할 수 있습니다.

$$n=\left(\frac{z_{\alpha/2}×\sigma}{E}\right)^2$$

최종 결과인 표본 크기 n은 항상 가장 가까운 정수로 올림하여 적용해야 합니다.

**코크란 공식(Cochran's Formula)**을 사용하면 원하는 오차 범위, 신뢰 수준, 그리고 모집단 내에 존재할 것으로 예상되는 속성의 비율을 바탕으로 최소 표본 크기를 계산할 수 있습니다. 공식은 다음과 같습니다.

$$n₀=\frac{z^2p(1-p)}{E^2}$$

  • z = 원하는 신뢰 수준에 따른 정규분포(z-표)의 Z 값
  • p = 모집단 내에 존재할 것으로 예상되는 속성의 비율
  • E = 허용되는 오차 범위

예제 1

캐나다의 학부 과정에 등록된 유학생을 대상으로 연구를 진행한다고 가정해 보겠습니다. 초기에는 확보된 정보가 많지 않아, 캐나다 전체 학부생 중 유학생의 비율을 60%로 가정했습니다. 즉, 모집단 내 속성의 추정 비율은 60%입니다. 이 연구에서 95%의 신뢰 수준과 4%의 오차 범위를 확보하고자 할 때, 필요한 최소 표본 크기(학생 수)는 몇 명일까요?

$$(1-\alpha)=95\%$$

$$z_{α/2}=z_{{95\%}/2}=1.96$$

$$p=60\%$$

$$E=4\%$$

$$n₀=\frac{z²p(1-p)}{E²}=\frac{1.96²×60\%×(1-60\%)}{4\%²}=576.24≈577$$

따라서, 95%의 신뢰 수준과 4%의 오차 범위를 만족하기 위해서는 연구에 최소 577명의 학생이 포함되어야 합니다.

위 공식은 모집단 크기가 매우 크거나 무한할 때 사용됩니다. 만약 모집단의 크기가 작거나 유한하다면, 유한 모집단 수정 계수를 적용하여 표본 크기를 조정해야 합니다. 조정 공식은 다음과 같습니다.

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}$$

  • n₀ = 코크란 공식으로 계산된 초기 표본 크기
  • N = 모집단의 전체 크기
  • n = 유한 모집단을 위해 최종 조정된 표본 크기

예제 2

당신이 재학 중인 특정 대학교의 학부 과정에 등록된 유학생을 대상으로 연구를 진행한다고 가정해 보겠습니다. 유학생의 비율을 60%로 가정하여 모집단 속성의 추정 비율은 60%로 설정했습니다. 해당 대학교의 전체 학생 수는 12,000명입니다. 95%의 신뢰 수준과 4%의 오차 범위를 확보하기 위한 최소 표본 크기는 몇 명일까요?

이 경우 모집단의 크기가 한정되어 있으므로, 먼저 코크란 공식을 사용하여 n₀를 계산한 뒤 표본 크기를 조정해야 합니다.

$$n₀=\frac{z^2p(1-p)}{{E}^2}=\frac{1.96^2×{60\%}×(1-{60\%})}{{4\%}^2}=576.24$$

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}=\frac{576.24}{1+\left(\frac{576.24-1}{12,000}\right)}=549.88\approx550$$

본 웹사이트의 표본 크기 계산기를 활용하면 이처럼 복잡한 수학적 계산을 1초 만에 쉽게 해결할 수 있습니다.

오차 범위 계산 공식

표본 크기를 구하는 코크란 공식을 재정렬하면 오차 범위를 구하는 공식을 도출할 수 있습니다.

최소 표본 크기 공식은 다음과 같습니다.

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

위 식을 오차 범위(E)를 기준으로 정리해 보겠습니다.

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

$${n₀}×{E}^2=z^2p\left(1-p\right)$$

$$E^2=\frac{z^2p\left(1-p\right)}{n₀}$$

$$E=\sqrt{\frac{z^2p\left(1-p\right)}{n₀}}$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

예제 3

캐나다 학부 과정에 등록된 유학생에 대한 연구를 진행한다고 가정해 보겠습니다. 전체 학부생 중 유학생의 비율을 60%로 추정했습니다. 이 연구에서 95%의 신뢰 수준을 확보하고자 하며, 무작위로 577명의 학생을 표본으로 추출했습니다. 이때 연구 결과의 오차 범위는 얼마일까요?

$$z_{{95\%}/2}=1.96$$

$$p=60\%$$

$$n₀=577$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n_0}}=1.96 \times \sqrt{\frac{60\% \times \left(1-60\%\right)}{577}}=4\%$$

모집단의 크기가 유한한 경우에는 아래 공식을 사용하여 먼저 초기 표본 크기인 n₀를 역산해야 합니다.

$$n₀=\frac{n-nN}{n-N}$$

그런 다음, 도출된 값을 아래 공식에 대입하여 최종 오차 범위를 구합니다.

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

이러한 모든 복잡한 계산 단계 역시, 표본 크기 계산기의 두 번째 기능을 사용하면 1초 이내에 쉽고 정확하게 오차 범위를 확인할 수 있습니다.

신뢰 구간을 계산하는 공식

데이터의 오차 범위를 파악했다면 신뢰 구간을 구하는 것은 매우 간단합니다. 아래 공식을 적용하여 신뢰 구간을 계산하세요.

신뢰 구간 = 점 추정치 ± 오차 범위

신뢰 구간의 상한 = 점 추정치 + 오차 범위

신뢰 구간의 하한 = 점 추정치 - 오차 범위

평균 μ에 대한 신뢰 구간 공식은 다음과 같습니다.

x̄ - E < μ < x̄ + E

여기서 x̄ - E는 신뢰 구간의 하한을, x̄ + E는 상한을 의미합니다.

비율 P에 대한 신뢰 구간 공식은 다음과 같습니다.

p - E < P < p + E

예제 4

캐나다 유학생들의 평균 학비에 대한 통계 연구를 진행하고 있습니다. 1,000명의 학생을 표본으로 추출하여 분석한 결과, 캐나다 유학생의 평균 학비가 20,000 CAD로 추정되었습니다. 이때 오차 범위는 5,000 CAD입니다. 캐나다 유학생 평균 학비의 신뢰 구간을 계산해 보세요.

상한 = x̄ + E = CAD 20,000 + CAD 5,000 = CAD 25,000

하한 = x̄ - E = CAD 20,000 - CAD 5,000 = CAD 15,000

따라서 도출된 신뢰 구간은 다음과 같습니다.

x̄ - E < μ < x̄ + E

CAD 15,000 < μ < CAD 25,000