통계 계산기
표준편차계산기


표준편차계산기

데이터의 평균, 분산, 표준편차를 빠르고 정확하게 구해보세요. 표본 및 모집단에 대한 모든 중간 계산 과정을 상세히 보여주는 무료 표준편차 계산기입니다. 복잡한 통계 분석을 쉽고 간편하게 해결하세요!

표본 모집단
표준 편차 σ = 5.3385 s = 4.9937
분산 σ2 = 28.5 s2 = 24.9375
개수 n = 8 n = 8
평균 μ = 18.25 x̄ = 18.25
제곱의 합 SS = 199.5 SS = 199.5

계산에 오류가 있었습니다.

목차

  1. 표준편차
  2. 모집단 표준편차
    1. 모집단 표준편차 계산 예시
  3. 표본 표준편차 (샘플 표준편차)
  4. 오차 한계
  5. 신뢰구간
    1. 신뢰구간 계산 예시

표준편차계산기

표준편차 계산기는 입력된 데이터 세트(일련의 숫자)에 대한 표준편차를 빠르고 정확하게 계산해 줍니다. 또한 평균과 분산을 포함하여, 분석하는 데이터에 대한 추가적인 핵심 통계 정보를 함께 제공합니다. 이 계산기를 활용하면 다양한 신뢰 수준에 따른 데이터 세트의 신뢰구간을 구하고, 빈도 분포표도 쉽게 확인할 수 있습니다.

이 계산기를 사용하는 방법은 매우 간단합니다. 입력창에 숫자를 쉼표로 구분하여 입력하십시오. 그런 다음 입력한 데이터가 '모집단'을 대표하는지, 아니면 '표본(샘플)'을 대표하는지 선택한 후 "계산하기" 버튼을 클릭하시면 됩니다.

표준편차

표준편차(Standard Deviation)는 주어진 데이터 세트가 지닌 분산 또는 변동성의 정도를 나타내는 대표적인 통계 지표입니다. 이는 데이터 포인트들이 데이터 세트의 평균으로부터 얼마나 떨어져 있는지를 보여주는 집계된 평균 거리를 의미합니다. 표준편차가 작을수록 데이터 포인트들은 평균에 밀집해 있으며, 반대로 표준편차가 클수록 데이터 포인트들은 평균에서 멀리 넓게 퍼져 있음을 뜻합니다. 표준편차는 또 다른 산포도 측정 지표인 '분산(Variance)'의 제곱근과 같습니다.

표준편차는 입력된 데이터 세트의 특성에 따라 다르게 계산됩니다. 데이터 세트가 관심 대상이 되는 전체 관측치를 포함하는 경우(전체 모집단)에는 모집단 표준편차를 계산하며, 데이터 세트가 전체 모집단에서 추출된 일부를 나타내는 경우(표본)에는 표본 표준편차를 계산합니다.

모집단 표준편차

데이터 세트가 분석하고자 하는 전체 대상을 온전히 포함할 때 모집단 표준편차를 계산합니다. 즉, 데이터 세트가 고려 중인 모든 관측치를 나타내는 경우입니다. 모집단 표준편차는 기호 σ(시그마)로 표시합니다.

σ는 그리스 알파벳 '시그마(Sigma)'의 소문자입니다. 모집단 표준편차는 다음 공식을 사용하여 계산됩니다:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

여기서:

  • Σ는 수학에서 총합을 나타낼 때 사용하는 그리스 알파벳 대문자 시그마입니다;
  • xᵢ는 데이터 세트의 각 데이터 포인트(관측치)를 나타내며, 첫 번째부터 N번째(마지막) 데이터 포인트까지를 의미합니다;
  • μ는 모집단의 평균을 나타냅니다;
  • N은 모집단의 전체 크기(데이터 개수)입니다.

모집단 표준편차 계산 예시

다음 예시는 모집단 데이터의 표준편차를 구하는 방법을 보여줍니다.

일반적으로 투자자들은 주식이 다른 자산군에 비해 변동성이 크기 때문에 위험 자산으로 간주합니다. 한 투자 관리자가 지난달 특정 주식들의 변동성을 분석하고자 합니다. 그는 표준편차가 평균 이상인 주식을 "너무 위험하다"고 판단하여 고객에게 추천하지 않을 계획입니다.

아래에는 지난달 해당 주식의 모든 일일 종가(USD)가 나열되어 있습니다. 표준편차를 계산하여 관리자가 이 주식을 "너무 위험하다"고 판단할지 여부를 결정해 보세요:

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

관리자는 '지난달의 주식 가격' 전체에만 관심이 있으며, 위에 나열된 데이터는 지난달의 모든 가격을 포함하고 있습니다. 즉, 전체 모집단 데이터를 확보한 상태이므로 모집단 표준편차 공식을 적용하여 계산합니다.

표준편차를 구하려면 먼저 평균을 계산해야 합니다. 평균 μ는 모든 숫자의 합을 숫자의 총 개수로 나누어 구합니다.

$$ \mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

다음으로, 각 관측치에서 평균을 뺀 뒤 그 차이를 제곱합니다. 그런 다음 모든 결과값을 더하고 전체 개수로 나눕니다. 이 결과를 분산(σ²)이라고 합니다.

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

마지막으로, 분산의 제곱근을 구하여 표준편차를 얻습니다.

$$\sigma=\sqrt{0.045031}\approx0.21$$

보시다시피, 지난달 이 주식 가격의 표준편차는 평균보다 작습니다. 따라서 관리자는 이 주식을 "너무 위험하다"고 판단하지 않을 것입니다.

표본 표준편차 (샘플 표준편차)

관심 대상인 모집단에서 추출한 일부 데이터(표본)만을 분석할 때는 표본 표준편차를 계산합니다. 이 경우 데이터 세트는 전체 관측치가 아닌, 그보다 작은 부분 집합을 나타냅니다. 표본 표준편차는 기호 s로 표시하며, 다음 공식을 사용하여 계산됩니다:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

여기서:

  • Σ는 총합을 나타냅니다;
  • xᵢ는 각 데이터 포인트를 나타냅니다;
  • 는 표본의 평균을 나타냅니다;
  • n은 표본의 크기(데이터 개수)입니다.

앞서 살펴본 모집단 표준편차 예시와 유사한 상황을 가정하여, 표본 데이터의 표준편차를 구하는 방법을 설명하겠습니다. 이번에는 투자 관리자가 지난달 모든 거래일의 종가 데이터를 확보하지 못했고, 무작위로 추출된 단 5일간의 종가 데이터만 가지고 있다고 가정해 보겠습니다. 이 경우, 그는 이용 가능한 표본 데이터를 활용하여 전체 주식 종가의 표준편차를 추정해야 합니다.

그가 보유한 5일간의 종가 데이터는 다음과 같습니다:

1.31, 1.40, 0.86, 0.88, 1.40

관리자의 최종 분석 목표는 '지난달 주식 가격 전체'의 변동성입니다. 하지만 전체 데이터가 아닌 5일이라는 작은 부분 집합만 가지고 있으므로, 이는 **표본(Sample)**을 다루는 상황입니다. 따라서 표본 표준편차 공식을 사용하여 계산을 진행합니다.

먼저, 표본의 평균을 계산합니다.

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

다음으로, 분산 을 계산합니다.

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

마지막으로, 분산의 제곱근을 구하여 표본 표준편차를 얻습니다.

$$s=\sqrt{0.0764}\approx 0.28$$

오차 한계

표준편차의 중요한 활용법 중 하나는 통계적으로 "수용 가능한" 값의 범위를 계산하는 것입니다. 이는 산업의 통계적 품질 보증이나 예측 분석에서 매우 중요한 역할을 합니다. 기본 데이터가 정규 분포를 따른다고 가정할 때, 이 범위를 '신뢰구간'이라고 부릅니다(다음 섹션 참조). 이러한 신뢰구간은 다양한 신뢰 수준(백분율)에 따라 다르게 설정됩니다.

오차 한계(Margin of Error)는 신뢰구간의 너비를 결정하는 핵심 구성 요소입니다. 즉, 오차 한계는 측정하고자 하는 수량의 최대 및 최소 허용 값의 범위를 의미합니다.

오차 한계는 다음 공식을 사용하여 계산됩니다:

$$오차\ 한계 = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

이 공식은 모집단의 표준편차 σ를 이미 알고 있으며, 동시에 표본의 크기가 충분히 큰 경우(보통 n>30)에 적용됩니다.

반면, 모집단의 표준편차를 모르고 표본의 크기가 작은 경우(보통 n≤30)에는 다음 공식을 사용합니다:

$$오차\ 한계 = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

이 공식에서는 전체 모집단 표준편차 σ를 알 수 없기 때문에 확보된 표본 표준편차 s를 대신 활용합니다.

\$z_{\alpha/2}\$ 및 \$t_{n-1, \alpha/2}\$는 각각 z-통계량과 t-통계량을 기반으로 결정되는 **임계값(Critical value)**입니다. 이들은 설정한 신뢰 수준과 관련된 상수입니다.

통계학에서 가장 보편적으로 사용되는 신뢰 수준은 90%, 95%, 99%입니다. 각각에 해당하는 \$z_{\alpha/2}\$ 값은 1.645 (90%용), 1.96 (95%용), 2.575 (99%용)입니다.

\$\frac{\sigma}{\sqrt n}\$ 또는 \$\frac{s}{\sqrt n}\$는 **표준 오차(Standard Error)**라고 부릅니다.

  • \$\frac{\sigma}{\sqrt n}\$는 모집단의 표준편차 σ를 알고 있고 표본 크기가 큰 경우(보통 n>30)에 사용됩니다.
  • \$\frac{s}{\sqrt n}\$는 모집단의 표준편차를 알 수 없어 표본 크기가 작은 경우(보통 n≤30)에 사용됩니다. 즉, 전체 모집단의 표준편차 σ 대신 우리에게 확보된 표본의 표준편차 s를 사용해야 할 때 적용합니다.

신뢰구간

앞서 살펴본 바와 같이, 신뢰구간(Confidence Interval)은 특정 신뢰 수준에서 특정 통계량이 존재할 것으로 예상되는 값의 범위입니다.

예를 들어, "13세 소녀의 키가 90% 신뢰 수준에서 59인치에서 66인치 사이에 있다"고 표현할 수 있습니다. 이는 무작위로 13세 소녀들의 그룹을 선택했을 때, 그들의 키가 90%의 확률로 해당 범위 안에 속하게 됨을 의미합니다.

신뢰구간은 다음 공식을 통해 계산됩니다:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • 는 표본 평균입니다,
  • \$z_{\alpha/2}\$는 임계값입니다,
  • σ는 모집단 표준편차입니다,
  • n은 관측치의 개수입니다.

모집단 표준편차 σ를 몰라서 표본 표준편차 s를 대신 사용해야 할 때는 다음 공식을 적용합니다:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • 는 표본 평균입니다,
  • \$t_{n-1,\alpha/2}\$는 임계값입니다,
  • s는 표본 표준편차입니다,
  • n은 관측치의 개수입니다.

이전 장의 내용을 떠올려 보면, \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ 와 \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ 가 바로 오차 한계에 해당함을 알 수 있습니다.

신뢰구간 계산 예시

분석하고자 하는 일일 주식 가격 데이터가 정규 분포를 따른다고 가정해 보겠습니다. 우리에게는 다음과 같은 주식 가격 표본 데이터가 있습니다:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

우리는 95%의 신뢰도를 바탕으로 평균 주식 가격이 변동할 신뢰구간 범위를 계산해야 합니다.

이 데이터는 표본 크기가 작고 모집단 표준편차를 알 수 없는 상태이므로, 표본 표준편차를 적용하는 아래의 공식을 사용하여 계산을 진행할 것입니다:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • 는 표본 평균입니다, 1.10
  • \$t_{n-1,\alpha/2}\$ 는 임계값입니다, \$t_{9, 0.025}\$ = 2.26 (주어진 표본 크기와 신뢰 수준에 따른 임계값은 일반적으로 z-분포표나 t-분포표에서 확인합니다)
  • s 는 표본 표준편차입니다, 0.23
  • n 은 관측치의 수입니다, 10,
  • \$\frac{s}{\sqrt n}\$ 는 표준 오차입니다, \$\frac{0.23}{\sqrt{10}}=0.07\$

이제 이 숫자들을 공식에 대입합니다.

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

계산 결과는 다음과 같습니다:

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

결과적으로, 우리는 실제 평균 주가가 신뢰구간 (0.94, 1.26) 사이에 존재할 것이라고 95% 확신할 수 있습니다.