결과를 찾을 수 없습니다
현재 그 용어로는 아무것도 찾을 수 없습니다, 다른 것을 검색해보세요.
무료 사분위수 계산기로 데이터의 제1사분위수(Q1), 제2사분위수(Q2), 제3사분위수(Q3) 및 사분위수 범위(IQR)를 빠르고 정확하게 계산하세요. 최솟값, 최댓값 등 통계 분석에 필요한 핵심 값을 한 번에 확인하실 수 있습니다.
| 사분위수 통계 | |
|---|---|
| 첫 번째 사분위 (Q1) | 25 |
| 두 번째 사분위 (Q2) | 55 |
| 세 번째 사분위 (Q3) | 75 |
| 사분위 범위 (IQR) | 50 |
| 중앙값 = Q2 (x˜) | 55 |
| 최소 | 10 |
| 최대 | 100 |
| 범위 (R) | 90 |
계산에 오류가 있었습니다.
**사분위수 계산기(Quartile Calculator)**는 상자 수염 그림(Box-Plot) 작성을 위한 '5숫자 요약(Five-number summary)'을 구할 때 매우 유용한 통계 도구입니다. 이 통계 계산기는 주어진 데이터 세트의 제1사분위수(Q1), 제2사분위수(Q2, 중앙값), 제3사분위수(Q3)를 비롯해 최솟값과 최댓값을 빠르고 정확하게 계산해 줍니다. 또한, 사분위범위(IQR)와 전체 데이터 범위(Range)도 함께 제공합니다.
사용 방법은 아주 간단합니다. 데이터를 직접 입력하거나 복사하여 붙여넣은 뒤 "계산" 버튼을 클릭하기만 하면 됩니다. 단, 각 숫자는 쉼표나 공백으로 구분하여 입력해 주세요.
사분위수(Quartile)는 통계학에서 데이터의 분포 위치를 파악하는 대표적인 위치 척도입니다. 전체 데이터 세트 내에서 특정 값이 어느 위치에 해당하는지를 명확하게 설명하는 데 도움을 줍니다.
사분위수는 오름차순(작은 값에서 큰 값 순서)으로 정렬된 데이터 배열을 크기순으로 4등분할 때 그 기준이 되는 값을 의미합니다. 각 구간에는 동일한 개수의 데이터 항목이 포함되며, 하나의 데이터 세트에서 총 3개의 사분위수를 구할 수 있습니다.
**제1사분위수(Q1)**는 오름차순으로 정렬된 데이터에서 하위 25%와 상위 75%를 나누는 기준값입니다. 즉, Q1보다 작은 데이터가 전체의 25%, 큰 데이터가 75%를 차지합니다. 이는 데이터 세트의 25백분위수(25th percentile)와 동일합니다.
**제2사분위수(Q2)**는 오름차순으로 정렬된 데이터에서 하위 50%와 상위 50%를 나누는 기준값입니다. 즉, Q2를 기준으로 작은 값과 큰 값이 각각 50%씩 존재합니다. 제2사분위수는 데이터 세트의 중앙값(Median)과 정확히 일치하며, 50백분위수와도 같습니다.
**제3사분위수(Q3)**는 오름차순으로 정렬된 데이터에서 하위 75%와 상위 25%를 나누는 기준값입니다. 즉, Q3보다 작은 데이터가 전체의 75%, 큰 데이터가 25%를 차지합니다. 이는 데이터 세트의 75백분위수와 동일합니다.
사분위수를 직접 계산하려면 다음 단계를 따릅니다:
예제 1
다음 데이터 세트는 대학을 갓 졸업한 신입 회계사들의 초봉을 나타냅니다. 초봉의 중앙값(Q2), 하위 사분위수(Q1), 상위 사분위수(Q3)를 구하고 그 결과를 해석해 보세요.
$55,000, $60,000, $52,000, $45,000, $74,000, $75,000, $48,000, $58,000, $72,000, $66,000, $45,000, $50,000, $54,000, $65,000, $71,000
풀이
먼저, 데이터를 오름차순으로 정렬합니다.
$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000
그런 다음, 제2사분위수(중앙값)의 위치를 찾습니다.
$$두 번째\ 사분위수(Q2)=\left(\frac{N+1}{2}\right)^{번째}항목=\left(\frac{15+1}{2}\right)^{번째}항목=8^{번째}항목=58,000$$
다음으로 Q2보다 작은 데이터 값들의 중앙값을 구하여 Q1을 찾습니다.
$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000
제1사분위수 (Q1) = $50,000
다음으로 Q2보다 큰 데이터 값들의 중앙값을 구하여 Q3을 찾습니다.
$60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000
제3사분위수 (Q3) = $71,000
구해진 사분위수를 다음과 같이 해석할 수 있습니다.
신입 회계사의 25%는 $50,000 미만을 받고, 25%는 $71,000 초과를 받습니다. 또한 신입 회계사의 50%는 $58,000 초과를 받고, 나머지 50%는 그보다 적게 받습니다.
위의 예제에서 볼 수 있듯이, 데이터의 개수가 홀수인 경우 사분위수는 원래 데이터 세트에 존재하는 값이 됩니다. 하지만 데이터의 개수가 짝수라면, 사분위수가 원래의 데이터 값과 일치하지 않을 수 있습니다. 이를 확인하기 위해 위 예제를 약간 수정해 보겠습니다.
예제 2
예제 1의 데이터에서 누락된 연봉 데이터가 하나 더 있다고 가정해 보겠습니다. 누락된 연봉은 $95,000입니다. 이 수정된 데이터를 바탕으로 초봉의 중앙값(Q2), 하위 사분위수(Q1), 상위 사분위수(Q3)를 구하세요.
풀이
먼저, 데이터를 오름차순으로 정렬합니다.
$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000, $95,000
그런 다음, 사분위수의 위치를 찾습니다.
$$두 번째\ 사분위수(Q2)=\left(\frac{N+1}{2}\right)^{번째}항목=\left(\frac{16+1}{2}\right)^{번째}항목=8.5^{번째}항목$$
$$두 번째\ 사분위수(Q2)=\frac{8^{번째}항목+9^{번째}항목}{2}=\frac{58,000+60,000}{2}=59,000$$
이제 전체 데이터 세트를 중앙값을 기준으로 두 그룹으로 나눕니다. Q2보다 작은 데이터 값들의 중앙값을 구하여 Q1을 찾습니다.
$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000
제1사분위수 (Q1)=($50,000 + $52,000)/2 = $51,000
다음으로 Q2보다 큰 데이터 값들의 중앙값을 구하여 Q3을 찾습니다.
$60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000, $95,000
제3사분위수 (Q3) = ($71,000 + $72,000)/2 = $71,500
제3사분위수(상위 사분위수, Q3)와 제1사분위수(하위 사분위수, Q1)의 차이를 사분위범위(IQR, Interquartile Range)라고 합니다.
사분위범위는 전체 데이터에서 가장 작은 하위 25%와 가장 큰 상위 25%를 제외한, 중간 50% 데이터의 산포도(분포 상태)에 초점을 맞춥니다. 양극단의 값을 배제하고 계산하기 때문에, 데이터 세트 내에 존재하는 극단적인 값이나 이상치(Outlier)의 영향을 거의 받지 않습니다. 이는 전체 데이터를 기준으로 하는 단순 '범위(Range)' 계산이 가지는 단점을 훌륭하게 보완해 줍니다.
예제 3
예제 1의 데이터에 대한 사분위범위를 구하세요.
풀이
앞서 예제 1에서 다음의 사분위수들을 구했습니다:
위 값을 사분위범위 계산 공식에 대입합니다.
사분위범위 (IQR) = 제3사분위수 (Q3) - 제1사분위수 (Q1) = $71,000 - $50,000 = $21,000
예제 4
예제 2의 데이터에 대한 사분위범위를 구하세요.
풀이
앞서 예제 2에서 다음의 사분위수들을 구했습니다:
위 값을 사분위범위 계산 공식에 대입합니다.
사분위범위 (IQR) = 제3사분위수 (Q3) - 제1사분위수 (Q1) = $71,500 - $51,000 = $20,500
최솟값(Minimum)은 데이터 세트에서 가장 작은 값을 의미하며, 오름차순으로 정렬했을 때 가장 첫 번째에 위치하는 값입니다.
최댓값(Maximum)은 데이터 세트에서 가장 큰 값을 의미하며, 오름차순으로 정렬했을 때 가장 마지막에 위치하는 값입니다.
이 두 값은 전체 데이터가 어느 정도의 폭을 가지고 분포하는지 이해하는 데 큰 도움을 줍니다. 산포도의 가장 기본적인 척도인 데이터의 '범위(Range)' 역시 이 최솟값과 최댓값을 바탕으로 계산됩니다.
예제 5
예제 1에서 다룬 신입 회계사의 초봉 데이터 세트에서 최솟값과 최댓값을 구하세요.
풀이
앞서 데이터를 오름차순으로 정렬한 결과는 다음과 같습니다.
$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000
최솟값은 위 배열의 첫 번째 데이터입니다. 따라서,
신입 회계사의 최소 초봉 = $45,000
최댓값은 위 배열의 마지막 데이터입니다. 따라서,
신입 회계사의 최대 초봉 = $75,000
예제 6
예제 2에서 다룬 신입 회계사의 초봉 데이터 세트에서 최솟값과 최댓값을 구하세요.
풀이
앞서 데이터를 오름차순으로 정렬한 결과는 다음과 같습니다.
$45,000, $45,000, $48,000, $50,000, $52,000, $54,000, $55,000, $58,000, $60,000, $65,000, $66,000, $71,000, $72,000, $74,000, $75,000, $95,000
최솟값은 위 배열의 첫 번째 데이터입니다. 따라서,
신입 회계사의 최소 초봉 = $45,000
최댓값은 위 배열의 마지막 데이터입니다. 따라서,
신입 회계사의 최대 초봉 = $95,000
통계학에서 데이터의 범위(Range)는 데이터 세트의 산포도(퍼진 정도)를 나타내는 가장 직관적이고 기본적인 척도입니다. 이는 전체 데이터 중 가장 큰 값(최댓값)에서 가장 작은 값(최솟값)을 뺀 차이로 계산됩니다.
데이터 세트의 범위 = 최댓값 - 최솟값
데이터 세트의 범위 = 가장 큰 값 - 가장 작은 값
범위는 양극단 값 사이의 전체 거리를 보여주지만, 분포의 대략적인 크기만을 나타내는 거친 측정값입니다.
범위는 데이터 세트의 양극단 두 값에만 전적으로 의존합니다. 따라서 비정상적으로 높거나 낮은 이상치가 포함될 경우 결과가 쉽게 왜곡되고 편향될 수 있습니다.
범위는 전체 데이터의 분포 특성을 세밀하게 반영하지 못하기 때문에, 정밀한 통계 분석에서는 단독으로 쓰이기보다 다른 측정 도구(사분위범위 등)와 함께 활용하는 것이 좋습니다.
예제 7
예제 1에서 다룬 신입 회계사 초봉 데이터 세트의 범위를 구하세요.
풀이
앞서 우리는 데이터 세트의 최솟값과 최댓값을 구했습니다.
신입 회계사의 최소 초봉 = $45,000
신입 회계사의 최대 초봉 = $75,000
이제 위 값들을 범위 계산 공식에 대입합니다.
데이터 세트의 범위 = 최댓값 - 최솟값 = $75,000 - $45,000 = $30,000
예제 8
예제 2에서 다룬 신입 회계사 초봉 데이터 세트의 범위를 구하세요.
풀이
앞서 우리는 데이터 세트의 최솟값과 최댓값을 구했습니다.
신입 회계사의 최소 초봉 = $45,000
신입 회계사의 최대 초봉 = $95,000
이제 위 값들을 범위 계산 공식에 대입합니다.
데이터 세트의 범위 = 최댓값 - 최솟값 = $95,000 - $45,000 = $50,000
사분위수 계산은 통계적 분석에서 극단적인 값을 제외하고 실제 의미 있는 데이터의 분포를 파악하고자 할 때 매우 유용합니다. 다음은 다양한 산업 분야에서 의사결정을 내릴 때 사분위수를 활용하는 대표적인 사례들입니다.
인적 자원 - 회사 내 직급별 급여 테이블을 설정할 때 급여 데이터의 사분위수를 분석합니다. 이를 통해 수습 직원의 아주 낮은 급여나, 일부 고연봉 임원들의 극단적인 급여 데이터를 배제하여 보다 합리적인 표준 급여 범위를 책정할 수 있습니다.
재무 - 월간 지출 예산을 세울 때, 과거 지출 내역의 사분위수를 계산하여 예산 분포의 중심 경향성을 파악합니다. 이는 불필요한 예산 초과나 부족 현상을 방지하는 데 큰 도움이 됩니다.
생산 - 정상적인 생산 능력의 범위에 대한 데이터를 파악할 때 유용합니다. 정전이나 파업, 자재 부족 등으로 인해 생산량이 급감한 비정상적인 날의 극단적인 데이터에 의해 지표가 왜곡되는 것을 방지합니다.
마케팅 - 마케터가 경쟁사의 가격 범위를 분석할 때, 경쟁 제품 가격의 사분위수를 파악합니다. 이를 통해 분석 과정에서 극단적으로 저렴한 미끼 상품이나 지나치게 비싼 프리미엄 브랜드의 가격을 제외하고, 주력 시장의 실질적인 가격 대역에 집중할 수 있습니다.