결과를 찾을 수 없습니다
현재 그 용어로는 아무것도 찾을 수 없습니다, 다른 것을 검색해보세요.
데이터의 평균, 중앙값, 최빈값, 범위를 빠르고 정확하게 계산하는 무료 통계 계산기입니다. 숫자만 입력하면 통계 분석에 필요한 핵심 지표를 한 번에 쉽게 구할 수 있습니다.
| 결과 | |||
|---|---|---|---|
| 평균 | 28.7 | 최대값 | 48 |
| 중앙값 | 13.5 | 최소값 | 12 |
| 범위 | 36 | 합계 | 287 |
| 최빈값 | 15, 38 각각 2번 나타났습니다 | 개수 | 10 |
| 기하 평균 | 25.88779096735222 | ||
0
1
2
3
4
5
계산에 오류가 있었습니다.
평균, 중앙값, 최빈값, 범위 계산기를 사용하면 복잡한 통계 값을 한 번에 쉽고 빠르게 구할 수 있습니다. 원시 데이터를 직접 입력하거나 입력창에 복사해서 붙여넣기만 하면 됩니다. 데이터 세트의 각 숫자나 값은 반드시 쉼표(,)로 구분해 입력해 주세요. 입력을 마친 후 '계산' 버튼을 클릭합니다.
단 몇 초 만에 결과가 화면에 나타납니다. 이 다기능 통계 계산기는 평균, 중앙값, 최빈값, 범위뿐만 아니라 기하 평균, 최댓값 및 최솟값, 데이터의 총합, 데이터 개수, 그리고 크기순으로 정렬된 데이터 세트까지 모두 자동으로 계산하여 제공합니다.
평균, 중앙값, 최빈값 계산기를 활용하면 전체 데이터를 대표하는 중심 경향 값을 쉽게 파악할 수 있습니다. 또한, 범위 계산 기능을 통해 데이터가 어떻게 분포되어 있는지(산포도)도 한눈에 확인할 수 있습니다. 그럼 지금부터 계산기가 제공하는 각 통계 지표의 의미와 계산 원리를 자세히 알아보겠습니다.
평균(Mean)은 데이터 세트를 구성하는 모든 값의 산술적인 평균 지점을 의미합니다. 즉, 전체 데이터 값의 총합을 데이터의 총 개수로 나눈 값입니다. 통계학에서 모집단의 평균은 그리스 문자 μ(뮤)로, 표본의 평균은 x̄(엑스바)로 표기합니다.
모집단의 평균을 계산하는 공식은 다음과 같습니다.
$$\mu=\frac{데이터\ 세트의\ 값\ 합계}{모집단\ 내\ 데이터\ 값의\ 총\ 수}=\frac{ΣX}{N}$$
표본의 평균을 계산하는 공식은 다음과 같습니다.
$$\bar{X}=\frac{데이터\ 세트의\ 값\ 합계}{샘플\ 내\ 데이터\ 값의\ 총\ 수}=\frac{ΣX}{n}$$
아래 예제를 통해 평균을 구하는 방법을 자세히 알아보겠습니다.
어느 대학 농구 선수들의 키(m) 데이터가 다음과 같이 주어졌다고 가정해 봅시다. 이 선수들의 평균 키는 얼마일까요?
1.75 m, 1.96 m, 1.95 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
풀이:
$$평균\ 키=\frac{\sum{}{}X}{N}=\frac{1.75\ m+1.96\ m+1.95\ m+2.00\ m+2.05\ m+2.05\ m+2.10\ m}{7}=\frac{13.86\ m}{7}=1.98\ m$$
이처럼 평균은 데이터 세트에 포함된 모든 값을 하나도 빠짐없이 반영하여 계산되므로, 전체 데이터를 대표하는 가장 보편적인 지표로 활용됩니다.
앞서 살펴본 일반적인 산술 평균 외에도, 이 계산기를 사용하면 데이터 세트의 기하 평균(Geometric Mean)도 쉽게 구할 수 있습니다. 기하 평균은 데이터 세트에 있는 n개의 모든 값을 곱한 뒤, 그 값의 n제곱근을 구하는 방식으로 계산됩니다.
$$기하\ 평균=\sqrt[n]{x₁ × x₂ × x₃ × \cdots × xₙ}$$
위에서 다룬 농구 선수 키 예제의 기하 평균을 계산해 보겠습니다.
$$기하\ 평균=\sqrt[7]{1.75×1.96×1.95×2.00×2.05×2.05×2.10}=\sqrt[7]{118.0554}=1.977$$
수학적으로, 음수가 아닌 숫자들로 이루어진 데이터 세트에서 기하 평균은 항상 산술 평균보다 작거나 같습니다.
이 예제에서도 다음과 같이 산술 평균이 기하 평균보다 크다는 것을 확인할 수 있습니다.
$$기하\ 평균 < 산술\ 평균$$
$$1.977<1.98$$
중앙값(Median)은 전체 데이터를 오름차순이나 내림차순으로 크기순 정렬했을 때, 정확히 한가운데에 위치하는 값을 의미합니다. 즉, 중앙값을 기준으로 전체 데이터는 상위 50%와 하위 50%로 나뉘게 됩니다.
$$중앙값=\left(\frac{N+1}{2}\right)-번째\ 항목\ 값$$
전체 데이터의 개수가 홀수일 경우, 정렬된 데이터의 한가운데 값이 중앙값이 됩니다. 데이터의 개수가 짝수인 경우에는 한가운데 위치한 두 값의 평균을 내어 중앙값을 구합니다. (우리 계산기는 번거로운 데이터 정렬 과정 없이 중앙값을 자동으로 찾아줍니다.)
앞선 예제의 중앙값을 직접 찾아보겠습니다.
먼저, 데이터 세트를 크기순(오름차순)으로 정렬합니다.
1.75 m, 1.95 m, 1.96 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
이제 정중앙에 위치한 값을 찾습니다.
$$중앙값=\left(\frac{N+1}{2}\right)-번째\ 항목\ 값=\left(\frac{7+1}{2}\right)-번째\ 항목\ 값=4-번째\ 항목\ 값$$
정렬된 데이터 세트에서 4번째에 위치한 값은 2.00 m입니다. 따라서 중앙값은 다음과 같습니다.
중앙값 = 2.00 m
만약 이 농구팀에 키가 1.90 m인 새로운 선수가 한 명 영입되었다고 가정해 보겠습니다. 이 경우 팀 전체의 중앙값은 어떻게 변할까요?
이제 선수들의 키 데이터는 총 8개가 됩니다.
1.75 m, 1.96 m, 1.95 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m, 1.90 m
마찬가지로 데이터를 크기순으로 다시 정렬합니다.
1.75 m, 1.90 m, 1.95 m, 1.96 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
데이터의 개수(N)가 8이므로 중간 지점을 찾아보겠습니다.
$$중앙값=\left(\frac{N+1}{2}\right)-번째\ 항목\ 값=\left(\frac{8+1}{2}\right)-번째\ 항목\ 값=4.5-번째\ 항목\ 값$$
데이터 개수가 짝수이므로, 한가운데 위치한 두 값의 평균을 계산해야 합니다. 즉, 이 예제에서는 4번째와 5번째 항목의 평균이 중앙값이 됩니다.
이를 계산하면 다음과 같습니다.
$$중앙값=\frac{1.96\ m+2.00\ m}{2}=1.98\ m$$
데이터 세트에 비정상적으로 크거나 작은 극단적인 값(이상치)이 포함되어 있을 때, 중앙값은 중심 경향을 파악하는 데 매우 유용하고 강력한 척도가 됩니다. 평균과 달리 중앙값은 오직 정중앙에 위치한 값만 고려하므로 극단적인 이상치에 의해 결과가 크게 왜곡되지 않습니다. 비록 평균처럼 모든 데이터를 계산에 포함하지는 않지만, 현실적인 데이터 분석에서는 훨씬 더 신뢰할 수 있는 중심 기준점을 제공합니다.
최빈값(Mode)은 데이터 세트에서 가장 빈번하게 나타나는 값을 의미합니다. 즉, 중복된 횟수(빈도수)가 가장 높은 데이터 값을 말합니다.
앞선 예제에서 최빈값을 찾아보겠습니다.
선수들의 키 데이터를 보면 2.05 m를 제외한 나머지 값들은 모두 한 번씩만 등장합니다. 반면, 2.05 m인 선수는 2명입니다. 따라서 이 데이터 세트에서 가장 자주 등장하는 값은 2.05 m가 됩니다.
최빈값 = 2.05 m
위 예제처럼 최빈값이 하나만 존재하는 데이터 세트를 '단일 최빈(Unimodal)'이라고 합니다. 하지만 데이터의 특성에 따라 최빈값은 여러 개 존재할 수도 있습니다. 최빈값이 2개라면 '이중 최빈(Bimodal)', 3개 이상이라면 '다중 최빈(Multimodal)'이라고 부릅니다. 반대로 모든 데이터 값이 중복 없이 단 한 번씩만 등장한다면, 해당 데이터 세트에는 최빈값이 존재하지 않는다는 점을 유의하세요.
최빈값은 복잡한 계산 없이 데이터의 분포만으로도 쉽게 찾을 수 있다는 장점이 있습니다. 그러나 평균과 같이 전체 데이터의 모든 값을 반영하여 도출되는 수치는 아니라는 점을 기억해야 합니다.
범위(Range)는 데이터 세트 내에 있는 최댓값(가장 큰 값)과 최솟값(가장 작은 값)의 차이를 의미합니다. 데이터가 어느 정도의 폭으로 퍼져 있는지 분포도를 파악할 때 사용하는 가장 간단하고 기초적인 척도입니다.
범위 = 가장 큰 값 - 가장 작은 값
동일한 예제를 통해 범위를 계산해 보겠습니다.
범위를 구하려면 가장 먼저 전체 데이터 중에서 최댓값과 최솟값을 찾아야 합니다. 데이터가 정렬되어 있지 않아 직접 찾기 어렵다면, 계산기를 활용해 최댓값과 최솟값을 즉시 확인할 수 있습니다.
두 값을 찾았다면, 최댓값에서 최솟값을 빼주기만 하면 됩니다.
가장 큰 값 = 2.10 m
가장 작은 값 = 1.75 m
따라서,
범위 = 2.10 m - 1.75 m = 0.35 m
다만 범위는 오직 양 끝의 극단적인 두 값만을 사용하여 계산되고 나머지 중간 데이터들은 모두 무시되므로, 이상치가 존재할 경우 편향되거나 결과가 크게 왜곡될 수 있다는 단점이 있습니다.