📊
쉼표 또는 공백으로 구분하여 입력
계산 공식
중앙값: 정렬 후 중간값 | 최빈값: 가장 많이 등장하는 값데이터를 정렬하여 중앙값을 구하고, 빈도수 분석으로 최빈값을 구합니다.
평균·중앙값·최빈값 — 3가지 대표값 비교
| 대표값 | 계산 방법 | 특징 | 사용 상황 |
|---|---|---|---|
| 평균(Mean) | 합계 ÷ 개수 | 모든 값 반영 | 분포가 고를 때 |
| 중앙값(Median) | 정렬 후 중간값 | 이상치에 강함 | 소득·부동산 등 |
| 최빈값(Mode) | 가장 많이 나온 값 | 여러 개 가능 | 선호도·빈도 분석 |
계산 예시: {3, 7, 2, 9, 5, 7, 1, 7}
1. 정렬: 1, 2, 3, 5, 7, 7, 7, 9 2. 평균: (1+2+3+5+7+7+7+9) ÷ 8 = 41 ÷ 8 = 5.125 3. 중앙값: 짝수(8개) → (5+7)/2 = 6.0 (4번째·5번째 값의 평균) 4. 최빈값: 7이 3번 등장 → 7 5. 범위: 최대(9) - 최소(1) = 8
홀수/짝수 개 중앙값 계산
| 데이터 | 정렬 | 중앙값 계산 | 결과 |
|---|---|---|---|
| {3, 1, 5} | 1, 3, 5 | 3번째 중 2번째 | 3 |
| {4, 2, 8, 6} | 2, 4, 6, 8 | (4+6)/2 | 5.0 |
| {10, 20, 30, 40, 50} | 그대로 | 5개 중 3번째 | 30 |
| {1, 2, 3, 100} | 그대로 | (2+3)/2 | 2.5 |
이상치(outlier)가 있을 때 평균 vs 중앙값
소득 예시: {200만, 250만, 230만, 220만, 10,000만}
- 평균: (200+250+230+220+10,000)/5 = 2,180만원 → 현실 왜곡
- 중앙값: 정렬 후 중간값 = 230만원 → 더 현실적
최빈값이 여러 개인 경우 (다봉분포)
{1, 1, 2, 3, 3, 4} → 최빈값: 1과 3 (두 값 모두 2회로 같음) 이를 이봉분포(bimodal)라 하며, 집단이 두 그룹으로 나뉠 때 자주 나타납니다.
범위(Range) vs 표준편차
- 범위 = 최대값 - 최소값 (계산 단순, 이상치에 취약)
- 표준편차 = 평균에서의 평균 편차 (더 정밀하지만 계산 복잡)
자주 묻는 질문
평균과 중앙값 중 어떤 것이 더 좋은 대표값인가요?
데이터 분포에 따라 다릅니다. 소득·부동산 가격처럼 극단값이 있으면 중앙값이 현실을 더 잘 반영합니다. 예: 소득 {200만, 220만, 230만, 250만, 5,000만}이면 평균 1,180만원이지만 중앙값은 230만원입니다. 반면 시험 성적처럼 고르게 분포된 데이터는 평균이 적절합니다.
최빈값이 없는 경우는 언제인가요?
모든 데이터 값이 정확히 1번씩만 등장하면 최빈값이 없습니다. 이 경우 계산기는 '없음(모든 값이 1회)'으로 표시합니다. 반대로 최빈값이 2개 이상이면 '이봉분포(bimodal)' 또는 '다봉분포(multimodal)'라고 합니다.
짝수 개 데이터의 중앙값은 어떻게 구하나요?
데이터를 오름차순 정렬 후 중간 두 값의 평균을 구합니다. 예: {2, 4, 6, 8}은 4번째 중 2번째(4)와 3번째(6)의 평균 = (4+6)/2 = 5.0이 중앙값입니다.
범위(range)는 어떻게 해석하나요?
범위 = 최대값 - 최소값으로, 데이터의 전체 퍼짐 정도를 나타냅니다. 단, 이상치에 매우 취약합니다. {1,2,3,4,5}의 범위 4와 {1,2,3,4,100}의 범위 99는 큰 차이지만 대부분의 데이터 분포는 비슷합니다. 더 견고한 산포도 지표로는 표준편차나 사분위범위(IQR)를 사용합니다.