중간 값 구하기 : np.median()

30 P
QUESTION 06 #319
median() 함수를 이용하여 데이터의 중앙에 위치한 값을 찾는 프로그램입니다. 빈칸을 채우세요.
main.py
import numpy as np

# 1차원 리스트 데이터
score = [10, 20, 30, 40, 500]

# 중간값 계산
median_value = np.(score)

print(f"리스트 데이터: {score}")
print(f"계산된 중간값: {median_value}") 

# 데이터 개수가 짝수일 때 (가운데 두 값의 평균을 반환)
even_score = [10, 20, 30, 40]
print(f"짝수 개수 데이터의 중간값: {np.(even_score)}")
실행 결과 예시
리스트 데이터: [10, 20, 30, 40, 500]
계산된 중간값: 30.0
짝수 개수 데이터의 중간값: 25.0
INTERACTIVE SHELL Shift + Enter 로 즉시 실행

np.median() - 중간값(중앙값) 구하기

중간값(Median)은 데이터를 크기순으로 나열했을 때 정중앙에 위치한 값입니다.

평균(Mean) vs 중간값(Median)

score = [10, 20, 30, 40, 500]

np.mean(score)    →  120.0   # 평균 (극단값에 영향받음)
np.median(score)  →  30.0    # 중간값 (극단값에 강건함)

극단적으로 큰 값(500)이 있을 때:

  • 평균: 120.0 (실제 데이터 분포를 잘 반영하지 못함)
  • 중간값: 30.0 (데이터의 중심을 더 잘 나타냄)

중간값 계산 방법

홀수 개일 때 (5개): 정중앙 값

정렬: [10, 20, 30, 40, 500]
                 ↑
              중간값 = 30.0

짝수 개일 때 (4개): 가운데 두 값의 평균

정렬: [10, 20, 30, 40]
              ↑   ↑
         (20 + 30) / 2 = 25.0

언제 중간값을 사용할까?

상황 추천
데이터가 고르게 분포 평균(mean)
극단값(이상값)이 있음 중간값(median)
소득, 부동산 가격 중간값(median)
시험 점수 (정규분포) 평균(mean)

실전 예시: 연봉 데이터

salary = np.array([3000, 3200, 3500, 3800, 50000])
#                                          ↑ CEO 연봉

print(f"평균 연봉: {np.mean(salary)}")     # 12,700 (왜곡됨)
print(f"중간 연봉: {np.median(salary)}")   # 3,500 (실제 체감에 가까움)

💡 핵심: 극단값(Outlier)이 있는 데이터에서는 평균보다 중간값이 데이터의 대표값으로 더 적합합니다.