PROGRESS
6 / 13
단원
넘파이(NumPy) 기초 13
데이터프레임 생성과 편집 9
데이터 탐색과 필터링 12
데이터 집계와 통계 13
데이터 시각화(matplotlib) 10
파일 입출력(CSV, Excel, JSON) 10
전체 목록
QUESTION 06 #319
median() 함수를 이용하여 데이터의 중앙에 위치한 값을 찾는 프로그램입니다. 빈칸을 채우세요.
main.py
import numpy as np
# 1차원 리스트 데이터
score = [10, 20, 30, 40, 500]
# 중간값 계산
median_value = np.(score)
print(f"리스트 데이터: {score}")
print(f"계산된 중간값: {median_value}")
# 데이터 개수가 짝수일 때 (가운데 두 값의 평균을 반환)
even_score = [10, 20, 30, 40]
print(f"짝수 개수 데이터의 중간값: {np.(even_score)}")
HINT
힌트: 중간값은 데이터의 산술 평균인 mean() 함수와는 달리 데이터를 크기순으로 나열했을 때 가장 중앙에 있는 값을 의미하며 함수명은 median()입니다.
실행 결과 예시
리스트 데이터: [10, 20, 30, 40, 500] 계산된 중간값: 30.0 짝수 개수 데이터의 중간값: 25.0
INTERACTIVE SHELL
Shift + Enter 로 즉시 실행
np.median() - 중간값(중앙값) 구하기
중간값(Median)은 데이터를 크기순으로 나열했을 때 정중앙에 위치한 값입니다.
평균(Mean) vs 중간값(Median)
score = [10, 20, 30, 40, 500]
np.mean(score) → 120.0 # 평균 (극단값에 영향받음)
np.median(score) → 30.0 # 중간값 (극단값에 강건함)
극단적으로 큰 값(500)이 있을 때:
- 평균: 120.0 (실제 데이터 분포를 잘 반영하지 못함)
- 중간값: 30.0 (데이터의 중심을 더 잘 나타냄)
중간값 계산 방법
홀수 개일 때 (5개): 정중앙 값
정렬: [10, 20, 30, 40, 500]
↑
중간값 = 30.0
짝수 개일 때 (4개): 가운데 두 값의 평균
정렬: [10, 20, 30, 40]
↑ ↑
(20 + 30) / 2 = 25.0
언제 중간값을 사용할까?
| 상황 | 추천 |
|---|---|
| 데이터가 고르게 분포 | 평균(mean) |
| 극단값(이상값)이 있음 | 중간값(median) |
| 소득, 부동산 가격 | 중간값(median) |
| 시험 점수 (정규분포) | 평균(mean) |
실전 예시: 연봉 데이터
salary = np.array([3000, 3200, 3500, 3800, 50000])
# ↑ CEO 연봉
print(f"평균 연봉: {np.mean(salary)}") # 12,700 (왜곡됨)
print(f"중간 연봉: {np.median(salary)}") # 3,500 (실제 체감에 가까움)
💡 핵심: 극단값(Outlier)이 있는 데이터에서는 평균보다 중간값이 데이터의 대표값으로 더 적합합니다.