PROGRESS
5 / 14
단원
데이터 구조화: AI 전처리 17
데이터의 규칙: 예측 로직 14
옷의 시너스: 판단 로직 1
예와 아니오: 판단 로직 6
닮은꼴 찾기: 관계 로직 7
최적의 경로: 강화 로직 7
층층이 지능: 신경망 로직 7
전체 목록
QUESTION 05 #407
MSE(평균 제곱 오차)에서 오차를 제곱하는 가장 큰 이유는?
다음 중 옳은 것을 고르세요
MSE에서 왜 제곱할까?
MSE는 Mean Squared Error, 즉 "제곱 오차의 평균"입니다.
$$MSE = \frac{1}{n} \sum (y - \hat{y})^2$$제곱하지 않으면 어떻게 될까?
실제값: [10, 20, 30]
예측값: [15, 15, 35]
오차: [-5, +5, -5]
그냥 합: -5 + 5 + -5 = -5
평균 오차: -5 / 3 = -1.67
오차가 음수와 양수가 섞이면 서로 상쇄되어 정확한 측정이 안 됩니다.
제곱하면?
오차: [-5, +5, -5]
오차 제곱: [25, 25, 25] ← 모두 양수!
합계: 75
평균(MSE): 25
모든 값이 양수가 되어 상쇄 없이 정확히 측정 가능합니다.
제곱의 두 가지 효과
1. 음수를 양수로 (부호 통일)
(-5)² = 25
(+5)² = 25
2. 큰 오차에 더 큰 페널티
오차 1 → 1² = 1
오차 2 → 2² = 4 (4배)
오차 5 → 5² = 25 (25배)
오차 10 → 10² = 100 (100배)
작은 오차보다 큰 오차를 더 심각하게 취급합니다. 즉, 모델이 큰 실수를 줄이는 데 집중하게 됩니다.
절댓값을 쓰면 안 되나? (MAE)
절댓값을 쓰는 손실 함수도 있습니다:
$$MAE = \frac{1}{n} \sum |y - \hat{y}|$$| 비교 | MSE (제곱) | MAE (절댓값) |
|---|---|---|
| 부호 처리 | ✅ 양수화 | ✅ 양수화 |
| 큰 오차 강조 | ✅ 매우 강함 | 보통 |
| 미분 용이성 | ✅ 매끄러움 | 0에서 미분 불가 |
| 일반 사용 | 가장 많이 사용 | 이상치(outlier) 많을 때 |
MSE가 미분 가능해서 학습 알고리즘(경사하강법)이 잘 작동하기 때문에 가장 많이 쓰입니다.
직관적 비유
시험 점수 차이를 평가할 때:
학생 A: 1점 차이
학생 B: 10점 차이
- 그냥 차이: B는 A보다 10배 차이 → 보통
- 제곱 차이: B는 A보다 100배 차이 → 매우 심각하게 평가
큰 실수를 더 무겁게 봐서 줄이려는 의도입니다.
💡 핵심: 제곱은 ① 부호 통일과 ② 큰 오차 강조라는 두 가지 효과로 학습에 적합한 손실값을 만듭니다.