머신러닝에서 "학습"의 의미

30 P
QUESTION 06 #408
머신러닝에서 모델을 "학습시킨다(fit)"는 것은 정확히 무엇을 의미하는가?
다음 중 옳은 것을 고르세요

머신러닝에서 "학습"이란?

학습이란 데이터를 보고 최적의 가중치(w)와 편향(b)을 찾는 과정입니다.

사람의 학습 vs AI의 학습

비교 사람 AI (머신러닝)
무엇이 변하나? 뇌의 신경 연결 가중치 w와 편향 b의 숫자
어떻게 변하나? 경험과 반복 데이터와 손실 최소화
결과 더 잘 판단함 더 정확하게 예측

구체적인 학습 과정

1. 시작: w = 0, b = 0  (아무것도 모름)
   예측: 모든 입력에 대해 0 출력
   손실: 매우 큼

2. 데이터 보기: (x=25, y=85)
   예측: 0 → 실제: 85 (큰 오차!)

3. 조정: w와 b를 조금 키우자
   w = 1.5, b = 0.5

4. 또 데이터: (x=30, y=100)
   예측: 45.5 → 실제: 100 (아직 차이 큼)
   더 조정: w = 3, b = 10

5. 반복... 반복...

6. 완료: w = 3, b = 10  (최적값 발견!)
   예측 정확도: 95%+

학습 전후의 모델 비교

# 학습 전
model = LinearRegression()
model.coef_       # 정의되지 않음 (학습 안 됨)
model.intercept_  # 정의되지 않음

# 학습 후
model.fit(X, y)
model.coef_       # 3.0  (찾아낸 가중치)
model.intercept_  # 10.0 (찾아낸 편향)

왜 fit()이라는 이름?

fit = 맞추다

데이터에 직선을 "맞추는(fitting)" 과정
      ↑
   y  |    *      *
      |  *   *  *   ← 데이터 점들
      | * *      *
      |/
      +─────────→ x
      ↑
   직선을 데이터에 가장 잘 맞도록 그리기

학습은 곧 "파라미터 최적화"

파라미터 = w, b 같은 학습되는 숫자들
최적화 = 손실이 최소가 되는 값을 찾는 것

학습 = 손실 함수가 최소가 되는 w와 b 찾기

딥러닝도 마찬가지

복잡한 신경망도 결국 수만~수십억 개의 가중치를 학습합니다.

  • GPT-3: 약 1750억 개의 가중치
  • GPT-4: 추정 1조 개 이상

많을 뿐이지, 본질은 w와 b를 찾는 것과 같습니다.

💡 핵심: 머신러닝의 학습은 "데이터에 가장 잘 맞는 w와 b를 찾는 과정"입니다.