파이온 - Python Online Learning

머신러닝에서 "학습"이란?

학습이란 데이터를 보고 최적의 가중치(w)와 편향(b)을 찾는 과정입니다.

사람의 학습 vs AI의 학습

비교	사람	AI (머신러닝)
무엇이 변하나?	뇌의 신경 연결	가중치 w와 편향 b의 숫자
어떻게 변하나?	경험과 반복	데이터와 손실 최소화
결과	더 잘 판단함	더 정확하게 예측

구체적인 학습 과정

1. 시작: w = 0, b = 0  (아무것도 모름)
   예측: 모든 입력에 대해 0 출력
   손실: 매우 큼

2. 데이터 보기: (x=25, y=85)
   예측: 0 → 실제: 85 (큰 오차!)

3. 조정: w와 b를 조금 키우자
   w = 1.5, b = 0.5

4. 또 데이터: (x=30, y=100)
   예측: 45.5 → 실제: 100 (아직 차이 큼)
   더 조정: w = 3, b = 10

5. 반복... 반복...

6. 완료: w = 3, b = 10  (최적값 발견!)
   예측 정확도: 95%+

학습 전후의 모델 비교

# 학습 전
model = LinearRegression()
model.coef_       # 정의되지 않음 (학습 안 됨)
model.intercept_  # 정의되지 않음

# 학습 후
model.fit(X, y)
model.coef_       # 3.0  (찾아낸 가중치)
model.intercept_  # 10.0 (찾아낸 편향)

왜 fit()이라는 이름?

fit = 맞추다

데이터에 직선을 "맞추는(fitting)" 과정

      ↑
   y  |    *      *
      |  *   *  *   ← 데이터 점들
      | * *      *
      |/
      +─────────→ x
      ↑
   직선을 데이터에 가장 잘 맞도록 그리기

학습은 곧 "파라미터 최적화"

파라미터 = w, b 같은 학습되는 숫자들
최적화 = 손실이 최소가 되는 값을 찾는 것

학습 = 손실 함수가 최소가 되는 w와 b 찾기

딥러닝도 마찬가지

복잡한 신경망도 결국 수만~수십억 개의 가중치를 학습합니다.

GPT-3: 약 1750억 개의 가중치
GPT-4: 추정 1조 개 이상

많을 뿐이지, 본질은 w와 b를 찾는 것과 같습니다.

💡 핵심: 머신러닝의 학습은 "데이터에 가장 잘 맞는 w와 b를 찾는 과정"입니다.

머신러닝에서 "학습"의 의미

머신러닝에서 "학습"이란?

사람의 학습 vs AI의 학습

구체적인 학습 과정

학습 전후의 모델 비교

왜 fit()이라는 이름?

학습은 곧 "파라미터 최적화"

딥러닝도 마찬가지

용어사전