PROGRESS
6 / 14
단원
데이터 구조화: AI 전처리 17
데이터의 규칙: 예측 로직 14
옷의 시너스: 판단 로직 1
예와 아니오: 판단 로직 6
닮은꼴 찾기: 관계 로직 7
최적의 경로: 강화 로직 7
층층이 지능: 신경망 로직 7
전체 목록
QUESTION 06 #408
머신러닝에서 모델을 "학습시킨다(fit)"는 것은 정확히 무엇을 의미하는가?
다음 중 옳은 것을 고르세요
머신러닝에서 "학습"이란?
학습이란 데이터를 보고 최적의 가중치(w)와 편향(b)을 찾는 과정입니다.
사람의 학습 vs AI의 학습
| 비교 | 사람 | AI (머신러닝) |
|---|---|---|
| 무엇이 변하나? | 뇌의 신경 연결 | 가중치 w와 편향 b의 숫자 |
| 어떻게 변하나? | 경험과 반복 | 데이터와 손실 최소화 |
| 결과 | 더 잘 판단함 | 더 정확하게 예측 |
구체적인 학습 과정
1. 시작: w = 0, b = 0 (아무것도 모름)
예측: 모든 입력에 대해 0 출력
손실: 매우 큼
2. 데이터 보기: (x=25, y=85)
예측: 0 → 실제: 85 (큰 오차!)
3. 조정: w와 b를 조금 키우자
w = 1.5, b = 0.5
4. 또 데이터: (x=30, y=100)
예측: 45.5 → 실제: 100 (아직 차이 큼)
더 조정: w = 3, b = 10
5. 반복... 반복...
6. 완료: w = 3, b = 10 (최적값 발견!)
예측 정확도: 95%+
학습 전후의 모델 비교
# 학습 전
model = LinearRegression()
model.coef_ # 정의되지 않음 (학습 안 됨)
model.intercept_ # 정의되지 않음
# 학습 후
model.fit(X, y)
model.coef_ # 3.0 (찾아낸 가중치)
model.intercept_ # 10.0 (찾아낸 편향)
왜 fit()이라는 이름?
fit = 맞추다
데이터에 직선을 "맞추는(fitting)" 과정
↑
y | * *
| * * * ← 데이터 점들
| * * *
|/
+─────────→ x
↑
직선을 데이터에 가장 잘 맞도록 그리기
학습은 곧 "파라미터 최적화"
파라미터 = w, b 같은 학습되는 숫자들
최적화 = 손실이 최소가 되는 값을 찾는 것
학습 = 손실 함수가 최소가 되는 w와 b 찾기
딥러닝도 마찬가지
복잡한 신경망도 결국 수만~수십억 개의 가중치를 학습합니다.
- GPT-3: 약 1750억 개의 가중치
- GPT-4: 추정 1조 개 이상
많을 뿐이지, 본질은 w와 b를 찾는 것과 같습니다.
💡 핵심: 머신러닝의 학습은 "데이터에 가장 잘 맞는 w와 b를 찾는 과정"입니다.