파이온 - Python Online Learning

AI/머신러닝 기초 과정

PROGRESS

2 / 6

단원 데이터 구조화: AI 전처리 17 데이터의 규칙: 예측 로직 14 옷의 시너스: 판단 로직 1 예와 아니오: 판단 로직 6 닮은꼴 찾기: 관계 로직 7 최적의 경로: 강화 로직 7 층층이 지능: 신경망 로직 7 전체 목록

이전 문제 다음 문제

이진 분류 모델 학습하기

40 P

QUESTION 02 #343

Scikit-learn을 사용하여 스팸 메일 여부(0: 정상, 1: 스팸)를 분류하는 모델을 학습시키고 결과를 예측해 보세요.

main.py

from sklearn.linear_model import LogisticRegression
import numpy as np

# 특성(X): 메일 내 특정 단어 빈도, 정답(y): 스팸 여부
X = np.array([[1], [5], [10], [20]])
y = np.array([0, 0, 1, 1])

model = ()
model.(X, y)

# 단어 빈도가 15일 때의 결과 예측
prediction = model.predict([[15]])
print(f"예측 결과: {prediction[0]}") # 0 또는 1 출력

HINT

사용할 클래스명과 학습 메서드를 입력하세요.

실행 결과 예시

LogisticRegression, fit

INTERACTIVE SHELL Shift + Enter 로 즉시 실행

📧 스팸 필터의 원리

인공지능은 수많은 스팸 메일을 학습하며 특정 단어의 등장 횟수와 스팸 여부 사이의 관계를 파악합니다.

데이터 구조: X는 입력 데이터(원인), y는 우리가 맞히려는 범주(결과)입니다.
학습: fit 과정에서 모델은 "단어가 약 7~8개 이상이면 스팸일 확률이 높다"라는 결정 경계(Decision Boundary)를 찾아냅니다.

이진 분류 모델 학습하기

📧 스팸 필터의 원리

용어사전