K-Means: 스스로 그룹 찾기(Clustering)

40 P
QUESTION 05 #351
정답(y)이 없는 상태에서 데이터끼리 닮은꼴을 찾아 그룹을 묶는 K-평균(K-Means) 알고리즘을 실습해 보세요.
main.py
from sklearn.cluster import KMeans
import numpy as np

# 특징 데이터만 존재 (정답 없음)
X = np.array([[1, 2], [1, 4], [10, 2], [10, 4]])

# 2개의 그룹으로 묶기
kmeans = (n_clusters=2)
kmeans.fit(X)

# 각 데이터가 속한 그룹 확인
labels = kmeans.
print(f"데이터별 그룹 할당: {labels}")
실행 결과 예시
KMeans, labels_
INTERACTIVE SHELL Shift + Enter 로 즉시 실행

🧩 정답 없이 배우는 인공지능: 군집화

지금까지의 모델이 "문제-정답"을 공부했다면, 군집화(Clustering)는 정답 없이 데이터의 생김새(특징)만 보고 끼리끼리 묶는 과정입니다.

  • 작동 원리: 임의의 중심점을 찍고, 가까운 데이터를 모은 뒤, 모인 데이터들의 평균 지점으로 중심점을 계속 이동시킵니다.
  • 활용: 고객의 구매 패턴을 분석해 "VVIP 그룹", "알뜰 쇼핑 그룹" 등으로 자동 분류할 때 사용됩니다.