데이터 구조 확인(len)

40 P
QUESTION 11 #334
분리된 데이터셋의 개수가 맞는지 확인하기 위해 리스트의 길이를 구하는 함수를 사용해 보세요.
main.py
X = [[20, 70], [25, 80], [30, 85]]

# 데이터의 총 개수 확인
data_count = (X)

print(f"데이터 개수는 {data_count}개입니다.")
실행 결과 예시
데이터 개수는 3개입니다.
INTERACTIVE SHELL Shift + Enter 로 즉시 실행

📏 데이터 개수 확인이 왜 중요한가?

머신러닝 모델을 학습시킬 때, 입력 데이터(X)의 개수와 정답 데이터(y)의 개수가 일치하지 않으면 오류가 발생합니다.


len() 함수의 역할

X = [[20, 70], [25, 80], [30, 85]]
y = [50, 80, 110]

print(len(X))  # 3
print(len(y))  # 3

len()은 리스트에 포함된 요소의 개수를 반환합니다.


데이터 검증 패턴

학습 전에 항상 아래와 같은 검증을 수행합니다:

# 데이터 개수 일치 확인
assert len(X) == len(y), "X와 y의 개수가 다릅니다!"

# 각 데이터의 특성 개수 확인
print(f"데이터 개수: {len(X)}개")
print(f"특성 개수: {len(X[0])}개")

2차원 리스트에서의 len()

코드 결과 의미
len(X) 3 데이터(행)의 개수
len(X[0]) 2 첫 번째 행의 특성(열) 개수

실무에서 자주 발생하는 오류

# 오류 상황: X는 100개, y는 99개
X = [[...]] * 100
y = [...] * 99

model.fit(X, y)
# ValueError: X와 y의 샘플 수가 다릅니다!

이런 오류를 방지하기 위해 학습 전 len() 확인은 필수적인 습관입니다.