PROGRESS
2 / 10
단원
넘파이(NumPy) 기초 13
데이터프레임 생성과 편집 9
데이터 탐색과 필터링 12
데이터 집계와 통계 13
데이터 시각화(matplotlib) 10
파일 입출력(CSV, Excel, JSON) 10
전체 목록
QUESTION 02 #382
CSV 파일을 읽어 데이터프레임으로 변환하는 프로그램입니다. 빈칸을 채우세요.
main.py
import pandas as pd
# 먼저 테스트용 CSV 파일을 생성합니다.
df_save = pd.DataFrame({
'과일': ['사과', '바나나', '포도', '딸기'],
'가격': [1500, 1000, 2000, 3000],
'재고': [50, 100, 30, 20]
})
df_save.to_csv('/tmp/fruits.csv', index=False)
# CSV 파일을 데이터프레임으로 읽어옵니다.
df = pd.('/tmp/fruits.csv')
print(df)
print("\n행 수:", len(df))
HINT
힌트: CSV 파일을 읽어 데이터프레임으로 만드는 함수는 read_csv()입니다. pd(판다스) 뒤에 점(.)을 찍고 사용합니다.
실행 결과 예시
과일 가격 재고 0 사과 1500 50 1 바나나 1000 100 2 포도 2000 30 3 딸기 3000 20 행 수: 4
INTERACTIVE SHELL
Shift + Enter 로 즉시 실행
read_csv()로 CSV 파일 읽기
pd.read_csv()는 CSV 파일을 읽어 데이터프레임으로 변환하는 함수입니다. 데이터 분석에서 가장 많이 사용되는 함수 중 하나입니다.
기본 문법
df = pd.read_csv("파일경로")
동작 과정
CSV 파일 (fruits.csv): 데이터프레임 (df):
과일,가격,재고 과일 가격 재고
사과,1500,50 read_csv 0 사과 1500 50
바나나,1000,100 --------→ 1 바나나 1000 100
포도,2000,30 2 포도 2000 30
딸기,3000,20 3 딸기 3000 20
↑ 인덱스 자동 추가
read_csv() 주요 옵션
| 옵션 | 설명 | 예시 |
|---|---|---|
encoding |
인코딩 지정 | encoding='utf-8' |
header |
헤더 행 번호 | header=0 (기본값) |
index_col |
인덱스로 쓸 열 | index_col=0 |
usecols |
특정 열만 읽기 | usecols=['과일', '가격'] |
nrows |
읽을 행 수 제한 | nrows=100 |
sep |
구분자 지정 | sep=' ' (탭 구분) |
한글 CSV 파일 읽기
한글이 포함된 CSV가 깨질 때:
# 방법 1: utf-8
df = pd.read_csv("data.csv", encoding='utf-8')
# 방법 2: cp949 (윈도우에서 저장된 경우)
df = pd.read_csv("data.csv", encoding='cp949')
# 방법 3: utf-8-sig (BOM 포함)
df = pd.read_csv("data.csv", encoding='utf-8-sig')
파일 읽기 후 확인 3종 세트
df = pd.read_csv("data.csv")
df.head() # 앞 5행 확인
df.info() # 구조 확인 (열, 타입, 결측값)
df.describe() # 통계 요약
💡 핵심: 데이터 분석의 첫 단계는
pd.read_csv()로 파일을 불러오는 것입니다.