CSV 파일 읽기 : read_csv()

30 P
QUESTION 02 #382
CSV 파일을 읽어 데이터프레임으로 변환하는 프로그램입니다. 빈칸을 채우세요.
main.py
import pandas as pd

# 먼저 테스트용 CSV 파일을 생성합니다.
df_save = pd.DataFrame({
    '과일': ['사과', '바나나', '포도', '딸기'],
    '가격': [1500, 1000, 2000, 3000],
    '재고': [50, 100, 30, 20]
})
df_save.to_csv('/tmp/fruits.csv', index=False)

# CSV 파일을 데이터프레임으로 읽어옵니다.
df = pd.('/tmp/fruits.csv')

print(df)
print("\n행 수:", len(df))
실행 결과 예시
   과일    가격   재고
0  사과  1500   50
1  바나나  1000  100
2  포도  2000   30
3  딸기  3000   20

행 수: 4
INTERACTIVE SHELL Shift + Enter 로 즉시 실행

read_csv()로 CSV 파일 읽기

pd.read_csv()는 CSV 파일을 읽어 데이터프레임으로 변환하는 함수입니다. 데이터 분석에서 가장 많이 사용되는 함수 중 하나입니다.

기본 문법

df = pd.read_csv("파일경로")

동작 과정

CSV 파일 (fruits.csv):        데이터프레임 (df):

과일,가격,재고                    과일    가격   재고
사과,1500,50       read_csv    0  사과  1500   50
바나나,1000,100    --------→   1  바나나  1000  100
포도,2000,30                   2  포도  2000   30
딸기,3000,20                   3  딸기  3000   20

                              ↑ 인덱스 자동 추가

read_csv() 주요 옵션

옵션 설명 예시
encoding 인코딩 지정 encoding='utf-8'
header 헤더 행 번호 header=0 (기본값)
index_col 인덱스로 쓸 열 index_col=0
usecols 특정 열만 읽기 usecols=['과일', '가격']
nrows 읽을 행 수 제한 nrows=100
sep 구분자 지정 sep=' ' (탭 구분)

한글 CSV 파일 읽기

한글이 포함된 CSV가 깨질 때:

# 방법 1: utf-8
df = pd.read_csv("data.csv", encoding='utf-8')

# 방법 2: cp949 (윈도우에서 저장된 경우)
df = pd.read_csv("data.csv", encoding='cp949')

# 방법 3: utf-8-sig (BOM 포함)
df = pd.read_csv("data.csv", encoding='utf-8-sig')

파일 읽기 후 확인 3종 세트

df = pd.read_csv("data.csv")
df.head()       # 앞 5행 확인
df.info()       # 구조 확인 (열, 타입, 결측값)
df.describe()   # 통계 요약

💡 핵심: 데이터 분석의 첫 단계는 pd.read_csv()로 파일을 불러오는 것입니다.