파이온 - Python Online Learning

import pandas as pd # 먼저 테스트용 CSV 파일을 생성합니다. df_save = pd.DataFrame({ '과일': ['사과', '바나나', '포도', '딸기'], '가격': [1500, 1000, 2000, 3000], '재고': [50, 100, 30, 20] }) df_save.to_csv('/tmp/fruits.csv', index=False) # CSV 파일을 데이터프레임으로 읽어옵니다. df = pd.('/tmp/fruits.csv') print(df) print("\n행 수:", len(df))

read_csv()로 CSV 파일 읽기

pd.read_csv()는 CSV 파일을 읽어 데이터프레임으로 변환하는 함수입니다. 데이터 분석에서 가장 많이 사용되는 함수 중 하나입니다.

기본 문법

df = pd.read_csv("파일경로")

동작 과정

CSV 파일 (fruits.csv):        데이터프레임 (df):

과일,가격,재고                    과일    가격   재고
사과,1500,50       read_csv    0  사과  1500   50
바나나,1000,100    --------→   1  바나나  1000  100
포도,2000,30                   2  포도  2000   30
딸기,3000,20                   3  딸기  3000   20

                              ↑ 인덱스 자동 추가

read_csv() 주요 옵션

옵션	설명	예시
`encoding`	인코딩 지정	`encoding='utf-8'`
`header`	헤더 행 번호	`header=0` (기본값)
`index_col`	인덱스로 쓸 열	`index_col=0`
`usecols`	특정 열만 읽기	`usecols=['과일', '가격']`
`nrows`	읽을 행 수 제한	`nrows=100`
`sep`	구분자 지정	`sep=' '` (탭 구분)

한글 CSV 파일 읽기

한글이 포함된 CSV가 깨질 때:

# 방법 1: utf-8
df = pd.read_csv("data.csv", encoding='utf-8')

# 방법 2: cp949 (윈도우에서 저장된 경우)
df = pd.read_csv("data.csv", encoding='cp949')

# 방법 3: utf-8-sig (BOM 포함)
df = pd.read_csv("data.csv", encoding='utf-8-sig')

파일 읽기 후 확인 3종 세트

df = pd.read_csv("data.csv")
df.head()       # 앞 5행 확인
df.info()       # 구조 확인 (열, 타입, 결측값)
df.describe()   # 통계 요약

💡 핵심: 데이터 분석의 첫 단계는 pd.read_csv()로 파일을 불러오는 것입니다.