파이온 - Python Online Learning

import pandas as pd # 테스트용 엑셀 파일 생성 df_save = pd.DataFrame({ '도시': ['서울', '부산', '제주', '대전'], '인구(만)': [970, 340, 67, 150], '면적(km²)': [605, 770, 1849, 540] }) df_save.to_excel('/tmp/cities.xlsx', index=False) # 엑셀 파일을 데이터프레임으로 읽어옵니다. df = pd.('/tmp/cities.xlsx') print(df) print("\n도시 수:", len(df))

read_excel()로 엑셀 파일 읽기

pd.read_excel()은 엑셀 파일을 읽어 데이터프레임으로 변환하는 함수입니다.

기본 문법

df = pd.read_excel("파일경로.xlsx")

read_excel() 주요 옵션

옵션	설명	예시
`sheet_name`	읽을 시트 지정	`sheet_name='Sheet2'`
`header`	헤더(열 이름) 행 번호	`header=0` (기본값)
`usecols`	특정 열만 읽기	`usecols='A:C'`
`skiprows`	건너뛸 행 수	`skiprows=2`
`nrows`	읽을 행 수	`nrows=100`

특정 시트 읽기

# 시트 이름으로 읽기
df = pd.read_excel("data.xlsx", sheet_name='매출')

# 시트 번호로 읽기 (0번째 = 첫 시트)
df = pd.read_excel("data.xlsx", sheet_name=1)

# 모든 시트 읽기 (딕셔너리로 반환)
all_sheets = pd.read_excel("data.xlsx", sheet_name=None)
# all_sheets['Sheet1'], all_sheets['Sheet2'] ...

read_csv() vs read_excel() 비교

비교	read_csv()	read_excel()
파일 형식	.csv	.xlsx, .xls
속도	빠름	상대적으로 느림
시트	없음	sheet_name으로 선택
필요 라이브러리	없음	openpyxl

엑셀 특정 범위만 읽기

# A~C열만 읽기
df = pd.read_excel("data.xlsx", usecols="A:C")

# 처음 3행 건너뛰고 읽기
df = pd.read_excel("data.xlsx", skiprows=3)

# 100행만 읽기
df = pd.read_excel("data.xlsx", nrows=100)

💡 핵심: read_csv()와 사용법이 거의 같으므로, CSV를 배웠다면 엑셀도 쉽게 다룰 수 있습니다.