엑셀 파일 읽기 : read_excel()

30 P
QUESTION 07 #387
엑셀 파일을 읽어 데이터프레임으로 변환하고 기본 정보를 확인하는 프로그램입니다. 빈칸을 채우세요.
main.py
import pandas as pd

# 테스트용 엑셀 파일 생성
df_save = pd.DataFrame({
    '도시': ['서울', '부산', '제주', '대전'],
    '인구(만)': [970, 340, 67, 150],
    '면적(km²)': [605, 770, 1849, 540]
})
df_save.to_excel('/tmp/cities.xlsx', index=False)

# 엑셀 파일을 데이터프레임으로 읽어옵니다.
df = pd.('/tmp/cities.xlsx')

print(df)
print("\n도시 수:", len(df))
실행 결과 예시
   도시  인구(만)  면적(km²)
0  서울    970     605
1  부산    340     770
2  제주     67    1849
3  대전    150     540

도시 수: 4
INTERACTIVE SHELL Shift + Enter 로 즉시 실행

read_excel()로 엑셀 파일 읽기

pd.read_excel()은 엑셀 파일을 읽어 데이터프레임으로 변환하는 함수입니다.

기본 문법

df = pd.read_excel("파일경로.xlsx")

read_excel() 주요 옵션

옵션 설명 예시
sheet_name 읽을 시트 지정 sheet_name='Sheet2'
header 헤더(열 이름) 행 번호 header=0 (기본값)
usecols 특정 열만 읽기 usecols='A:C'
skiprows 건너뛸 행 수 skiprows=2
nrows 읽을 행 수 nrows=100

특정 시트 읽기

# 시트 이름으로 읽기
df = pd.read_excel("data.xlsx", sheet_name='매출')

# 시트 번호로 읽기 (0번째 = 첫 시트)
df = pd.read_excel("data.xlsx", sheet_name=1)

# 모든 시트 읽기 (딕셔너리로 반환)
all_sheets = pd.read_excel("data.xlsx", sheet_name=None)
# all_sheets['Sheet1'], all_sheets['Sheet2'] ...

read_csv() vs read_excel() 비교

비교 read_csv() read_excel()
파일 형식 .csv .xlsx, .xls
속도 빠름 상대적으로 느림
시트 없음 sheet_name으로 선택
필요 라이브러리 없음 openpyxl

엑셀 특정 범위만 읽기

# A~C열만 읽기
df = pd.read_excel("data.xlsx", usecols="A:C")

# 처음 3행 건너뛰고 읽기
df = pd.read_excel("data.xlsx", skiprows=3)

# 100행만 읽기
df = pd.read_excel("data.xlsx", nrows=100)

💡 핵심: read_csv()와 사용법이 거의 같으므로, CSV를 배웠다면 엑셀도 쉽게 다룰 수 있습니다.