PROGRESS
7 / 10
단원
넘파이(NumPy) 기초 13
데이터프레임 생성과 편집 9
데이터 탐색과 필터링 12
데이터 집계와 통계 13
데이터 시각화(matplotlib) 10
파일 입출력(CSV, Excel, JSON) 10
전체 목록
QUESTION 07 #387
엑셀 파일을 읽어 데이터프레임으로 변환하고 기본 정보를 확인하는 프로그램입니다. 빈칸을 채우세요.
main.py
import pandas as pd
# 테스트용 엑셀 파일 생성
df_save = pd.DataFrame({
'도시': ['서울', '부산', '제주', '대전'],
'인구(만)': [970, 340, 67, 150],
'면적(km²)': [605, 770, 1849, 540]
})
df_save.to_excel('/tmp/cities.xlsx', index=False)
# 엑셀 파일을 데이터프레임으로 읽어옵니다.
df = pd.('/tmp/cities.xlsx')
print(df)
print("\n도시 수:", len(df))
HINT
힌트: 엑셀 파일을 읽어 데이터프레임으로 만드는 함수는 read_excel()입니다.
실행 결과 예시
도시 인구(만) 면적(km²) 0 서울 970 605 1 부산 340 770 2 제주 67 1849 3 대전 150 540 도시 수: 4
INTERACTIVE SHELL
Shift + Enter 로 즉시 실행
read_excel()로 엑셀 파일 읽기
pd.read_excel()은 엑셀 파일을 읽어 데이터프레임으로 변환하는 함수입니다.
기본 문법
df = pd.read_excel("파일경로.xlsx")
read_excel() 주요 옵션
| 옵션 | 설명 | 예시 |
|---|---|---|
sheet_name |
읽을 시트 지정 | sheet_name='Sheet2' |
header |
헤더(열 이름) 행 번호 | header=0 (기본값) |
usecols |
특정 열만 읽기 | usecols='A:C' |
skiprows |
건너뛸 행 수 | skiprows=2 |
nrows |
읽을 행 수 | nrows=100 |
특정 시트 읽기
# 시트 이름으로 읽기
df = pd.read_excel("data.xlsx", sheet_name='매출')
# 시트 번호로 읽기 (0번째 = 첫 시트)
df = pd.read_excel("data.xlsx", sheet_name=1)
# 모든 시트 읽기 (딕셔너리로 반환)
all_sheets = pd.read_excel("data.xlsx", sheet_name=None)
# all_sheets['Sheet1'], all_sheets['Sheet2'] ...
read_csv() vs read_excel() 비교
| 비교 | read_csv() | read_excel() |
|---|---|---|
| 파일 형식 | .csv | .xlsx, .xls |
| 속도 | 빠름 | 상대적으로 느림 |
| 시트 | 없음 | sheet_name으로 선택 |
| 필요 라이브러리 | 없음 | openpyxl |
엑셀 특정 범위만 읽기
# A~C열만 읽기
df = pd.read_excel("data.xlsx", usecols="A:C")
# 처음 3행 건너뛰고 읽기
df = pd.read_excel("data.xlsx", skiprows=3)
# 100행만 읽기
df = pd.read_excel("data.xlsx", nrows=100)
💡 핵심: read_csv()와 사용법이 거의 같으므로, CSV를 배웠다면 엑셀도 쉽게 다룰 수 있습니다.