딕셔너리로 데이터프레임 생성하기

30 P
QUESTION 01 #277
딕셔너리 데이터를 판다스 데이터프레임의 2차원 표 구조로 변환하는 프로그램입니다. 빈칸을 채워보세요.
main.py
import pandas as pd

# 딕셔너리로 원본 데이터 준비
data = {
    '이름': ['민수', '영희', '지우'],
    '나이': [15, 16, 15],
    '성적': ['A', 'B', 'A+']
}

# pd.DataFrame()을 사용하여 표로 변환합니다.
df = pd.(data)

print(df)
실행 결과 예시
   이름  나이  성적
0  민수  15   A
1  영희  16   B
2  지우  15  A+
INTERACTIVE SHELL Shift + Enter 로 즉시 실행

데이터프레임(DataFrame)이란?

데이터프레임은 판다스(Pandas)에서 제공하는 2차원 표(Table) 형태의 데이터 구조입니다. 엑셀의 시트와 비슷하다고 생각하면 됩니다.

딕셔너리 → 데이터프레임 변환 과정

data = {
    '이름': ['민수', '서희', '지연'],
    '나이': [15, 16, 15],
    '성적': ['A', 'B', 'A+']
}
df = pd.DataFrame(data)

딕셔너리의 Key가 열 이름, Value(리스트)가 각 열의 데이터가 됩니다.

딕셔너리 Key  →  열(Column) 이름
    ↓
  이름    나이   성적
0 민수    15     A      ← Value 리스트의 0번째
1 서희    16     B      ← Value 리스트의 1번째
2 지연    15     A+     ← Value 리스트의 2번째
↑
인덱스 (자동 부여)

데이터프레임의 구성 요소

구성 요소 설명 예시
행(Row) 가로 방향 데이터 민수의 정보 한 줄
열(Column) 세로 방향 데이터 이름, 나이, 성적
인덱스(Index) 행 번호 0, 1, 2 (자동)

판다스(Pandas)란?

Pandas"Panel Data"에서 유래한 이름으로, 파이썬에서 표 형태의 데이터를 다루는 데 특화된 라이브러리입니다.

비교 NumPy Pandas
주요 구조 배열(ndarray) 데이터프레임(DataFrame)
데이터 형태 숫자 배열 표(테이블)
열 이름 없음 있음
활용 분야 수치 계산 데이터 분석

💡 데이터 분석의 시작은 항상 데이터프레임을 만드는 것부터입니다.