본문 바로가기

정보/프로그래밍

[Pandas] 데이터프레임 생성 문법 및 사용법 정리

Pandas는 정형 데이터를 사용하여 데이터프레임을 만들고 분석할 수 있도록 하는 Python 내의 모듈입니다.

 

오늘은 이 Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보도록 하겠습니다.

 

 

데이터프레임 생성


- 첫 번째 방법

import pandas as pd

data1 = {"연도": range(2000, 2005),
		"성적": [90, 80, 70, 80, 85]}
        
df = pd.DataFrame(data1)

pandas 모듈의 DataFrame 함수 안에 딕셔너리를 삽입하여 데이터프레임을 만들 수 있습니다.

 

컬럼 명을 key 값에, 데이터를 value 값에 넣으면 됩니다.

 

출력 결과는 다음과 같습니다.

df

생성된 데이터프레임

- 두 번째 방법

data2 = [[2000, 90], [2001, 80], [2002, 70], [2003, 80], [2004, 85]]
        
df = pd.DataFrame(data2, columns = ["연도", "성적"])

DataFrame 함수 안에 리스트를 넣고 컬럼 명을 따로 지정해 주는 방법도 있습니다.

 

각각의 행 데이터를 리스트 인 리스트 형식으로 대입하면 됩니다.

 

출력 결과는 위의 결과와 같습니다.

- csv 파일에서 데이터 받기

df = pd.read_csv("파일명.csv")

데이터가 들어있는 csv 파일이 있는 경우 read_csv 함수로 파일 내의 데이터를 데이터프레임으로 받을 수 있습니다.

 

csv 파일 내의 데이터가 pandas로 받기 어려운 형태인 경우 csv 파일 내의 데이터를 가져오기 쉽게 바꾸어줍시다. 

 


오늘은  Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보았습니다.

 

코랩이나 주피터노트북으로 직접 실행해 보시길 바랍니다.