Pandas는 정형 데이터를 사용하여 데이터프레임을 만들고 분석할 수 있도록 하는 Python 내의 모듈입니다.
오늘은 이 Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보도록 하겠습니다.
데이터프레임 생성
- 첫 번째 방법
import pandas as pd
data1 = {"연도": range(2000, 2005),
"성적": [90, 80, 70, 80, 85]}
df = pd.DataFrame(data1)
pandas 모듈의 DataFrame 함수 안에 딕셔너리를 삽입하여 데이터프레임을 만들 수 있습니다.
컬럼 명을 key 값에, 데이터를 value 값에 넣으면 됩니다.
출력 결과는 다음과 같습니다.
df

- 두 번째 방법
data2 = [[2000, 90], [2001, 80], [2002, 70], [2003, 80], [2004, 85]]
df = pd.DataFrame(data2, columns = ["연도", "성적"])
DataFrame 함수 안에 리스트를 넣고 컬럼 명을 따로 지정해 주는 방법도 있습니다.
각각의 행 데이터를 리스트 인 리스트 형식으로 대입하면 됩니다.
출력 결과는 위의 결과와 같습니다.
- csv 파일에서 데이터 받기
df = pd.read_csv("파일명.csv")
데이터가 들어있는 csv 파일이 있는 경우 read_csv 함수로 파일 내의 데이터를 데이터프레임으로 받을 수 있습니다.
csv 파일 내의 데이터가 pandas로 받기 어려운 형태인 경우 csv 파일 내의 데이터를 가져오기 쉽게 바꾸어줍시다.
오늘은 Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보았습니다.
코랩이나 주피터노트북으로 직접 실행해 보시길 바랍니다.
'정보 > 프로그래밍' 카테고리의 다른 글
[Pandas] 데이터프레임 정렬, 선택, 삭제 문법 및 사용법 정리 (0) | 2022.07.10 |
---|---|
[Pandas] 데이터프레임 탐색 문법 및 사용법 정리 (0) | 2022.07.05 |
[NumPy] 주요 기능 문법 및 사용법 정리 (0) | 2022.06.29 |
[Numpy] 주요 연산 문법 및 사용법 정리 (0) | 2022.06.28 |
[Numpy] 배열 생성 문법 및 사용법 정리 (0) | 2022.06.27 |