본문 바로가기

Python

(12)
[Pandas] 데이터프레임 생성 문법 및 사용법 정리 Pandas는 정형 데이터를 사용하여 데이터프레임을 만들고 분석할 수 있도록 하는 Python 내의 모듈입니다. 오늘은 이 Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보도록 하겠습니다. 데이터프레임 생성 - 첫 번째 방법 import pandas as pd data1 = {"연도": range(2000, 2005), "성적": [90, 80, 70, 80, 85]} df = pd.DataFrame(data1) pandas 모듈의 DataFrame 함수 안에 딕셔너리를 삽입하여 데이터프레임을 만들 수 있습니다. 컬럼 명을 key 값에, 데이터를 value 값에 넣으면 됩니다. 출력 결과는 다음과 같습니다. df - 두 번째 방법 data2 = [[2000, 90], [2001, 80], ..
[NumPy] 주요 기능 문법 및 사용법 정리 오늘은 이전 시간에 설명드렸던 NumPy 모듈의 기능들 외의 주요한 기능들에 대해 설명해보겠습니다. 배열 변형, 배열 정보 확인, 특정 값 선택, 저장 등 이전 시간에는 다루지 않았지만 중요한 기능들입니다. 배열 정보 확인 import numpy as np arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8]]) #1 배열의 형태 확인 print(arr.shape) #print(np.shape(arr)) ## (2, 4) #2 배열의 데이터 타입 확인 print(arr.dtype) ## int64 shape 함수는 배열의 차원 구조를 나타냅니다. 위의 예시에서는 행렬 구조가 2행 4열임을 나타냅니다. dtype 함수는 배열의 데이터 타입을 나타냅니다. 위의 예시에서는 데이터 타입이..
[Numpy] 주요 연산 문법 및 사용법 정리 오늘은 NumPy의 기본 문법 중 많이 쓰이는 주요 연산 함수에 대해 알아보겠습니다. Numpy 배열의 연산은 리스트 연산과는 다르게 for문을 사용하지 않고 간단하게 연산할 수 있습니다. 예를 들어 NumPy 배열의 모든 수에 2를 곱하고 싶다면 NumPy배열 * 2를 코드로 작성하면 됩니다. 지금부터 NumPy 모듈의 주요 연산 함수에 대해서 알아봅시다. 사칙연산 import numpy as np arr = np.array([1, 2, 3, 4]) arr1 = np.array([5, 6, 7, 8]) # 덧셈 print(arr + arr1) #print(np.add(arr, arr1)) ## [ 6 8 10 12] # 뺄셈 print(arr1 - arr) #print(np.subtract(arr1, ..
[Numpy] 배열 생성 문법 및 사용법 정리 오늘은 행렬이나 다차원 배열의 연산을 쉽게 할 수 있도록 돕는 NumPy 모듈의 기본 문법과 사용법에 대해 정리해보도록 하겠습니다. NumPy 배열 연산의 특징으로는 적은 메모리를 사용하고 빠른 처리를 한다는 것이 있습니다. NumPy 배열의 장점은 기존의 리스트를 이용한 계산과는 다르게 for문을 사용하지 않고 간단하게 연산한다는 것입니다. 예를 들어 NumPy 배열의 모든 수에 1을 더하고 싶다면 단순히 NumPy 배열 + 1 을 코드로 작성하면 됩니다. (for문을 이용하여 하나하나 1을 더하고 다시 리스트에 저장하는 방식보다는 훨씬 빠르고 간단하죠?) 지금부터 NumPy 모듈의 기본 문법에 대해 알아보겠습니다. 초기화할 값 지정하여 배열 생성 import numpy as np a = np.arra..
[Python] 우리나라 실질 GDP와 실질 GDI의 차이에 대한 분석 오늘은 우리나라의 실질 GDP와 실질 GDI를 비교 분석하여 시각화해보겠습니다. 도출 방식이 이전 시간의 포스팅과 매우 유사하므로 기본적인 설명은 모두 제했습니다. 이해가 안 되는 부분이 있다면 이전 포스팅을 참고하시길 바랍니다. https://bigdata-doctrine.tistory.com/20 [Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문입니다. (아 bigdata-doctrine.tistory.com https://bigdata-doctrine.tistory.com/21 [Python] 우리..
[Python] 우리나라 GDP와 GNP의 차이에 대한 분석 https://bigdata-doctrine.tistory.com/20 [Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문입니다. (아 bigdata-doctrine.tistory.com 이전 시간에는 GDP와 GNP의 연도별 변화 추세와 두 지표 간의 차이에 대해 살펴보았습니다. 이번 시간에는 두 지표간 차이가 발생하는 이유에 대해 알아보겠습니다. 파이썬을 통해 분석하기에 앞서서 GDP와 GNP의 경제학적인 정의를 살펴봅시다. GDP란 국내총생산으로 일정 기간 동안 국내에서 생산된 최종 생산물의 가치를 ..
[Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문입니다. (아래에서 설명하겠지만 명목 GNP = 명목 GNI이지만 실질 GNP != 실질 GNI 이기 때문에 실질 데이터로 GNP를 구하려면 더 복잡합니다) 데이터는 ecos 한국은행 경제통계시스템에서 수집할 수 있습니다. https://ecos.bok.or.kr/ 한국은행경제통계시스템 ecos.bok.or.kr 데이터 수집 먼저 명목 GDP 데이터 부터 수집하도록 하겠습니다. 사이트의 검색창에 "국내총생산"을 입력하여 가장 첫 번째로 뜨는 "연간지표 > 국내총생산(명목, 원화표시)"를 클릭해 준 후 조회합니다. 연..
[Python] 몬테카를로 방법을 이용하여 원주율, 파이(π)값 구하기 오늘은 몬테카를로 방법을 이용하여 원주율, 파이(π)의 값을 구해보도록 하겠습니다. 몬테카를로 방법이란 무작위 추출된 난수를 이용하여 모델(함수)을 구하는 알고리즘을 부르는 용어입니다. 몬테카를로 방법은 금융, 물리학 등의 다양한 학문에서 사용됩니다. 2차 세계대전 중의 핵무기 개발 프로그램인 맨해튼 계획에 사용되었고 "몬테카를로 방법"이라는 이름 또한 맨해튼 계획 중에 붙여졌습니다. "몬테카를로"는 모나코의 유명한 도박의 도시인데 "몬테카를로 방법"의 무작위성과 연관이 있어 이 이름이 지금까지 내려져오고 있습니다. 이제부터 "몬테카를로 방법"의 가장 대표적인 예시인 원주율, 파이(π) 값 구하기 프로젝트를 시작합니다! 난수 생성 import random #1 import matplotlib.pyplot..

반응형