본문 바로가기

전체 글

(44)
[SQL] SQL에 대한 기본적인 이해 오늘은 SQL에 대한 기본적인 내용에 대하여 글을 작성해보도록 하겠습니다. SQL은 Structured Query Language의 약자로 관계형 데이터베이스(RDBMS)를 다루기 위해 사용하는 언어입니다. 관계형 데이터베이스(RDBMS)란 키(Key)와 값(Value)들의 관계를 테이블화하여 간단하게 표시한 데이터베이스입니다. 우리가 흔히 쓰는 엑셀이나 한셀을 생각하시면 될 것 같습니다. 관계형 데이터베이스(RDBMS) 주요 용어 Row(행, 튜플) : 2차원 구조를 가진 테이블에서 가로 방향으로 이루어진 데이터 집합 Column(열, attribute) : 2차원 구조를 가진 테이블에서 세로 방향으로 이루어진 데이터 집합 Field : Row와 Column이 겹치는 하나의 공간 Primary Key(..
[Pandas] 데이터프레임 생성 문법 및 사용법 정리 Pandas는 정형 데이터를 사용하여 데이터프레임을 만들고 분석할 수 있도록 하는 Python 내의 모듈입니다. 오늘은 이 Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보도록 하겠습니다. 데이터프레임 생성 - 첫 번째 방법 import pandas as pd data1 = {"연도": range(2000, 2005), "성적": [90, 80, 70, 80, 85]} df = pd.DataFrame(data1) pandas 모듈의 DataFrame 함수 안에 딕셔너리를 삽입하여 데이터프레임을 만들 수 있습니다. 컬럼 명을 key 값에, 데이터를 value 값에 넣으면 됩니다. 출력 결과는 다음과 같습니다. df - 두 번째 방법 data2 = [[2000, 90], [2001, 80], ..
[NumPy] 주요 기능 문법 및 사용법 정리 오늘은 이전 시간에 설명드렸던 NumPy 모듈의 기능들 외의 주요한 기능들에 대해 설명해보겠습니다. 배열 변형, 배열 정보 확인, 특정 값 선택, 저장 등 이전 시간에는 다루지 않았지만 중요한 기능들입니다. 배열 정보 확인 import numpy as np arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8]]) #1 배열의 형태 확인 print(arr.shape) #print(np.shape(arr)) ## (2, 4) #2 배열의 데이터 타입 확인 print(arr.dtype) ## int64 shape 함수는 배열의 차원 구조를 나타냅니다. 위의 예시에서는 행렬 구조가 2행 4열임을 나타냅니다. dtype 함수는 배열의 데이터 타입을 나타냅니다. 위의 예시에서는 데이터 타입이..
[Numpy] 주요 연산 문법 및 사용법 정리 오늘은 NumPy의 기본 문법 중 많이 쓰이는 주요 연산 함수에 대해 알아보겠습니다. Numpy 배열의 연산은 리스트 연산과는 다르게 for문을 사용하지 않고 간단하게 연산할 수 있습니다. 예를 들어 NumPy 배열의 모든 수에 2를 곱하고 싶다면 NumPy배열 * 2를 코드로 작성하면 됩니다. 지금부터 NumPy 모듈의 주요 연산 함수에 대해서 알아봅시다. 사칙연산 import numpy as np arr = np.array([1, 2, 3, 4]) arr1 = np.array([5, 6, 7, 8]) # 덧셈 print(arr + arr1) #print(np.add(arr, arr1)) ## [ 6 8 10 12] # 뺄셈 print(arr1 - arr) #print(np.subtract(arr1, ..
[Numpy] 배열 생성 문법 및 사용법 정리 오늘은 행렬이나 다차원 배열의 연산을 쉽게 할 수 있도록 돕는 NumPy 모듈의 기본 문법과 사용법에 대해 정리해보도록 하겠습니다. NumPy 배열 연산의 특징으로는 적은 메모리를 사용하고 빠른 처리를 한다는 것이 있습니다. NumPy 배열의 장점은 기존의 리스트를 이용한 계산과는 다르게 for문을 사용하지 않고 간단하게 연산한다는 것입니다. 예를 들어 NumPy 배열의 모든 수에 1을 더하고 싶다면 단순히 NumPy 배열 + 1 을 코드로 작성하면 됩니다. (for문을 이용하여 하나하나 1을 더하고 다시 리스트에 저장하는 방식보다는 훨씬 빠르고 간단하죠?) 지금부터 NumPy 모듈의 기본 문법에 대해 알아보겠습니다. 초기화할 값 지정하여 배열 생성 import numpy as np a = np.arra..
[Python] 리스크 변화에 따른 수익률 변화 회귀 분석 오늘은 올웨더 포트폴리오 종목인 주식, 중기채, 장기채, 금, 원자재의 5가지 etf로 구성된 효율적 투자선을 통해 리스크 변화에 따른 수익률의 변화를 회귀분석으로 분석해보겠습니다. 이전 포스팅에서 이미 효율적 투자선을 시각화하고 분석해보았기 때문에 이전에 썼던 코드를 그대로 가져왔습니다. 효율적 투자선을 시각화하는 프로젝트는 밑의 포스팅을 참고하시길 바랍니다. https://bigdata-doctrine.tistory.com/12 [Python] (3)올웨더 기반 효율적 투자선 구현 : 시각화 https://bigdata-doctrine.tistory.com/10 [Python] (1)올웨더 기반 효율적 투자선 구현 : 데이터 수집 이번 프로젝트는 효율적 투자선을 파이썬을 통하여 시각화를 해 보는 것입..
데이터 분석 청년인재 양성사업 서류, 면접 합격 후기 대학교 공지사항에 데이터 분석 청년인재 양성사업 모집자 공고가 올라온 것을 우연히 보게 되었다. 평소에 데이터 분석에 관심이 많던 터라 좋은 경험이겠다 싶어 지원해보았다. (거기다가 돈도 주니..) 이 사업을 간단히 설명하자면 NIA와 행정안전부에서 주최한 사업으로 2달여간 모집자들을 대상으로 데이터 분석에 관한 교육을 시켜주고 공공기관이나 행정기관에서 관련 분야로 일 경험 기회를 주는 것이다. 이전 년도까지는 공공 빅데이터분석 청년인재 양성사업과 공공데이터 청년인턴이라는 이름의 두가지 사업이 있었다. (이름을 왜 이렇게 구별하기 헷갈리게 지었는지 모르겠다) 공공 빅데이터 분석 청년인재 양성사업이 공공데이터 청년인턴보다 좀 더 전문적인 교육과 일을 수행하고 뽑는 인원도 더 적다. (2021년 전자는 10..
[Python] 통화량에 따른 물가의 변화 선형회귀 분석 화폐수량설에 따르면 통화량 변화는 물가에 영향을 미치고 통화량 증가율과 물가상승률은 1대 1 관계를 가집니다. 그렇다면 현실세계에서도 화폐수량설 이론과 같은 결과가 나올까요? 오늘은 우리나라의 통화량 지표(M2)와 물가 지표(GDP 디플레이터)를 가지고 둘의 선형 관계를 분석해보겠습니다. 코드에 대한 자세한 설명은 생략했습니다. 자세한 설명을 보고 싶으시면 이전 포스팅을 참고해주세요. https://bigdata-doctrine.tistory.com/20 [Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문..

반응형