본문 바로가기

전체 글

(44)
[Python] 우리나라 실질 GDP와 실질 GDI의 차이에 대한 분석 오늘은 우리나라의 실질 GDP와 실질 GDI를 비교 분석하여 시각화해보겠습니다. 도출 방식이 이전 시간의 포스팅과 매우 유사하므로 기본적인 설명은 모두 제했습니다. 이해가 안 되는 부분이 있다면 이전 포스팅을 참고하시길 바랍니다. https://bigdata-doctrine.tistory.com/20 [Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문입니다. (아 bigdata-doctrine.tistory.com https://bigdata-doctrine.tistory.com/21 [Python] 우리..
[Python] 우리나라 GDP와 GNP의 차이에 대한 분석 https://bigdata-doctrine.tistory.com/20 [Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문입니다. (아 bigdata-doctrine.tistory.com 이전 시간에는 GDP와 GNP의 연도별 변화 추세와 두 지표 간의 차이에 대해 살펴보았습니다. 이번 시간에는 두 지표간 차이가 발생하는 이유에 대해 알아보겠습니다. 파이썬을 통해 분석하기에 앞서서 GDP와 GNP의 경제학적인 정의를 살펴봅시다. GDP란 국내총생산으로 일정 기간 동안 국내에서 생산된 최종 생산물의 가치를 ..
[Python] 우리나라의 GDP와 GNP의 연도별 변화추세 오늘은 1961년부터 2021년까지의 우리나라의 명목 GNP와 명목 GDP 데이터를 살펴보고 그 차이에 대해 관찰해보겠습니다. 명목 데이터를 사용하는 이유는 사이트에 GNP 데이터가 없기 때문입니다. (아래에서 설명하겠지만 명목 GNP = 명목 GNI이지만 실질 GNP != 실질 GNI 이기 때문에 실질 데이터로 GNP를 구하려면 더 복잡합니다) 데이터는 ecos 한국은행 경제통계시스템에서 수집할 수 있습니다. https://ecos.bok.or.kr/ 한국은행경제통계시스템 ecos.bok.or.kr 데이터 수집 먼저 명목 GDP 데이터 부터 수집하도록 하겠습니다. 사이트의 검색창에 "국내총생산"을 입력하여 가장 첫 번째로 뜨는 "연간지표 > 국내총생산(명목, 원화표시)"를 클릭해 준 후 조회합니다. 연..
[Python] 셀레니움으로 100대 통계지표 크롤링하기 오늘은 셀레니움을 사용하여 100대 통계지표를 크롤링해보겠습니다. 오늘 우리가 크롤링해보려는 사이트는 이곳입니다. https://ecos.bok.or.kr/jsp/vis/keystat/#/key 100대 통계지표 ecos.bok.or.kr 한국은행 경제통계시스템의 "한눈에 보는 우리나라 100대 통계지표"입니다. 통계지표 중 가장 중요한 100개의 통계 자료를 뽑아 한눈에 보기 좋게 정리해놓은 사이트입니다. 셀레니움으로 크롤링을 시도하기 전 requests랑 BeautifulSoup로 크롤링을 시도해보았으나 실패했습니다. 동적 데이터의 경우 requests와 BeautifulSoup로 크롤링을 하는 것이 불가능합니다. 단순히 웹서버에 이미 저장되어 있는 데이터를 요청하여 받아오는 경우 이는 정적인 요소이..
제 5회 뱅키스 대학생 모의투자대회 신청, 거래 방법 한국투자증권에서 대학생 모의투자대회를 개최하였습니다. 참가대상은 한국투자증권 뱅키스 계좌를 보유한 대학(원)생, 휴학생입니다. 참가기간은 2022년 3월 7일부터 2022년 5월 1일이고 대회기간은 2022년 3월 21일부터 2022년 5월 13일까지입니다. 최종 수상자 발표일은 2022년 5월 23일입니다. 장학금 혜택의 경우 1위 300만원+상장, 2위 200만원+상장, 3위 100만원+상장, 4~10위 30만원+상장, 11~50위 10만원, 51위~100위 5만원입니다. 이 외에도 국내/해외 리그별 각각 1~5위에게는 공채 서류 전형 통과 기회가 주어지고 매매체결, 출첵, 대회 참가 학생이 가장 많은 2개 학교 등에 기프티콘과 같은 혜택이 주어지니 관심이 있으신 분은 참여해보시길 바랍니다. 모바일 ..
[Python] 공공데이터포털 API 사용하여 데이터 수집하기 이전 시간에 공공데이터포털에서 인증키를 받아 XML파일을 열어보는 것까지 진행하였습니다. 이번 포스팅을 읽기 전에 이전 포스팅을 보고 오시는 것을 추천드립니다. https://bigdata-doctrine.tistory.com/16 공공데이터포털 오픈 API 사용법 : 인증키 생성, XML 파일 접속 데이터를 수집하는 방법에는 여러 가지가 있습니다. 그중 하나는 직접 크롤링하는 것이고 하나는 오픈 API를 사용하여 크롤링하는 것입니다. 직접 크롤링을 하는 경우에는 여러 문제가 발생할 bigdata-doctrine.tistory.com 이번 시간에는 파이썬을 활용하여 공공데이터포털의 국토교통부 아파트매매 실거래자료 데이터를 데이터프레임에 저장하고 시각화를 통해 간단한 분석을 하도록 하겠습니다. 데이터 수집..
공공데이터포털 오픈 API 사용법 : 인증키 생성, XML 파일 접속 데이터를 수집하는 방법에는 여러 가지가 있습니다. 그중 하나는 직접 크롤링하는 것이고 하나는 오픈 API를 사용하여 크롤링하는 것입니다. 직접 크롤링을 하는 경우에는 여러 문제가 발생할 수 있습니다. 관리자가 외부 접속자는 크롤링을 하지 못하도록 막아 둘 수 있고 만약에 현재 크롤링이 된다고 하더라도 미래에도 같은 방식으로 데이터를 가져올 수 있을지 확신할 수 없습니다. 또한 크롤링을 통해 과도한 트래픽을 일으키거나 수익 창출을 한다면 IP주소가 차단되고 처벌을 받을 수도 있습니다. 우리나라의 경우 "여기어때" 플랫폼에서 "야놀자"의 숙박정보를 무단으로 크롤링해가서 소송을 당한 경우가 있습니다. 하지만 오픈 API를 사용한다면 말이 달라집니다. 오픈 API는 관리자가 관리하고 있는 데이터를 누구나 쓸 수..
[Python] 몬테카를로 방법을 이용하여 원주율, 파이(π)값 구하기 오늘은 몬테카를로 방법을 이용하여 원주율, 파이(π)의 값을 구해보도록 하겠습니다. 몬테카를로 방법이란 무작위 추출된 난수를 이용하여 모델(함수)을 구하는 알고리즘을 부르는 용어입니다. 몬테카를로 방법은 금융, 물리학 등의 다양한 학문에서 사용됩니다. 2차 세계대전 중의 핵무기 개발 프로그램인 맨해튼 계획에 사용되었고 "몬테카를로 방법"이라는 이름 또한 맨해튼 계획 중에 붙여졌습니다. "몬테카를로"는 모나코의 유명한 도박의 도시인데 "몬테카를로 방법"의 무작위성과 연관이 있어 이 이름이 지금까지 내려져오고 있습니다. 이제부터 "몬테카를로 방법"의 가장 대표적인 예시인 원주율, 파이(π) 값 구하기 프로젝트를 시작합니다! 난수 생성 import random #1 import matplotlib.pyplot..

반응형