본문 바로가기

정보

(25)
단순 선형회귀 모형에 관한 가정 (SR3~SR6) 오늘은 계량경제학 내의 단순 선형회귀 모형에 관한 나머지 가정들을 알아보도록 하겠습니다. 이전의 가정들을 정리해 놓은 포스팅은 밑의 링크에서 확인하실 수 있습니다. https://bigdata-doctrine.tistory.com/38 [계량경제학] 단순 선형회귀 모형에 관한 가정 (SR1~SR2) 단순 선형회귀는 X의 변화에 따른 Y의 평균적인 변화를 알아볼 수 있는 좋은 도구입니다. 하지만, 그전에 자료 값들이 특정한 조건들을 만족하는지를 살펴보아야 합니다. 특정한 조건들을 만족 bigdata-doctrine.tistory.com SR3 : 조건부 동분산 각각의 x값에 대한 무작위 오차항의 조건부 분산이 모두 동일하다는 가정입니다. 오차항은 각각의 x값에 대해 동일한 분산을 나타내야 합니다. 각각의 ..
단순 선형회귀 모형에 관한 가정 (SR1~SR2) 단순 선형회귀는 X의 변화에 따른 Y의 평균적인 변화를 알아볼 수 있는 좋은 도구입니다. 하지만, 그전에 자료 값들이 특정한 조건들을 만족하는지를 살펴보아야 합니다. 특정한 조건들을 만족하지 않는 자료 값들로 회귀 분석을 할 경우 분석의 결과는 유용하지 않을 수 있습니다. 지금부터 계량경제학 내의 단순 선형회귀 모형에 관한 가정들에 대해 알아보겠습니다. 개요 먼저 개략적으로 살펴보겠습니다. 가정들은 SR1~SR6로 이루어져 있으며, SR은 "Simple Rregresion", 즉 단순 선형회귀를 의미합니다. SR1 : 계량경제 모형 SR2 : 강 외생성 SR3 : 조건부 동분산 SR4 : 조건부적으로 상관되지 않은 오차 SR5 : 설명변수는 변화해야만 한다 SR6 : 오차 정규성(선택적) 하나하나 자세히..
[Python] ValueError: If using all scalar values, you must pass an index 간단 해결 방법 위의 오류가 떴다면 당신은 딕셔너리를 데이터프레임으로 만드는 과정에서 오류가 떴을 가능성이 높다. 오류의 내용은 데이터프레임의 모든 값이 스칼라 형태일 경우 인덱스 값을 입력해야 한다는 것이다. 스칼라란 1차원 데이터를 의미한다. 리스트로 감싸주면 2차원 데이터(벡터), 리스트 안에 또 리스트로 감싸주면 3차원 데이터(행렬)가 된다. 해결하기 위해서는 스칼라 형태를 바꾸든, 인덱스 값을 입력하든 하면 된다. 딕셔너리를 리스트로 감싸는 방법도 있다. 해결 방법 1. 인덱스 값 입력 >>> dic = {"A": "a", "B": "b", "C": "c", "D": "d"} >>> pd.DataFrame(dic, index=[0]) A B C D 0 a b c d 오류 메시지의 뜻대로 인덱스를 입력해 준다. ..
[Pandas] 데이터프레임 정렬, 선택, 삭제 문법 및 사용법 정리 오늘은 Pandas 모듈을 사용하여 데이터프레임을 정렬, 선택, 삭제하는 방법에 대해 알아보겠습니다. 데이터프레임 내의 데이터를 순서대로 정렬하고, 특정 데이터만 선택하고, 삭제할 수 있습니다. [데이터프레임 생성] df = pd.read_csv("stock_df.csv", encoding="CP949") df 먼저 외부에서 다운로드한 자료로 데이터프레임을 생성해보았습니다. 데이터프레임 정렬 [PER 오름차순 정렬] df.sort_values(by=["per"]) sort_values 함수를 통해 데이터를 순서대로 정렬할 수 있습니다. 함수 안의 by 변수를 통해 어떤 컬럼을 기준으로 정렬할지를 선택해 주셔야 제대로 정렬이 됩니다. [PER 내림차순 정렬] df.sort_values(by=["승차총승객수..
[Pandas] 데이터프레임 탐색 문법 및 사용법 정리 오늘은 Pandas 모듈을 사용하여 데이터프레임을 탐색하고 출력하는 방법에 대해 알아보겠습니다. 데이터프레임을 출력하는 것뿐만 아니라 각종 통계치를 확인하거나 정보를 확인할 수 있습니다. 데이터프레임 탐색 [데이터프레임 생성] import pandas as pd data1 = {"연도": range(2000, 2010), "성적": [90, 80, 70, 80, 85, 90, 75, 80, 90, 85]} df = pd.DataFrame(data1) 탐색하기에 앞서서 일단 간단한 데이터프레임을 만들어보았습니다. [앞의 행 출력] df.head() head 함수를 통해 맨 위 행부터 5개의 행을 출력할 수 있습니다. 괄호 안에 숫자를 넣으면 맨 위 행부터 입력한 숫자만큼의 행을 출력합니다. [뒤의 행 출력..
[SQL] SQL에 대한 기본적인 이해 오늘은 SQL에 대한 기본적인 내용에 대하여 글을 작성해보도록 하겠습니다. SQL은 Structured Query Language의 약자로 관계형 데이터베이스(RDBMS)를 다루기 위해 사용하는 언어입니다. 관계형 데이터베이스(RDBMS)란 키(Key)와 값(Value)들의 관계를 테이블화하여 간단하게 표시한 데이터베이스입니다. 우리가 흔히 쓰는 엑셀이나 한셀을 생각하시면 될 것 같습니다. 관계형 데이터베이스(RDBMS) 주요 용어 Row(행, 튜플) : 2차원 구조를 가진 테이블에서 가로 방향으로 이루어진 데이터 집합 Column(열, attribute) : 2차원 구조를 가진 테이블에서 세로 방향으로 이루어진 데이터 집합 Field : Row와 Column이 겹치는 하나의 공간 Primary Key(..
[Pandas] 데이터프레임 생성 문법 및 사용법 정리 Pandas는 정형 데이터를 사용하여 데이터프레임을 만들고 분석할 수 있도록 하는 Python 내의 모듈입니다. 오늘은 이 Pandas를 사용하여 데이터프레임을 생성하는 방법을 정리해 보도록 하겠습니다. 데이터프레임 생성 - 첫 번째 방법 import pandas as pd data1 = {"연도": range(2000, 2005), "성적": [90, 80, 70, 80, 85]} df = pd.DataFrame(data1) pandas 모듈의 DataFrame 함수 안에 딕셔너리를 삽입하여 데이터프레임을 만들 수 있습니다. 컬럼 명을 key 값에, 데이터를 value 값에 넣으면 됩니다. 출력 결과는 다음과 같습니다. df - 두 번째 방법 data2 = [[2000, 90], [2001, 80], ..
[NumPy] 주요 기능 문법 및 사용법 정리 오늘은 이전 시간에 설명드렸던 NumPy 모듈의 기능들 외의 주요한 기능들에 대해 설명해보겠습니다. 배열 변형, 배열 정보 확인, 특정 값 선택, 저장 등 이전 시간에는 다루지 않았지만 중요한 기능들입니다. 배열 정보 확인 import numpy as np arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8]]) #1 배열의 형태 확인 print(arr.shape) #print(np.shape(arr)) ## (2, 4) #2 배열의 데이터 타입 확인 print(arr.dtype) ## int64 shape 함수는 배열의 차원 구조를 나타냅니다. 위의 예시에서는 행렬 구조가 2행 4열임을 나타냅니다. dtype 함수는 배열의 데이터 타입을 나타냅니다. 위의 예시에서는 데이터 타입이..

반응형