본문 바로가기

정보/수리통계

단순 선형회귀 모형에 관한 가정 (SR3~SR6)

오늘은 계량경제학 내의 단순 선형회귀 모형에 관한 나머지 가정들을 알아보도록 하겠습니다.

 

이전의 가정들을 정리해 놓은 포스팅은 밑의 링크에서 확인하실 수 있습니다.

https://bigdata-doctrine.tistory.com/38

 

[계량경제학] 단순 선형회귀 모형에 관한 가정 (SR1~SR2)

단순 선형회귀는 X의 변화에 따른 Y의 평균적인 변화를 알아볼 수 있는 좋은 도구입니다. 하지만, 그전에 자료 값들이 특정한 조건들을 만족하는지를 살펴보아야 합니다. 특정한 조건들을 만족

bigdata-doctrine.tistory.com

 

 

SR3 : 조건부 동분산


각각의 x값에 대한 무작위 오차항의 조건부 분산이 모두 동일하다는 가정입니다.

오차항은 각각의 x값에 대해 동일한 분산을 나타내야 합니다.

 

각각의 x값이 오차항의 분산에 영향을 미쳐서는 안 되기 때문입니다.

 

위의 식을 통해 다음과 같은 식을 도출할 수 있습니다.

β1 + β2xi는 x에 의해 값이 정해져버리므로 상수 취급되어 Var에서 제거할 수 있습니다.

 

이를 통해 모든 x에 대한 y의 조건부 분산이 동일하다는 것을 알 수 있습니다.

 

결론적으로 이는 회귀함수를 중심으로 한 각각의 x에 대한 y의 관측값들이  모두 동일하게 분포됨을 의미합니다.

 

예를 들어 각각의 경력 수준에 대한 임금의 변동이 모두 같은 수준일 것이라 가정하는 것과 같습니다.

 

 

SR4 : 조건부적으로 상관되지 않은 오차


동일한 지역에서 표본을 추출하는 경우, 혹은 시계열 자료에서 오차상관이 존재할 수 있습니다.

 

예를 들어 경력에 따른 임금의 변화를 알아보기 위해 동일한 지역에서만 표본을 추출할 경우, 경력 이외의 교육 수준이나 치안 상태 등의 오차항이 서로 상관관계를 가질 수 있습니다.

 

시계열 자료의 경우 이전의 충격이 다음 기(년)에도 영향을 미치는 경우가 대다수입니다.

 

이러한 것을 계량경제학에서는 계열상관 또는 자기상관이라고 합니다.

 

단순 선형회귀 분석의 경우 이러한 오차상관이 존재하지 않는다고 가정합니다.

 

 

SR5 : 설명변수는 변화해야만 한다


β2와 같은 모수를 추정하기 위해서는 x가 적어도 2개 이상이어야 합니다.

 

x가 1개일 경우 x의 변화에 따른 y의 평균적인 변화를 알 수 없습니다.

 

x의 상이한 값들이 많아질수록 회귀분석의 결과도 더 나아집니다.

 

 

SR6 : 오차정규성(선택적)


회귀분석을 시행하기 위해 무작위 오차가 조건부적으로 정규분포할 필요는 없습니다.

 

하지만, 나중에 모수의 값을 추정하거나 가설검정하는 것과 같이 통계적 추론을 하는데에 유용하게 사용할 수 있습니다.

 

중심극한정리에 따르면 무작위적인 요소들이 대체적으로 많이 존재하는 경우 정규분포를 따르는 경향이 있으므로 무작위 오차가 정규분포한다고 보는 것은 설득력이 있습니다. 

 

 


지금까지 계량경제학 내의 단순 선형회귀 모형에 관한 모든 가정들을 알아보았습니다.

 

어떤 자료를 회귀분석하기에 앞서 데이터가 이러한 가정들을 만족하는지를 알아보는 것은 매우 중요합니다.

 

그것들을 신경 쓰지 않을 경우 힘들게 한 분석이 유용하지 않아 무용지물이 될 수도 있기 때문입니다. 

 

이러한 가정들을 잘 생각하고 분석하시길 바랍니다.