본문 바로가기

정보/수리통계

단순 선형회귀 모형에 관한 가정 (SR1~SR2)

단순 선형회귀는 X의 변화에 따른 Y의 평균적인 변화를 알아볼 수 있는 좋은 도구입니다.

 

하지만, 그전에 자료 값들이 특정한 조건들을 만족하는지를 살펴보아야 합니다.

 

특정한 조건들을 만족하지 않는 자료 값들로 회귀 분석을 할 경우 분석의 결과는 유용하지 않을 수 있습니다.

 

지금부터 계량경제학 내의 단순 선형회귀 모형에 관한 가정들에 대해 알아보겠습니다.

 

 

개요


먼저 개략적으로 살펴보겠습니다. 가정들은 SR1~SR6로 이루어져 있으며, SR은 "Simple Rregresion", 즉 단순 선형회귀를 의미합니다. 

  1. SR1 : 계량경제 모형
  2. SR2 : 강 외생성
  3. SR3 : 조건부 동분산
  4. SR4 : 조건부적으로 상관되지 않은 오차
  5. SR5 : 설명변수는 변화해야만 한다
  6. SR6 : 오차 정규성(선택적)

하나하나 자세히 알아봅시다.

 

 

SR1 : 계량경제 모형


 

x와 y로 이루어진 각각의 자료 쌍들은 모든 다른 자료 쌍들과 통계적으로 독립적이고, 동일하게 분포되어야 합니다. 즉 i.i.d.(independently and identically distributed)여야 합니다.
 
통계적으로 독립적이어야 한다는 말은 어떤 한 자료 쌍이 표본으로 추출되었을 때, 그것이 다른 자료 쌍의 값에 영향을 미치면 안된다는 것입니다.
 
또 하나는 동일하게 분포되어야 한다는 것인데 각각의 자료 쌍들이 표본으로 추출될 확률, 즉 모든 자료 쌍들의 결합확률질량함수가 같아야한다는 것입니다.
 
i.i.d.가 만족될 경우 관측할 수 있는 자료 쌍들은 다음의 식을 따를 수 있습니다.
 
 
위의 식은 x와 y가 선형 관계에 있음을 나타냅니다. 즉, 위의 함수를 좌표 평면 상에 그리면 직선의 형태를 보입니다.
 
베타는 우리가 추정해야 하는 모수이고, e오차항입니다.

 

위의 식을 경제학에서 선형회귀 분석을 위해 나타낼 때, 계량경제 모형이라고 하고 이러한 선형적인 계량경제 모형이 모든 관측치 쌍에 적용된다고 가정합니다.

 

 

SR2 : 강 외생성


변수가 외생적이라는 것은 변수가 모형 밖에서 결정된다는 것, 내생적이라는 것은 변수가 모형 안에서 결정된다는 것입니다.
 
모형 안의 오차항과 같은 다른 항이 변수에 영향을 주게 된다면 그 변수는 내생변수가 될 것입니다.
 
강 외생성 가정이란 오차항의 값을 예측하기 위해 x값이 사용될 수 없다는 가정입니다. 오차항을 예측할 수 없기 때문에 무작위 오차항이라고 합니다.
 
예를 들어, 경력에 따른 근로자 임금의 변화에 대한 회귀분석을 진행한다고 했을 때, 여기서 오차항에 근로자의 능력이 영향을 미칠 가능성이 높습니다.

 

그런데, 직관적으로 생각해보면 대체적으로 근로자의 경력이 증가할 수록 능력 또한 올라갈 것입니다. 
 
위의 예시에서 근로자의 경력(x변수)으로 능력(오차항)을 쉽게 예측할 수 있을 것이라고 판단할 수 있습니다.
 
따라서 근로자의 경력은 위의 회귀식에서 내생적 변수이므로, 강 외생성에 대한 가정이 준수되지 못했다고 주장할 수도 있습니다.
 
위의 가정은 다시 말하면 무작위 오차항에 대한 조건부 평균이 0이라고 말하는 것과 같습니다. 
 
x값이 주어진 경우 무작위 오차가 0이 될 것이라고 예측하는 것 보다 더 나은 예측이 불가능하기 때문입니다.
 

 

위의 조건이 만족할 경우 설명변수 x는 강하게 외생적, 즉 강 외생적이라고 합니다.

 

위의 식은 또다시 두 가지 의미를 갖습니다. 
 

1. 무작위 오차항의 무조건부 기댓값 또한 0이 된다.

 

 

모든 x값에 대한 무작위 오차항의 조건부 평균이 0이기 때문에 무조건부 기댓값 또한 0이 됩니다.

 

 

2. 무작위 오차항과 그에 상응하는 관찰값 x의 공분산이 0이 된다.

 

 

x값으로 오차항을 예측할 수 없다는 것은 둘 사이의 상관관계가 0, 즉 공분산이 0이라는 말과 같습니다.

위의 조건이 만족할 경우 설명변수 x는 외생적이라고 합니다. 이 전에 말한 강 외생적이라는 표현보다 약한 표현입니다.

 

위의 두 성질 중 하나라도 참이 아니면 강 외생성 가정은 만족하지 않습니다.

 

강 외생성 가정이 만족할 경우 다음과 같은 회귀 함수를 도출할 수 있습니다.

 

회귀함수
회귀 함수

 

위의 식은 x의 값이 주어졌을 때의 y의 (조건부) 평균을 나타내는 식입니다.

 

위의 식을 통해 x가 Δx만큼 변할 때, y의 (조건부) 평균값이 β2 x Δx만큼 변화한다고 말할 수 있습니다.

 

회귀함수
회귀 함수

 


지금까지 계량경제학 내의 단순 선형회귀 모형에 관한 두 가지 가정들에 대해 알아보았습니다.

 

다음 시간에는 나머지 가정들을 살펴보는 시간을 갖도록 하겠습니다.