패널회귀분석의 기초 (FE vs RE)
POLS: pooled OLSPermalink
$\quad y_{it} = X_{it} \beta + \epsilon_{it}$
기본적인 한계점 : 개체 구분 정보를 활용하지 못함Permalink
계수추정에 있어 $X$ 와 $\epsilon$ 의 확률적 관계가Permalink
- 독립적: $E[\epsilon \mid X] = 0 \quad \Rightarrow \quad \hat\beta_{OLS}$ 는 비편향
- 비상관(선형적 독립): $E[X \epsilon] = 0 \quad \Rightarrow \quad \hat\beta_{OLS}$ 는 일관적
- 상관 있으면 추정 곤란 $\Rightarrow$ 다른 방법 필요 : 패널, 도구변수 등
검정을 위해 오차항 분산구조 추론 필요Permalink
- 개체간 독립 가정은 무난하나 개체내 독립 가정은 곤란
- 개체내 시계열상관 가정 $\Rightarrow$ 클러스터 분산 추정
- 이 때 클러스터 수(개체 수)가 많을수록 정확한 추정 가능
- 동일 시간대 개체간 상관 추가 가정 $\Rightarrow$ 이중 클러스터
- 이 때는 년도 클러스터 수도 많아야 정확한 추정 가능
미관측 개별효과 모형:Permalink
$\quad y_{it} = \alpha + \beta x_{it} + \lambda_i + \epsilon_{it}$
$\lambda_i$ : 관측되지 않는 개별효과Permalink
- POLS 추정하면 오차항에 포함됨
- $x_i$ 와 상관 있으면 일관 추정 안됨
- 해결 방법 : 제거 : FE(fixed effect)
- $x_i$ 와 상관 없으면 일관 추정 가능하나 비효율적
- 해결 방법 : GLS 변환 : RE(random effect)
- $x_i$ 와 상관 있으면 일관 추정 안됨
- 참고 : FE/RE 명칭
- 고정/확률 효과 명명은 오해 소지
- FE 강점 : robust
- RE 강점 : efficient, 더미 등 시간불변변수 처리 가능
개별효과와 설명변수 사이에 상관 있는 것이 보통이므로Permalink
- FE 모형 사용하는 경우가 많음
- 만약 시간불변변수 분석이 중요하면 도구변수 방법론 필요
- 참고: 권세훈-한상범(2013)
FE (fixed effect) 모형의 방법론Permalink
FE 추정량은 within estimator 라고도 함Permalink
-
핵심 : 개별효과 $\lambda_i$ 제거 후 POLS
-
원래 회귀식 $y_{it} = \alpha + \beta x_{it} + \lambda_i + \epsilon_{it}$ 에
-
평균 회귀식 ${\bar y}_i = \alpha + \beta {\bar x}_i + \lambda_i + {\bar \epsilon}_i$ 을 차감해
- 즉 ${\dot y}_{it} = \beta {\dot x}_{it} + {\dot \epsilon}_{it}$ 를 POLS
- $\hat \alpha$ 는 $y_{it} - \hat\beta x_{it}$ 의 평균으로 추정
-
-
참고 : $\lambda_i$ 제거 방식으로는 FD(first difference)도 가능
-
1차 시간차분 후 POLS
-
즉 ${\Delta y}_{it} = \alpha_o + \beta {\Delta x}_{it} + {\Delta\epsilon}_{it}$ 를 POLS
-
시간 순서 정보를 활용한다는 장점 있으나
-
설명변수 $\Delta x$ 의 변동성 저하와
-
오차항 $\Delta\epsilon$ 의 시간상관 등을 추가 고려해야 함
-
-
참고: Between vs. Within estimatorPermalink
Between estimatorPermalink
-
회귀식을 개체별 (시간)평균한 평균회귀식, 즉
-
${\bar y}_i = \beta {\bar x}_i + \lambda_i + {\bar \epsilon}_i$에서
-
$\lambda_i$ 대신 $\alpha$ 를 대입하여 OLS 추정
-
즉 ${\bar y}_i = \alpha + \beta {\bar x}_i + {\bar \epsilon}_i$ 추정
-
-
이 방법은 $\lambda_i$ 를 제거하지 못하고 임의로 $\alpha$ 로 치환
-
이론적으로 적절한 방법이 아님
-
오차항에 개별효과가 포함되어 $x$ 변수와 상관관계 발생
-
이런 경우는 확률효과(RE: random effect) 모형이 더 적절함
-
RE (random effect) 모형의 방법론Permalink
-
$\lambda_i$ 와 $x_i$ 사이에 상관관계 없다는 가정함
- 이 경우 FE 추정은 비효율적
-
효율적인 추정 위해 GLS
-
개별효과 포함 오차항을 $w_{it} = \lambda_i + \epsilon_{it}$ 라고 하면
-
계열상관계수 $= Corr[w_{is}, w_{it}] = \frac{\sigma^2_\lambda}{\sigma^2_\lambda \, + \, \sigma^2_\epsilon}$
-
GLS 변환 계수 $ \ \gamma =$
- $ \ 1 - \sqrt{ \frac{\sigma_\epsilon^2}{\sigma_\epsilon^2 \, + \, T\sigma^2_\lambda} } \quad$ 또는
- $ \ 1 - \sqrt{ \frac{1}{1 \, + \, T\kappa} } \quad$ : 단, $ \ \kappa = \frac{\sigma_\lambda^2}{\sigma_\epsilon^2}$
-
즉 원래 회귀식에서 평균회귀식에 $\gamma$ 곱한 만큼 차감하여 POLS
-
$\gamma$ 는 0 과 1 사이 값이므로 평균을 부분 차감하여 POLS
-
따라서 FE 는 $\gamma = 1$ 인 RE 로도 해석 가능
-
-
-
더 구체적인 내용은 RE 추정 방법 참고