10 분 소요

POLS: pooled OLSPermalink

$\quad y_{it} = X_{it} \beta + \epsilon_{it}$

기본적인 한계점 : 개체 구분 정보를 활용하지 못함Permalink

계수추정에 있어 $X$ 와 $\epsilon$ 의 확률적 관계가Permalink

  • 독립적: $E[\epsilon \mid X] = 0 \quad \Rightarrow \quad \hat\beta_{OLS}$ 는 비편향
  • 비상관(선형적 독립): $E[X \epsilon] = 0 \quad \Rightarrow \quad \hat\beta_{OLS}$ 는 일관적
  • 상관 있으면 추정 곤란 $\Rightarrow$ 다른 방법 필요 : 패널, 도구변수 등

검정을 위해 오차항 분산구조 추론 필요Permalink

  • 개체간 독립 가정은 무난하나 개체내 독립 가정은 곤란
  • 개체내 시계열상관 가정 $\Rightarrow$ 클러스터 분산 추정
    • 이 때 클러스터 수(개체 수)가 많을수록 정확한 추정 가능
  • 동일 시간대 개체간 상관 추가 가정 $\Rightarrow$ 이중 클러스터
    • 이 때는 년도 클러스터 수도 많아야 정확한 추정 가능

미관측 개별효과 모형:Permalink

$\quad y_{it} = \alpha + \beta x_{it} + \lambda_i + \epsilon_{it}$

$\lambda_i$ : 관측되지 않는 개별효과Permalink

  • POLS 추정하면 오차항에 포함됨
    • $x_i$ 와 상관 있으면 일관 추정 안됨
      • 해결 방법 : 제거 : FE(fixed effect)
    • $x_i$ 와 상관 없으면 일관 추정 가능하나 비효율적
      • 해결 방법 : GLS 변환 : RE(random effect)
  • 참고 : FE/RE 명칭
    • 고정/확률 효과 명명은 오해 소지
    • FE 강점 : robust
    • RE 강점 : efficient, 더미 등 시간불변변수 처리 가능

개별효과와 설명변수 사이에 상관 있는 것이 보통이므로Permalink

  • FE 모형 사용하는 경우가 많음
  • 만약 시간불변변수 분석이 중요하면 도구변수 방법론 필요

FE (fixed effect) 모형의 방법론Permalink

FE 추정량은 within estimator 라고도 함Permalink

  • 핵심 : 개별효과 $\lambda_i$ 제거 후 POLS

    • 원래 회귀식 $y_{it} = \alpha + \beta x_{it} + \lambda_i + \epsilon_{it}$ 에

    • 평균 회귀식 ${\bar y}_i = \alpha + \beta {\bar x}_i + \lambda_i + {\bar \epsilon}_i$ 을 차감해

      • 즉 ${\dot y}_{it} = \beta {\dot x}_{it} + {\dot \epsilon}_{it}$ 를 POLS
      • $\hat \alpha$ 는 $y_{it} - \hat\beta x_{it}$ 의 평균으로 추정
  • 참고 : $\lambda_i$ 제거 방식으로는 FD(first difference)도 가능

    • 1차 시간차분 후 POLS

    • 즉 ${\Delta y}_{it} = \alpha_o + \beta {\Delta x}_{it} + {\Delta\epsilon}_{it}$ 를 POLS

    • 시간 순서 정보를 활용한다는 장점 있으나

      • 설명변수 $\Delta x$ 의 변동성 저하와

      • 오차항 $\Delta\epsilon$ 의 시간상관 등을 추가 고려해야 함

참고: Between vs. Within estimatorPermalink

Between estimatorPermalink

  • 회귀식을 개체별 (시간)평균한 평균회귀식, 즉

    • ${\bar y}_i = \beta {\bar x}_i + \lambda_i + {\bar \epsilon}_i$에서

    • $\lambda_i$ 대신 $\alpha$ 를 대입하여 OLS 추정

    • 즉 ${\bar y}_i = \alpha + \beta {\bar x}_i + {\bar \epsilon}_i$ 추정

  • 이 방법은 $\lambda_i$ 를 제거하지 못하고 임의로 $\alpha$ 로 치환

    • 이론적으로 적절한 방법이 아님

    • 오차항에 개별효과가 포함되어 $x$ 변수와 상관관계 발생

    • 이런 경우는 확률효과(RE: random effect) 모형이 더 적절함

RE (random effect) 모형의 방법론Permalink

  • $\lambda_i$ 와 $x_i$ 사이에 상관관계 없다는 가정함

    • 이 경우 FE 추정은 비효율적
  • 효율적인 추정 위해 GLS

    • 개별효과 포함 오차항을 $w_{it} = \lambda_i + \epsilon_{it}$ 라고 하면

    • 계열상관계수 $= Corr[w_{is}, w_{it}] = \frac{\sigma^2_\lambda}{\sigma^2_\lambda \, + \, \sigma^2_\epsilon}$

    • GLS 변환 계수 $ \ \gamma =$

      • $ \ 1 - \sqrt{ \frac{\sigma_\epsilon^2}{\sigma_\epsilon^2 \, + \, T\sigma^2_\lambda} } \quad$ 또는
      • $ \ 1 - \sqrt{ \frac{1}{1 \, + \, T\kappa} } \quad$ : 단, $ \ \kappa = \frac{\sigma_\lambda^2}{\sigma_\epsilon^2}$
    • 즉 원래 회귀식에서 평균회귀식에 $\gamma$ 곱한 만큼 차감하여 POLS

      • $\gamma$ 는 0 과 1 사이 값이므로 평균을 부분 차감하여 POLS

      • 따라서 FE 는 $\gamma = 1$ 인 RE 로도 해석 가능

  • 더 구체적인 내용은 RE 추정 방법 참고