sehoon kwon

짠쩨찐

패널회귀분석의 기초 (FE vs RE)

10 분 소요

회귀분석의 기초

POLS: pooled OLS

$\quad y_{it} = X_{it} \beta + \epsilon_{it}$

기본적인 한계점 : 개체 구분 정보를 활용하지 못함

계수추정에 있어 $X$ 와 $\epsilon$ 의 확률적 관계가

독립적: $E[\epsilon \mid X] = 0 \quad \Rightarrow \quad \hat\beta_{OLS}$ 는 비편향
비상관(선형적 독립): $E[X \epsilon] = 0 \quad \Rightarrow \quad \hat\beta_{OLS}$ 는 일관적
상관 있으면 추정 곤란 $\Rightarrow$ 다른 방법 필요 : 패널, 도구변수 등

검정을 위해 오차항 분산구조 추론 필요

개체간 독립 가정은 무난하나 개체내 독립 가정은 곤란
개체내 시계열상관 가정 $\Rightarrow$ 클러스터 분산 추정
- 이 때 클러스터 수(개체 수)가 많을수록 정확한 추정 가능
동일 시간대 개체간 상관 추가 가정 $\Rightarrow$ 이중 클러스터
- 이 때는 년도 클러스터 수도 많아야 정확한 추정 가능

미관측 개별효과 모형:

$\quad y_{it} = \alpha + \beta x_{it} + \lambda_i + \epsilon_{it}$

$\lambda_i$ : 관측되지 않는 개별효과

POLS 추정하면 오차항에 포함됨
- $x_i$ 와 상관 있으면 일관 추정 안됨
  - 해결 방법 : 제거 : FE(fixed effect)
- $x_i$ 와 상관 없으면 일관 추정 가능하나 비효율적
  - 해결 방법 : GLS 변환 : RE(random effect)
참고 : FE/RE 명칭
- 고정/확률 효과 명명은 오해 소지
- FE 강점 : robust
- RE 강점 : efficient, 더미 등 시간불변변수 처리 가능

개별효과와 설명변수 사이에 상관 있는 것이 보통이므로

FE 모형 사용하는 경우가 많음
만약 시간불변변수 분석이 중요하면 도구변수 방법론 필요
- 참고: 권세훈-한상범(2013)

FE (fixed effect) 모형의 방법론

FE 추정량은 within estimator 라고도 함

핵심 : 개별효과 $\lambda_i$ 제거 후 POLS
- 원래 회귀식 $y_{it} = \alpha + \beta x_{it} + \lambda_i + \epsilon_{it}$ 에
- 평균 회귀식 ${\bar y}_i = \alpha + \beta {\bar x}_i + \lambda_i + {\bar \epsilon}_i$ 을 차감해
  - 즉 ${\dot y}_{it} = \beta {\dot x}_{it} + {\dot \epsilon}_{it}$ 를 POLS
  - $\hat \alpha$ 는 $y_{it} - \hat\beta x_{it}$ 의 평균으로 추정
참고 : $\lambda_i$ 제거 방식으로는 FD(first difference)도 가능
- 1차 시간차분 후 POLS
- 즉 ${\Delta y}_{it} = \alpha_o + \beta {\Delta x}_{it} + {\Delta\epsilon}_{it}$ 를 POLS
- 시간 순서 정보를 활용한다는 장점 있으나
  - 설명변수 $\Delta x$ 의 변동성 저하와
  - 오차항 $\Delta\epsilon$ 의 시간상관 등을 추가 고려해야 함

참고: Between vs. Within estimator

Between estimator

회귀식을 개체별 (시간)평균한 평균회귀식, 즉
- ${\bar y}_i = \beta {\bar x}_i + \lambda_i + {\bar \epsilon}_i$에서
- $\lambda_i$ 대신 $\alpha$ 를 대입하여 OLS 추정
- 즉 ${\bar y}_i = \alpha + \beta {\bar x}_i + {\bar \epsilon}_i$ 추정
이 방법은 $\lambda_i$ 를 제거하지 못하고 임의로 $\alpha$ 로 치환
- 이론적으로 적절한 방법이 아님
- 오차항에 개별효과가 포함되어 $x$ 변수와 상관관계 발생
- 이런 경우는 확률효과(RE: random effect) 모형이 더 적절함

RE (random effect) 모형의 방법론

$\lambda_i$ 와 $x_i$ 사이에 상관관계 없다는 가정함
- 이 경우 FE 추정은 비효율적
효율적인 추정 위해 GLS
- 개별효과 포함 오차항을 $w_{it} = \lambda_i + \epsilon_{it}$ 라고 하면
- 계열상관계수 $= Corr[w_{is}, w_{it}] = \frac{\sigma^2_\lambda}{\sigma^2_\lambda \, + \, \sigma^2_\epsilon}$
- GLS 변환 계수 $ \ \gamma =$
  - $ \ 1 - \sqrt{ \frac{\sigma_\epsilon^2}{\sigma_\epsilon^2 \, + \, T\sigma^2_\lambda} } \quad$ 또는
  - $ \ 1 - \sqrt{ \frac{1}{1 \, + \, T\kappa} } \quad$ : 단, $ \ \kappa = \frac{\sigma_\lambda^2}{\sigma_\epsilon^2}$
- 즉 원래 회귀식에서 평균회귀식에 $\gamma$ 곱한 만큼 차감하여 POLS
  - $\gamma$ 는 0 과 1 사이 값이므로 평균을 부분 차감하여 POLS
  - 따라서 FE 는 $\gamma = 1$ 인 RE 로도 해석 가능
더 구체적인 내용은 RE 추정 방법 참고

공유하기

Twitter Facebook LinkedIn

참고

9 분 소요

08 리스크관리와 보험 (3)

28 분 소요

목차 Section 01 리스크의 이해 Section 02 리스크의 관리 Section 03 보험의 이해 Section 04 보험의 주요 요소 Section 05 생활과 보험

08 리스크관리와 보험 (2)

29 분 소요

목차 Section 01 리스크의 이해 Section 02 리스크의 관리 Section 03 보험의 이해 Section 04 보험의 주요 요소 Section 05 생활과 보험

08 리스크관리와 보험 (1)

14 분 소요

목차 Section 01 리스크의 이해 Section 02 리스크의 관리 Section 03 보험의 이해 Section 04 보험의 주요 요소 Section 05 생활과 보험