回帰不連続デザイン
関西大学総合情報学部
2025-01-06
Regression Discontinuity Design
\[T_i = \begin{cases} 0 & \text{ if } \text{Population} < 3500, \\ 1 & \text{ if } \text{Population} \geq 3500. \end{cases}\]
比例代表制と多数代表制の投票率の比較
比例代表制と多数代表制の投票率の比較 (架空データ)
比例代表制と多数代表制の投票率の比較
比例代表制と多数代表制の投票率の比較 (架空データ)
比例代表制と多数代表制の投票率の比較 (架空データ)
(1) | (2) | |
---|---|---|
切片 | 59.650 | 59.939 |
(0.478) | (0.453) | |
人口 | -0.001 | -0.002 |
(0.000) | (0.000) | |
人口3500以上ダミー | 6.561 | |
(0.831) | ||
Num.Obs. | 500 | 500 |
R2 | 0.338 | 0.411 |
R2 Adj. | 0.336 | 0.409 |
RMSE | 5.27 | 4.97 |
異なる割当メカニズムを想定した2つのRDD
Moscoe and Barninnghausen (2015)
(非) 線形回帰分析による推定
\[\widehat{\mbox{Turnout}} = \beta_0 + \beta_1 \mbox{Population} + \rho \mathbf{I}(\mbox{Population} \geq 3500)\]
\[\widehat{\mbox{Turnout}} = \beta_0 + \beta_1 \mbox{Population} + \rho \mathbf{I}(\mbox{Population} \geq 3500)\]
rdd_poly.csv
を使用した例\[ \begin{align} Y & = 0.2 X + 8 X^2 + 0.1 X^3 - 0.08 X^4 + 50 \mathbf{I}(X > 0) + \varepsilon \\ \varepsilon & \sim \mbox{Normal}(0, 20). \end{align} \]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 \mbox{X}\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \beta_3 X^3\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \beta_3 X^3 + \beta_4 X^4\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \dots + \beta_5 X^5\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \dots + \beta_6 X^6\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \dots + \beta_7 X^7\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \dots + \beta_8 X^8\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \dots + \beta_9 X^9\]
\[\hat{Y} = \beta_0 + \rho \mathbf{I}(X > 0) + \beta_1 X + \beta_2 X^2 + \dots + \beta_{10} X^{10}\]
\[\hat{Y} = \beta_0 + \beta_1 X + \rho \mathbf{I}(X \geq 3) + \gamma X \cdot \mathbf{I}(X \geq 3).\]
rdd_interaction.csv
)交差項なし | 交差項あり | |
---|---|---|
\(\beta_0\) | 3.981 | 3.028 |
(0.701) | (0.665) | |
\(\beta_1\) | 1.273 | 1.029 |
(0.123) | (0.121) | |
\(\rho\) | 11.730 | 0.699 |
(1.519) | (2.305) | |
\(\gamma\) | 2.158 | |
(0.358) | ||
Num.Obs. | 200 | 200 |
R2 Adj. | 0.824 | 0.851 |
F | 467.822 | 379.750 |
RMSE | 5.76 | 5.29 |
rdd_interaction.csv
)強制変数を閾値で中心化 (centering) する
\[\hat{Y} = \beta_0 + \beta_1 X + \rho \mathbf{I}(X \geq 3) + \gamma X \cdot \mathbf{I}(X \geq 3).\]
強制変数を閾値で中心化 (centering) する
\[\begin{align}\hat{Y} & = \beta_0 + \beta_1 X^c + \rho \mathbf{I}(X^c \geq 0) + \gamma X \cdot \mathbf{I}(X^c \geq 0), \\ X^c & = X - c.\end{align}\]
\[\hat{Y} = \beta_0 + \beta_1 X + \rho \mathbf{I}(X \geq 3) + \gamma X \cdot \mathbf{I}(X \geq 3).\]
\[\hat{Y} = \beta_0 + \beta_1 X^c + \rho \mathbf{I}(X^c \geq 0) + \gamma X \cdot \mathbf{I}(X^c \geq 0).\]
強制変数と応答変数間の関数 (functional form) が正しく設定できるか
ノンパラメトリック/セミパラメトリック推定
閾値 ( \(c\) ) から \(h\) 以上離れているケースは分析から除外
推定方法
\(−h \leq X^c \leq h\)範囲内のデータのみ使用(rdd_poly.csv
)
\(h = 5\)の場合
\(h = 3\) の場合
\(h = 1\) の場合
バンド幅の調整による因果効果の推定値の変化
参考) 選挙制度と投票率の例 (rdd_french.csv
)
パラメトリック推定に比べてバイアスが大きい場合も
rdd_poly.csv
のように\(c\)周辺で変化が大きい場合、局所平均は向いていないより前提を緩めた推定法
rdd_data2.csv
)rdd_poly.csv
:\(h = 5\)の場合
バンド幅内データを対象にした線形回帰分析 (Hahn et al. 2001, Poter 2003, Imbens and Lemieux 2008)
ノンパラメトリック推定の場合、バンド幅の設定が大事
簡単に計算可能な最適バンド幅の一つ (Imbens and Kalyanaraman 2009)
\[h_{\text{opt}} = C_K \cdot \Bigg(\frac{2 \hat{\sigma}^2(c) / \hat{f}(c)}{\big(m_{+}^{(2)}(c) - m_{-}^{(2)}(c)\big)^2 + (\hat{r}_{+} + \hat{r}_{-})}\Bigg)^{\frac{1}{5}} \cdot N^{-\frac{1}{5}}\]
カーネル選択は推定値に大きな影響を与えない (Lee and Lemieux 2010)
処置効果
|
||||
---|---|---|---|---|
カーネル | \(h_{opt}\) | LATE | Half BW | Double BW |
triangular | 4.442 | 41.893 | 50.977 | 26.204 |
rectangular | 6.982 | 27.665 | 36.759 | 4.446 |
epanechnikov | 4.135 | 40.758 | 51.064 | 26.396 |
quartic | 4.721 | 41.696 | 51.318 | 26.361 |
triweight | 5.247 | 42.069 | 51.188 | 26.564 |
tricube | 4.765 | 41.154 | 51.394 | 26.608 |
gaussian | 1.626 | 42.740 | 50.612 | 28.466 |
cosine | 4.210 | 41.067 | 51.168 | 26.385 |
ファイル名 | 説明 | 真の因果効果 |
---|---|---|
rdd_french.csv |
架空のフランス地方選挙 | 約5 |
rdd_poly.csv |
多項式の例 | 約50 |
rdd_intreaction.csv |
交互作用の例 | 約7.5 |
rdd_data.csv