目次
一、引言
二、理论原理
三、数据准备
四、倾向得分匹配(PSM)操作步骤
五、双重差分法(DID)操作步骤
六、代码运行结果解释
一、引言
处置惩罚效应模子是一种用于评估干预或处置惩罚对结果变量影响的统计方法。在许多研究范畴,如经济学、社会学和医学等,处置惩罚效应模子被广泛应用以办理选择性偏差和内生性标题。
二、理论原理
处置惩罚效应模子主要有两种常见范例:倾向得分匹配(Propensity Score Matching,PSM)和双重差分法(Difference-in-Differences,DID)。
- 倾向得分匹配(PSM)
- 基本思想:倾向得分匹配的核心思想是基于“可观测的协变量”来模拟一个随机实行的环境。通过构建一个综合反映个体接受处置惩罚可能性的倾向得分,然后根据这个得分对处置惩罚组和控制组的个体进行匹配,使得匹配后的处置惩罚组和控制组在可观测的特征上尽可能相似,从而减少由于个体特征差异导致的选择性偏差。
- 数学原理:倾向得分定义为在给定可观测协变量的情况下个体接受处置惩罚的条件概率。通过逻辑回归或其他方法估计出这个概率。
- 长处:可以大概在一定水平上办理由于不可观测因素导致的选择性偏差标题;相对简单直观,易于明白和解释。
- 范围性:依赖于准确的模子设定和可观测协变量的完整性,如果存在重要的不可观测因素未被纳入模子,可能仍然存在偏差;对于一连型处置惩罚变量的处置惩罚相对复杂。
比方,假设我们研究某种药物治疗对疾病康复的效果。个体的年事、性别、底子健康状况等会影响是否接受治疗以及康复情况。通过倾向得分匹配,找到在这些因素上相似但一组接受治疗,一组未接受治疗的个体进行比较,从而更准确地评估治疗效果。
- 双重差分法(DID)
- 基本思想:双重差分法通过比较处置惩罚组在处置惩罚前后的变化与控制组在相同时间段内的变化,从而分离出处置惩罚的净效应。其前提是假设在没有处置惩罚的情况下,处置惩罚组和控制组的变化趋势是相同的。
- 数学原理:利用两组(处置惩罚组和控制组)在两个时间点(处置惩罚前和处置惩罚后)的数据,构建双重差分估计量。
- 长处:可以较好地控制随时间稳定的不可观测因素的影响;实用于评估政策或干预的动态效果。
- 范围性:要求处置惩罚组和控制组在处置惩罚前具有平行趋势;可能受到其他同时期政策或变乱的干扰。
比方,研究某个城市实行新的环保政策对氛围质量的影响。选取实行政策的城市作为处置惩罚组,未实行政策的相似城市作为控制组,比较政策实行前后两组城市氛围质量的变化差异,以评估政策效果。
三、数据准备
我们使用一个假造的数据集 treatment_data.dta,其中包含个体特征、是否接受处置惩罚的变量 treated 以及结果变量 outcome 等。
- use "treatment_data.dta", clear
复制代码
四、倾向得分匹配(PSM)操作步骤
- logit treated x1 x2 x3 // 其中 x1, x2, x3 为影响接受处理的协变量
- predict ps // 生成倾向得分
复制代码
这里,logit 命令用于估计二值选择模子以得到倾向得分,predict 命令用于生成猜测值。
- psmatch2 treated x1 x2 x3, outcome(outcome) neighbor(1) ties
复制代码
psmatch2 命令执行匹配操作,neighbor(1) 表示使用 1 对 1 近邻匹配,ties 处置惩罚得分相同的情况。
- sum treated x1 x2 x3 if _weight!=. // 查看处理组和控制组在协变量上的均值
- browse if _weight!=. // 直观查看匹配后的样本
复制代码
- ttest outcome, by(treated) // 比较处理组和控制组结果变量的均值差异
复制代码
五、双重差分法(DID)操作步骤
- gen treated_time = treated * post // 假设 post 为处理时间的虚拟变量
复制代码
- reg outcome treated post treated_time x1 x2 x3
复制代码
- 稳健性查验
- 平行趋势查验:可以通过绘制处置惩罚组和控制组在处置惩罚前的结果变量趋势图来直观判定平行趋势是否建立。
- 安慰剂查验:随机设定处置惩罚组和控制组,重新进行估计,观察结果是否明显。
六、代码运行结果解释
对于倾向得分匹配,查察匹配质量的统计结果,判定协变量是否在处置惩罚组和控制组间达到均衡。比方:
- Logistic regression Number of obs = 1000
- LR chi2(3) = 150.00
- Prob > chi2 = 0.0000
- Log likelihood = -320.0000 Pseudo R2 = 0.1500
- treated Coef. Std. Err. z P>|z| [95% Conf. Interval]
- x1 0.50 0.10 5.00 0.000 0.30 0.70
- x2 0.30 0.12 2.50 0.012 0.06 0.54
- x3 -0.20 0.08 -2.50 0.012 -0.36 -0.04
复制代码
如果协变量的系数明显,说明这些协变量对接受处置惩罚的概率有明显影响。
- Variable | Treated | Control | Diff | Std. Err. | t | P>|t|
- ---------+-------------+------------+--------+-------------+-----+----------
- x1 | 20.00 | 18.50 | 1.50 | 2.00 | 0.75 | 0.45
- x2 | 15.00 | 14.00 | 1.00 | 1.50 | 0.67 | 0.50
- x3 | 8.00 | 7.50 | 0.50 | 1.00 | 0.50 | 0.62
复制代码
若Diff较小且 P>|t| 较大,说明匹配效果较好,处置惩罚组和控制组在协变量上差异不明显。
- Two-sample t test with equal variances
- Group | Obs | Mean | Std. Err. | Std. Dev. | [95% Conf. Interval]
- ------+------------+------------+---------------+---------------+-----------------------
- treated | 200 | 50.00 | 5.00 | 15.00 | 40.00 60.00
- control | 200 | 40.00 | 4.00 | 12.00 | 32.00 48.00
- diff = mean(treated) - mean(control)
- = 10.00
- t = 4.00
- Ho: diff = 0
- Degrees of freedom = 398
- Ha: diff > 0
- p = 0.0000
- Ha: diff < 0
- p = 1.0000
- Ha: diff!= 0
- p = 0.0000
复制代码
当 p < 0.05 时,说明处置惩罚组和控制组的结果变量均值有明显差异,即处置惩罚有明显效果。
对于双重差分法,关注处置惩罚时间和处置惩罚组交互项的系数及其明显性。比方:
回归结果:
- Linear regression Number of obs = 1000
- F(5, 994) = 100.00
- Prob > F = 0.0000
- R-squared = 0.3000
- Adj R-squared = 0.2800
- Root MSE = 10.0000
- outcome | Coef. Std. Err. t P>|t| [95% Conf. Interval]
- ---------+---------------------------------------------------------------
- treated | 10.00 2.00 5.00 0.000 6.00 14.00
- post | 5.00 1.50 3.33 0.001 2.00 8.00
- treated_time | 8.00 2.50 3.20 0.001 3.00 13.00
- x1 | 0.50 0.10 5.00 0.000 0.30 0.70
- x2 | 0.30 0.12 2.50 0.012 0.06 0.54
- x3 | -0.20 0.08 -2.50 0.012 -0.36 -0.04
复制代码
若treated_time的系数明显为正,说明处置惩罚有正向效果。
处置惩罚效应异质性分析——呆板学习方法带来的机会与挑战https://shxyj.ajcass.com/Admin/UploadFile/Issue/20210121043316WU_FILE_0.pdf
2015-2021年地级市月度氛围质量数据(AQI、SO2、NO2、PM2.5、PM10、O3、CO)
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |