双重差分法（DID）

2026-02-26

1141

在社会科学（如社会学、政治学）与经济学研究中，核心目标之一是识别“因果关系”——而非简单的“相关关系”。例如，“最低工资上涨是否会导致失业率上升”“教育补贴政策是否能提高学生成绩”“公共卫生干预是否能降低传染病发病率”，这类问题无法通过简单的描述性统计或相关性分析解答，而双重差分法（Difference-in-Differences, DID）正是解决这类“政策评估”“干预效应”问题的核心方法，因其逻辑直观、数据要求相对温和，成为社科与经济学研究中最常用的因果识别工具。

一、DID的核心原理：通俗理解“双重差异”

DID的本质是“两次差分、消除混淆”，核心思路是通过“对照组”和“实验组”的前后变化对比，剥离掉“时间趋势”“共同冲击”等无关因素的影响，从而精准识别“干预（政策/事件）”的真实因果效应。

我们可以用一个最简单的场景理解：假设我们想评估“某地区实施的产业扶持政策（干预）对当地企业营收（结果变量）的影响”。

1.变量定义

•实验组（Treatment Group）：受到干预（政策/事件）影响的个体/群体/地区，如“实施产业扶持政策的地区”。

•对照组（Control Group）：未受到干预影响的个体/群体/地区，且与实验组在干预前具有相似的特征（平行趋势），如“未实施产业扶持政策、但经济结构、地理位置与实验组相似的地区”。

•时间变量（Time）：分为“干预前（Before）”和“干预后（After）”，如“政策实施前2年”和“政策实施后3年”。

•结果变量（Outcome Variable）：我们关注的被影响指标，如“企业营收”“失业率”“学生成绩”。

2.双重差分的计算逻辑

DID的核心是计算“两次差异”，最终的干预效应（ATT，平均处理效应）就是这两次差异的差值：

第一步：计算实验组的“前后差异”（干预后 - 干预前）—— 这部分差异包含“政策效应”+“时间趋势效应”（如整体经济增长带来的营收提升）。

第二步：计算对照组的“前后差异”（干预后 - 干预前）—— 这部分差异仅包含时间趋势效应（因为对照组未受政策影响）。

第三步：双重差分 = 实验组前后差异 - 对照组前后差异 —— 剥离时间趋势后，剩余的就是“政策/干预的真实因果效应”。

用公式简化表示：

ATT = （实验组After - 实验组Before） - （对照组After - 对照组Before）

3.通俗类比：排除“共同干扰”

假设A班（实验组）和B班（对照组），平时成绩相近（平行趋势）。期末考试前，A班进行了额外补课（干预），B班没有。

- A班：补课前端均分70，补课后85（前后差异+15）

- B班：考前均分71，考后78（前后差异+7）

- 补课的真实效应 = 15 - 7 = 8分 —— 这就是DID的逻辑：排除了“期末考试难度降低、学生自然进步”等共同时间趋势的影响，精准识别补课的效果。

二、DID的关键假设

DID的有效性依赖3个核心假设，其中“平行趋势假设”是重中之重，也是研究中最需要验证的部分。

1.平行趋势假设（Parallel Trends Assumption）

核心含义：在没有干预（政策/事件）的情况下，实验组和对照组的结果变量“时间趋势”是平行的（即变化规律一致）。

通俗理解：如果没有产业扶持政策，实验组地区和对照组地区的企业营收增长速度会一样；如果没有补课，A班和B班的成绩提升幅度会一样。

验证方法：最常用“事件研究法（Event Study）”，绘制实验组和对照组在干预前、干预后的结果变量趋势图，若干预前两者趋势基本重合，即满足平行趋势；也可通过回归分析，检验干预前各期的交互项系数是否不显著。

2.无溢出效应（No Spillover Effects）

核心含义：干预（政策）仅影响实验组，不会间接影响对照组。例如，实施产业扶持政策的地区，不会导致对照组地区的企业迁移到实验组，从而影响对照组的营收；A班的补课不会让B班学生间接受益（如分享笔记）。

若存在溢出效应，对照组的“时间趋势”会被干扰，导致DID估计结果偏误。

3.干预分配外生性（Exogenous Treatment Assignment）

核心含义：实验组和对照组的分组“不是由结果变量决定的”，即分组是随机的，或至少与影响结果变量的未观测因素无关。

通俗理解：不是“企业营收高的地区才被选中实施产业扶持政策”（若如此，分组内生，干预前两组就有差异），而是随机选中地区实施政策，或按与结果无关的标准分组（如行政区域划分）。

注：现实中完全随机分组较少（如政策通常是有针对性实施的），此时可通过控制协变量（如地区GDP、企业规模）、倾向得分匹配（PSM-DID）等方法缓解内生性问题。

三、DID的实施步骤

DID的实施流程清晰，核心分为“数据准备-模型设定-假设检验-结果解读”四步，以下结合通用场景说明（适用于面板数据，即“个体+时间”的二维数据）。

1.数据准备：获取面板数据

DID需要面板数据（Panel Data），即包含“多个个体（如地区、企业、个人）”在“多个时间点（干预前+干预后）”的观测值。

核心数据字段（以“产业扶持政策对企业营收的影响”为例）：

•个体标识（id）：如企业ID、地区ID（区分不同个体）；

•时间标识（year）：如2018-2023年（包含干预前2018-2020，干预后2021-2023）；

•结果变量（y）：如企业年度营收（万元）；

•处理变量（treat）：虚拟变量，实验组=1，对照组=0；

•时间虚拟变量（post）：虚拟变量，干预后=1，干预前=0；

•协变量（controls）：用于控制个体异质性，如企业规模、地区GDP、行业类型等（可选，提升估计精度）。

2.模型设定：基准回归方程

DID的基准回归方程（OLS回归）如下，核心是“处理变量×时间变量”的交互项（treat×post），其系数就是我们关注的干预效应（ATT）：

yᵢₜ = α + β₁treatᵢ + β₂postₜ + β₃(treatᵢ×postₜ) + γXᵢₜ + εᵢₜ

各变量解读：

•yᵢₜ：第i个个体在第t期的结果变量（如企业i在t年的营收）；

•treatᵢ：个体固定效应，控制实验组和对照组“干预前的固有差异”（如A班和B班的基础成绩差异）；

•postₜ：时间固定效应，控制“所有个体共同的时间趋势”（如所有企业都受益于整体经济增长）；

•treatᵢ×postₜ：交互项，系数β₃就是DID估计的干预效应（核心结果），若β₃显著为正，说明干预对结果有正向影响；

•Xᵢₜ：协变量，控制其他影响结果的因素；

•εᵢₜ：随机误差项。

3.假设检验：核心验证平行趋势

如前文所述，平行趋势是DID的核心前提，必须验证：

•方法1：趋势图验证（最直观）—— 绘制实验组和对照组在各年份的结果变量均值趋势线，若干预前（post=0）两条线基本平行，干预后出现明显分叉，即满足平行趋势。

•方法2：事件研究法回归—— 将基准方程中的postₜ替换为“相对于干预年份的逐年虚拟变量”，回归后检验干预前各年份的交互项系数是否不显著（即干预前两组无显著差异）。

补充检验：安慰剂检验（Placebo Test）—— 随机分配“干预组”和“干预时间”，重复回归多次，若大部分虚假干预效应的系数不显著，说明原DID结果可靠（排除偶然因素）。

4.结果解读：聚焦核心系数

回归结果的核心是交互项（treat×post）的系数β₃：

•系数符号：正=干预正向影响结果，负=负向影响；

•显著性：p值<0.05（或0.01），说明干预效应显著（排除随机误差）；

•经济/社会意义：如β₃=100，说明产业扶持政策使企业营收平均增加100万元（结合结果变量的单位解读）。

四、经典案例

以下两个案例均为学术研究中常见的DID应用，兼顾经济学和社会学场景，清晰展示DID的完整应用逻辑。

案例1：经济学案例——最低工资上涨对失业率的影响

1.研究问题

某国部分州（实验组）在2020年提高了最低工资标准，其他州（对照组）未调整，需识别“最低工资上涨”对当地失业率的因果效应（核心疑问：最低工资上涨是否会导致企业裁员，进而推高失业率）。

2.变量设定

•个体（id）：该国50个州；

•时间（year）：2018-2022年（干预前2018-2019，干预后2020-2022）；

•结果变量（y）：各州年度失业率（%）；

•处理变量（treat）：实施最低工资上涨的州=1，未实施的=0；

•时间虚拟变量（post）：2020-2022年=1，2018-2019年=0；

•协变量（controls）：各州GDP增长率、劳动力规模、产业结构（制造业占比）。

3.模型与结果

基准回归方程：unemploymentᵢₜ = α + β₁treatᵢ + β₂postₜ + β₃(treatᵢ×postₜ) + γ(GDP增长率ᵢₜ + 劳动力规模ᵢₜ + 制造业占比ᵢₜ) + εᵢₜ

回归结果核心：交互项系数β₃=0.32，p<0.05，说明最低工资上涨使实验组州的失业率平均上升0.32个百分点，且效应显著。

4.假设验证

•平行趋势：绘制2018-2022年实验组和对照组的失业率趋势图，干预前（2018-2019）两条线平行，2020年干预后，实验组失业率明显高于对照组，满足平行趋势。

•安慰剂检验：随机选择10个州作为“虚假实验组”，随机选择2019年作为“虚假干预年”，重复回归500次，结果显示95%的虚假交互项系数不显著，说明原结果可靠。

5.结论

最低工资上涨对失业率有显著的正向影响，但影响幅度较小（0.32个百分点），说明企业虽有小幅裁员，但整体劳动力市场未受严重冲击（可能因最低工资上涨带动低收入群体消费，抵消部分裁员影响）。

案例2：社科案例——公共卫生干预对传染病发病率的影响

1.研究问题

某省部分城市（实验组）在2021年实施“社区防疫宣传+免费核酸检测”的公共卫生干预措施，其他城市（对照组）仅实施常规防疫，需识别该干预措施对新冠疫情发病率的影响。

2.变量设定

•个体（id）：该省16个地级市；

•时间（month）：2021年1-12月（干预前1-6月，干预后7-12月）；

•结果变量（y）：各城市月度新冠发病率（每10万人感染人数）；

•处理变量（treat）：实施公共卫生干预的城市=1，未实施的=0；

•时间虚拟变量（post）：7-12月=1，1-6月=0；

•协变量（controls）：各城市人口密度、医疗资源数量（医院床位数）、居民疫苗接种率。

3.模型与结果

基准回归方程：incidenceᵢₜ = α + β₁treatᵢ + β₂postₜ + β₃(treatᵢ×postₜ) + γ(人口密度ᵢₜ + 医院床位数ᵢₜ + 接种率ᵢₜ) + εᵢₜ

回归结果核心：交互项系数β₃=-2.15，p<0.01，说明公共卫生干预措施使实验组城市的月度发病率平均降低2.15（每10万人），效应显著且力度较强。

4.假设验证

•平行趋势：事件研究法显示，干预前（1-6月）各期交互项系数均不显著（p>0.05），说明干预前实验组和对照组的发病率趋势平行，满足核心假设。

•稳健性检验：替换结果变量（用“确诊病例数”替代“发病率”），回归结果仍显著为负，说明结论稳健。

5.结论

“社区防疫宣传+免费核酸检测”的公共卫生干预措施，能有效降低新冠疫情发病率，为公共卫生政策的制定提供了实证依据——这类干预措施通过提高居民防控意识、早发现感染者，有效遏制了疫情传播。

五、DID的常见误区与注意事项

1.误区1：忽视平行趋势假设

若干预前实验组和对照组的趋势不平行（如实验组本身发展速度就快于对照组），则DID估计的效应会包含“固有差异”，导致结果偏误。解决方法：通过趋势图、事件研究法严格验证，若不满足，可使用PSM-DID（倾向得分匹配+DID）匹配相似的实验组和对照组。

2.误区2：混淆“分组内生性”

若分组是“内生的”（如“高收入地区才实施政策”），则实验组和对照组干预前就有显著差异，平行趋势不成立。解决方法：控制更多协变量，或寻找“外生分组依据”（如政策实施以行政边界为标准，与结果变量无关）。

3.误区3：样本量不足或时间跨度太短

DID需要足够的“干预前+干预后”时间点（至少各1期，建议各2期以上）和足够的个体数量，否则估计结果的可靠性会降低。建议时间跨度至少3年，个体数量不少于30个。

4.注意事项：异质性分析（可选但推荐）

实际研究中，干预效应可能因个体特征不同而存在差异（如最低工资上涨对中小企业和大企业的影响不同），可通过“分组回归”进行异质性分析，让结论更丰富（如按企业规模、地区收入水平分组回归）。

六、总结

双重差分法（DID）的核心价值的是“剥离无关干扰，识别因果效应”，其最大优势是：无需随机对照试验（RCT），仅通过面板数据就能实现因果识别，适配社科与经济学中“政策评估、事件冲击”等无法进行随机试验的场景。

适用场景总结：

•经济学：政策评估（最低工资、税收减免、产业扶持）、事件冲击（金融危机、贸易摩擦对经济的影响）；

•社会学：公共政策评估（教育补贴、扶贫政策）、社会事件影响（疫情、灾害对社会行为的影响）；

•公共管理：公共服务干预（医疗、养老政策）、政府治理措施的效果评估。

掌握DID的关键，在于理解“双重差分”的逻辑、严格验证平行趋势假设、合理设定模型与变量——它不仅是学术研究的工具，也能为政策制定、实践决策提供科学的实证依据。

点赞数：13