因果阶梯论（Judea Pearl的因果定义）

2026-05-15

989

朱迪亚·珀尔（Judea Pearl）在《为什么》中给出本质定义：因果不是数据自带的相关性规律，而是独立于观测数据、可干预、可反事实推演的变量作用机制。

他彻底否定传统统计学“用相关性等同于因果”的逻辑，明确区分：相关性只是表层数据关联，真正的因果必须满足干预可控、逻辑可推演、机制可解释。为了量化划分因果认知等级，他提出因果阶梯论（因果之梯），将人类因果推理分为三层逐级递进的层级，层级越高，因果确定性越强。

一、因果阶梯三层层级

第一层：关联层（Association，观察）——无因果，仅表象

1.核心行为

被动观测、归纳数据规律，只看变量同步变化关系，不做任何人为干预。

2.典型问题

看见X发生，Y会跟着发生吗？（例：冰淇淋销量上涨，溺水人数上升）

3.逻辑本质

基于概率、相关性、条件概率判断，只有数据联动，无因果关系。无法区分混淆变量（如夏季高温同时影响冰淇淋销量和溺水人数），是最低级的认知。

4.数学表达

P(Y｜X)：在观测到X的条件下，Y发生的概率。

补充样例：观测到有人吸烟(X)，统计此人患肺癌(Y)的概率，仅做被动数据统计，不做任何人为操控。

第二层：干预层（Intervention，行动）——初级因果，可实操

1.核心行为

主动人为改变变量、打破原有自然环境，控制变量观测结果变化。

2.典型问题

如果我主动做X，Y会发生什么？（例：强制禁止售卖冰淇淋，溺水人数会下降吗？）

3.逻辑本质

这是因果的分水岭。只有能通过干预改变结果，才能判定存在初步因果；可排除混淆变量，区分虚假关联与真实作用，也是科学实验的核心逻辑。

4.数学表达

P(Y｜do(X))：主动干预X、强制设定X取值后，Y发生的概率（do算子是珀尔因果理论标志性工具）。

补充样例：人为筛选一批健康人群，强制让其中一组长期吸烟(do(X))，另一组不吸烟，对比两组肺癌发病概率，剔除年龄、体质等混杂因素。

第三层：反事实层（Counterfactual，想象）——终极因果，可解释

1.核心行为

基于现有结果，反向推演未发生的假设场景，属于人类独有逻辑推演能力。

2.典型问题

当初如果没有做X，现在Y还会发生吗？（例：某人当初不吸烟，还会得肺癌吗？）

3.逻辑本质

最高阶因果认知，穿透表象找到底层作用机制。不仅能预测未来，还能复盘归因、解释原因，是因果推断的终极目的。机器学习、传统统计无法实现反事实推演。

4.数学表达

P(Yₓ｜X',Y')：在已观测事实（X',Y'）基础上，假设变量改为X时，Y的推演概率。

补充样例：已知某人长期吸烟(X')且确诊肺癌(Y')，反向推演：假如此人从不吸烟(X)，患肺癌(Yₓ)的概率，属于无法实验复刻的反事实假设。

二、珀尔因果定义的关键补充要点

1.层级不可逆性

因果阶梯严格逐级递进，低层级无法推导高层级结论：仅靠观测数据（第一层）永远推不出干预、反事实因果，这是传统统计学的核心缺陷。

2.do算子为因果核心符号

珀尔将因果数学化，区分观测条件概率和干预概率，只有含do算子的公式，才具备因果意义。

3.因果模型优先于数据

珀尔强调：因果不是从数据中挖掘出来，而是先搭建因果结构图（因果图），再用数据验证、修正模型。数据服务于因果机制，而非数据生成因果。

三、总结

看见联动只是关联，动手改变才是因果，反向假设才算看透因果。

在珀尔体系中：真正的因果=可干预+可反事实+机制可解释，单纯的数据相关性永远不等于因果。

点赞数：9