朱迪亚·珀尔(Judea Pearl)在《为什么》中给出本质定义:因果不是数据自带的相关性规律,而是独立于观测数据、可干预、可反事实推演的变量作用机制。
他彻底否定传统统计学“用相关性等同于因果”的逻辑,明确区分:相关性只是表层数据关联,真正的因果必须满足干预可控、逻辑可推演、机制可解释。为了量化划分因果认知等级,他提出因果阶梯论(因果之梯),将人类因果推理分为三层逐级递进的层级,层级越高,因果确定性越强。
一、因果阶梯三层层级
第一层:关联层(Association,观察)——无因果,仅表象
1.核心行为
被动观测、归纳数据规律,只看变量同步变化关系,不做任何人为干预。
2.典型问题
看见X发生,Y会跟着发生吗?(例:冰淇淋销量上涨,溺水人数上升)
3.逻辑本质
基于概率、相关性、条件概率判断,只有数据联动,无因果关系。无法区分混淆变量(如夏季高温同时影响冰淇淋销量和溺水人数),是最低级的认知。
4.数学表达
P(Y|X):在观测到X的条件下,Y发生的概率。
补充样例:观测到有人吸烟(X),统计此人患肺癌(Y)的概率,仅做被动数据统计,不做任何人为操控。
第二层:干预层(Intervention,行动)——初级因果,可实操
1.核心行为
主动人为改变变量、打破原有自然环境,控制变量观测结果变化。
2.典型问题
如果我主动做X,Y会发生什么?(例:强制禁止售卖冰淇淋,溺水人数会下降吗?)
3.逻辑本质
这是因果的分水岭。只有能通过干预改变结果,才能判定存在初步因果;可排除混淆变量,区分虚假关联与真实作用,也是科学实验的核心逻辑。
4.数学表达
P(Y|do(X)):主动干预X、强制设定X取值后,Y发生的概率(do算子是珀尔因果理论标志性工具)。
补充样例:人为筛选一批健康人群,强制让其中一组长期吸烟(do(X)),另一组不吸烟,对比两组肺癌发病概率,剔除年龄、体质等混杂因素。
第三层:反事实层(Counterfactual,想象)——终极因果,可解释
1.核心行为
基于现有结果,反向推演未发生的假设场景,属于人类独有逻辑推演能力。
2.典型问题
当初如果没有做X,现在Y还会发生吗?(例:某人当初不吸烟,还会得肺癌吗?)
3.逻辑本质
最高阶因果认知,穿透表象找到底层作用机制。不仅能预测未来,还能复盘归因、解释原因,是因果推断的终极目的。机器学习、传统统计无法实现反事实推演。
4.数学表达
P(Yₓ|X',Y'):在已观测事实(X',Y')基础上,假设变量改为X时,Y的推演概率。
补充样例:已知某人长期吸烟(X')且确诊肺癌(Y'),反向推演:假如此人从不吸烟(X),患肺癌(Yₓ)的概率,属于无法实验复刻的反事实假设。
二、珀尔因果定义的关键补充要点
1.层级不可逆性
因果阶梯严格逐级递进,低层级无法推导高层级结论:仅靠观测数据(第一层)永远推不出干预、反事实因果,这是传统统计学的核心缺陷。
2.do算子为因果核心符号
珀尔将因果数学化,区分观测条件概率和干预概率,只有含do算子的公式,才具备因果意义。
3.因果模型优先于数据
珀尔强调:因果不是从数据中挖掘出来,而是先搭建因果结构图(因果图),再用数据验证、修正模型。数据服务于因果机制,而非数据生成因果。
三、总结
看见联动只是关联,动手改变才是因果,反向假设才算看透因果。
在珀尔体系中:真正的因果=可干预+可反事实+机制可解释,单纯的数据相关性永远不等于因果。