电商衡量广告、促销的核心痛点:你看到的转化,不全是它带来的——平台只会给高价值用户投广告、给爆款做促销,用户本身就想买,不是营销驱动;传统「投了vs没投」「发券vs不发券」的对比,全是选择偏差+混淆变量撑起来的虚假效果。因果方法的价值:剥离自然转化、用户禀赋、环境干扰,只算营销带来的「净新增转化」,直接指导预算、选品、投放。
一、先定框架:电商营销因果三要素
所有广告/促销分析,先把这3个变量钉死:
1.处理变量 T(Treatment)
○广告:是否曝光/点击该广告(1=是,0=否)
○促销:是否发券/参加满减/大促(1=是,0=否)
2.结果变量 Y(Outcome)
核心看增量,不看总量:
○点击/加购/支付转化(CVR)
○净GMV、净订单量(剔除本来就会买的)
○客单价提升、复购提升
3.混淆变量 C(Confounders)(电商必控,少一个就偏)
○用户:历史消费力、活跃度、品类偏好、新老客
○商品:价格、类目、销量、评分、库存
○环境:日期/时段、节假日、流量大盘、竞品活动
二、场景1:广告投放——算清「净新增转化」
适用:搜索广告、信息流、展位、达人带货广告
核心问题
•错:广告组转化率8%,非广告组3% → 广告带来5%转化
•对:广告组本来就是高意向用户,真实增量远低于5%
首选方法:倾向得分匹配(PSM) + 双重稳健(DR)
观测数据最稳组合,既匹配相似用户,又保证结果稳健。
实操步骤(可直接落地)
1.圈定同质人群
只看「有机会被投到广告」的用户,排除本来就不会买的低质流量。
2.计算倾向得分
用逻辑回归模型:
P(T=1 | 用户+商品+环境特征) = 该用户被投广告的概率
3.1:1匹配
给每个「投了广告的用户」,找一个特征几乎一样、但没投广告的用户做对照。
4.计算因果效应 ATE
真实广告增量 = 匹配后广告组转化率 − 对照组转化率
关键结论
你得到的不是「广告转化率」,而是广告净带来的转化:
•例:匹配前差5%,匹配后只差1.2%
→ 广告真实有效,但被严重高估,预算可砍掉低效投放。
三、场景2:促销/优惠券——剔除「本来就会买」的伪转化
适用:满减、折扣、品类券、店铺券、大促活动
核心问题
90%商家踩坑:
发券后订单涨了 → 以为促销有效
→ 实际70%是本来今天就会买,只是用券省了钱,叫促销蚕食(Cannibalization)
首选方法:双重差分 DID + 合成控制 SCM
•DID:适合有「活动前+活动后」+「相似商品做对照组」
•SCM:适合618/双11这种全站大促,找不到纯对照,用多商品合成一个「没参加大促的虚拟商品」
核心逻辑
真实促销效果 =
(活动后促销商品 − 活动前促销商品)
− (活动后对照商品 − 活动前对照商品)
你会得到3个关键结果
1.净新增订单:真的被促销打动才买的
2.蚕食订单:本来就买,只是用券
3.ROI:补贴成本 ÷ 净新增GMV
四、高阶价值:异质性因果效应 CATE——精准花钱
不只算整体效果,还要拆谁有效、什么有效:
•用户分层
新客:广告效果好 → 多投拉新
老客:券效果好 → 少投广告,多发精准券
•商品分层
爆款:促销边际效应低 → 少补贴
潜力款:广告+促销双有效 → 重点投
•渠道分层
搜索广告:转化准,净效应高
信息流:曝光大,净效应低 → 控预算
五、直接能用的因果决策结论
1.广告
只保留「净转化ATE显著为正」的计划/人群/商品,砍掉伪有效投放。
2.促销
只给「本来不会买、但会被券打动」的人发券,不给高意向用户白送钱。
3.大促
用合成控制算清:大促到底是创造增量,还是提前透支未来销量。
4.预算分配
把钱从「高相关性、低因果」的营销,挪到「低相关性、高因果」的精准动作。
六、电商因果避坑 5 条铁律
1.不用最后点击归因算广告效果,它会严重高估。
2.不直接用「活动组vs非活动组」 raw 数据,必须匹配/加权。
3.促销一定要扣减蚕食订单,只看净增量。
4.所有结论必须过安慰剂检验:随机造假Treatment,效果应接近0。
5.不追求模型复杂,PSM/DID/DR 足够支撑90%电商决策。