admin管理员组文章数量:1536364
因果模型对于因果量的确定是很重要的。在前面的学习中,我们将“确定”(identification)描述为将因果估计转换为统计估计的过程。确定-估计(Identification-Estimation)的流程如下图:
1. Do-算子和干预(interventional)分布
首先需要区别给定条件(condition)和干预(intervention)的概念。给定条件T=t的意思是我们只看在总体中treatment为t的子集;而intervention的意思是将总体中左右个体的treatment设为t。我们用do-算子表示intervention: d o ( T = t ) do(T=t) do(T=t)。这是图形因果模型中常用的表示法,并且在潜在结果表示法中具有相同的表示法。例如,可以将第二讲中的潜在结果表示为:
P ( Y ( t ) = y ) = P ( Y = y ∣ d o ( T = t ) ) = P ( y ∣ d o ( t ) ) P(Y(t)=y)=P(Y=y|do(T=t))=P(y|do(t)) P(Y(t)=y)=P(Y=y∣do(T=t))=P(y∣do(t))
在上式中将 d o ( T = t ) do(T=t) do(T=t)简写为 d o ( t ) do(t) do(t)。此外,全概率可表示为 Y ∣ d o ( t ) Y|do(t) Y∣do(t)。通常将 P ( Y ∣ d o ( T = t ) ) P(Y|do(T=t)) P(Y∣do(T=t))的形式叫做interventional distributions。
需要注意形如 P ( Y ∣ d o ( T = t ) ) P(Y|do(T=t)) P(Y∣do(T=t))的干预性分布(interventional distribution)和形如 P ( Y ) P(Y) P(Y)的观察分布(observational distribution)的区别。观察分布不带do算子,是不需要任何实验和干预就可以得到的变量分布。如果可以将带do算子的表达式(干预性表达式)转换为不带do算子的表达式(观察行表达式),就说这个表达式是可识别的(identifiable)。通常,将包含do算子的估计称为因果估计,将不包含do算子的估计称为统计估计。
带do算子的表达式中的所有变量都处于一个干预后的世界。(这里14节细讲)
2. 模块化假设(modularity)
在介绍模块化假设之前,需要先介绍因果机制(causal mechanism)的概念。可以将产生 X i X_i Xi的因果机制理解为给定 X i X_i Xi的所有原因的 X i X_i Xi的条件概率分布: P ( x i ∣ p a i ) P(x_i|pa_i) P(xi∣pai)。如下图所示,生成 X i X_i Xi的因果机制由 X i X_i Xi的所有父节点和指向 X i X_i Xi的所有边组成。
为了获得许多因果识别结果,我们将做出的主要假设是干预(iinterventions)是局部的。 更具体地说,我们假设对变量 X i X_i Xi的干预只会改变 X i X_i Xi的因果机制。 它不会改变产生任何其他变量的因果机制。 从这个意义上说,因果机制是模块化的。
模块化(modularity)假设:如果对节点集合 S ⊆ [ n ] S \subseteq[n] S⊆[n]进行干预,将它们设为常量,那么对于每一个i,有:
(1)如果 i ∉ S i \notin S i∈/S,那么 P ( x i ∣ p a i ) P\left(x_{i} \mid \mathrm{pa}_{i}\right) P(xi∣pai)保持不变。
(2)如果 i ∈ S i \in S i∈S,那么当
版权声明:本文标题:因果推理(四):因果模型 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dianzi/1726927016a1090663.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论