多篇顶会看个体因果推断(ITE)的前世今生
©PaperWeekly 原创 · 作者 | 张一帆
学校 | 中科院自动化所博士生
研究方向 | 计算机视觉
Background
预测行动间的因果关系是一个非常重要的研究课题。例如,医生判断哪种药物会对病人产生更好的效果。在这种任务中,我们的可观测数据有过去采取的行动(吃了哪些药),它们的结果(病情),可能还有更多的协变量 covariate information(病人信息),但我们不知道行为与结果之间的因果关系。一种简单的估计方法是基于干预,即保证两次实验环境完全一致,只改变 (是否用药),然后将得到的结果求差即用药的收益。
但是, 不是那么容易的,根据观测数据我们只能得到条件分布 。考虑下面得例子。设 为睡觉时是否穿袜子, 为是否喝醉。
显然 有很强得相关性,但是我们知道二者并不具有因果关系, 之间还存在一些混杂因子(confounder)(sober or drunk)影响了我们对因果关系的判断。要正确的估计 之间的因果关系,我们必须得到将 带来的影响使用 ATE 公式消除。
那么我们就得到了如下的因果关系估计公式:
如果协变量包含所有混杂变量(即 treatment 和 outcome 的共因),那么因果效应称为可确定的(identified)。因此大多数 paper 都会假设没有不可观测的混杂因子。
在日常生活中,对于每个个体,我们大概率只能看到他们对其中一个可能的行动的反应,即 或者 只有一个可以观测,我们将 称为 control,将 称为 treatment。这种情况下我们如何来估计特定行为对个体在因果上的影响?这就是所谓的 individual treatment effect(ITE),公式化的描述有助于我们更好的理解这个问题。
给定数据空间 上的分布 ,我们有一系列样本 ,其中 。如果 , 如果 。我们的目标是学习一个 representation 和一个分类器 ,这两组组件组成了一个因果估计器 ,我们希望这个估计器得到的结果和真实的因果效应尽可能相似,即 。
ITE 问题可以看作是域迁移和数据集极度不均衡的结合体。首先,如上所示每个个体只能得到其中一个 的效果,而我们要预测其在另一种 treatment 下的结果。其次,相关的数据集往往分布很不均衡,比如大多数人遇到炎症会选择吃药 ,因此 数据很少,这也是接下来的文章逐步解决的问题。
本文从第一篇以深度学习的工具研究 individual treatment effect 的文章开始,挑选了 6 篇顶会文章对该领域的发展做一介绍。这些文章主要集中在以下几个要点。
CFRNet
论文标题:
Estimating individual treatment effect: generalization bounds and algorithms
收录会议:
ICML 2017
论文链接:
https://arxiv.org/abs/1606.03976
代码链接:
https://github.com/clinicalml/cfrnet
本文第一次提出了 ITE 的概念,并使用 DA 的一套理论对其进行 bound,依次设计了一套行而有效的算法。
在背景部分我们提到了,ITE 与域自适应有着紧密的联系
梧桐满南京: 你找见这篇文章的代码了嘛?
qasce: 二阶邻接矩阵
第三题真的很简单qwq: 机翻一下然后收费
风灵月影宗大师兄: 这是一篇高质量的好文,深度理解和清晰的表达方式使复杂的技术概念变得容易理解,值得收藏点赞。博主用心很有耐心,更有对知识的热忱和热爱,写了这么实用有效的分享,期盼博主能够光顾我的博客,给予宝贵的指导!
风灵月影宗大师兄: 这是一篇高质量的好文,深度理解和清晰的表达方式使复杂的技术概念变得容易理解,值得收藏点赞。博主用心很有耐心,更有对知识的热忱和热爱,写了这么实用有效的分享,期盼博主能够光顾我的博客,给予宝贵的指导!