多篇顶会看个体因果推断（ITE）的前世今生

最新推荐文章于 2024-04-14 01:00:38 发布

PaperWeekly

最新推荐文章于 2024-04-14 01:00:38 发布

阅读量3k

点赞数 3

文章标签：算法神经网络编程语言 python 计算机视觉

本文链接： https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/121433356

版权

©PaperWeekly 原创 · 作者 | 张一帆

学校 | 中科院自动化所博士生

研究方向 | 计算机视觉

Background

预测行动间的因果关系是一个非常重要的研究课题。例如，医生判断哪种药物会对病人产生更好的效果。在这种任务中，我们的可观测数据有过去采取的行动（吃了哪些药），它们的结果（病情），可能还有更多的协变量 covariate information（病人信息），但我们不知道行为与结果之间的因果关系。一种简单的估计方法是基于干预，即保证两次实验环境完全一致，只改变（是否用药），然后将得到的结果求差即用药的收益。

但是，不是那么容易的，根据观测数据我们只能得到条件分布。考虑下面得例子。设为睡觉时是否穿袜子，为是否喝醉。

显然有很强得相关性，但是我们知道二者并不具有因果关系，之间还存在一些混杂因子（confounder）（sober or drunk）影响了我们对因果关系的判断。要正确的估计之间的因果关系，我们必须得到将带来的影响使用 ATE 公式消除。

那么我们就得到了如下的因果关系估计公式：

如果协变量包含所有混杂变量（即 treatment 和 outcome 的共因），那么因果效应称为可确定的（identified）。因此大多数 paper 都会假设没有不可观测的混杂因子。

在日常生活中，对于每个个体，我们大概率只能看到他们对其中一个可能的行动的反应，即或者只有一个可以观测，我们将称为 control，将称为 treatment。这种情况下我们如何来估计特定行为对个体在因果上的影响？这就是所谓的 individual treatment effect（ITE），公式化的描述有助于我们更好的理解这个问题。

给定数据空间上的分布，我们有一系列样本，其中。如果 , 如果。我们的目标是学习一个 representation 和一个分类器，这两组组件组成了一个因果估计器，我们希望这个估计器得到的结果和真实的因果效应尽可能相似，即。

ITE 问题可以看作是域迁移和数据集极度不均衡的结合体。首先，如上所示每个个体只能得到其中一个的效果，而我们要预测其在另一种 treatment 下的结果。其次，相关的数据集往往分布很不均衡，比如大多数人遇到炎症会选择吃药，因此数据很少，这也是接下来的文章逐步解决的问题。

本文从第一篇以深度学习的工具研究 individual treatment effect 的文章开始，挑选了 6 篇顶会文章对该领域的发展做一介绍。这些文章主要集中在以下几个要点。

CFRNet

论文标题：

Estimating individual treatment effect: generalization bounds and algorithms

收录会议：

ICML 2017

论文链接：

https://arxiv.org/abs/1606.03976

代码链接：

https://github.com/clinicalml/cfrnet

本文第一次提出了 ITE 的概念，并使用 DA 的一套理论对其进行 bound，依次设计了一套行而有效的算法。

在背景部分我们提到了，ITE 与域自适应有着紧密的联系࿰

最低0.47元/天解锁文章

PaperWeekly

关注关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
多篇顶会看个体因果推断（ITE）的前世今生

©PaperWeekly 原创 ·作者 | 张一帆学校 | 中科院自动化所博士生研究方向 | 计算机视觉Background预测行动间的因果关系是一个非常重要的研究课题。例如，医生判断哪...
复制链接

扫一扫