【统计】Causal Inference 原文传送门 http://www.stat.cmu.edu/~larry/=sml/Causation.pdf 过程 一、Prediction 和 causation 的区别 现实中遇到的很多问题实际上是因果问题,而不是预测。 因果问题分为两种 :一种是 causal inference,比如给定两个变量 X、Y,希望找到一个衡量它们之间因果关系的参数 theta;另一种是 causal discovery,即给定一组变量,找到他们之间的因果关系。对于后面这种 causal discovery,notes 里面说它在统计上是不可能的。 数据有两种产生途径 :一种是通过有意控制、随机化的实验得到的;一种是通过观测数据得到的。前一种方式能够直接做 causal inference;后一种方式需要另外知道一些先验知识,才能在上面做 causal inference。 对因果关系描述的数学语言 :一种是 counterfactuals,一种是 causal graph;还有一种和 causal graph 相近的 structural equation models。 Correlation is not causation 预测问题可以写为 它表示的是,如果我们观察到 X=x,预测 Y。而因果推断关系的是 它表示我们如果把某个变量 X 设置为 x