基于概率图的因果推断模型在生物医学数据分析中的应用文献综述

 2022-11-04 10:33:31

文献综述(或调研报告):

因果推断知识整理

基本完成因果推断现状的内容总结,包括因果的定义、因果发现方法、因果推断方法、在生物医学中的应用、目前未解决的问题等。以下是整理内容的大纲:

  1. 因果定义

相关并不意味着因果关系,或者说统计特性本身并不能决定因果结构,但我们至少可以从统计相关性中推断出因果联系的存在。Hans Reichenbach的共同原因原理(Reichenbachrsquo;s common cause principle)在统计特性和因果结构之间建立了联系: 如果两个随机变量X和Y在统计上相关,那么存在一个影响两者的变量Z(特殊情况下Z可以与X或Y重合)。此外,在给定变量Z的情况下会使X和Y相互独立。[1]

则因果关系是两个事件之间的作用关系,这两个事件被一个有方向的机制连接,其中A事件引发B事件发生概率差异,且这一差异是由A事件导致的。给定两个不相交的变量集合X和Y,X对Y的因果效应,表示为或,是从X到Y上的概率分布空间的函数。[2]

  1. 因果发现方法
    1. 基于约束的算法
      1. PC算法

从完全连通图出发,基于独立性或条件独立性假设检验等统计方法给出的变量之间的独立性而砍掉相应的边,从而获得变量间的无向图;在方向学习阶段,则依赖于V-结构(V-Structure)等局部结构特性确定部分边的方向。[3]

      1. IC算法
  1. 对每一对变量a、b, 若不存在,使得a、b在下条件独立,则将a、b用无向边连接;
  1. 对所有不相邻但有公共邻点c的a、b,检查c是否属于,若是则继续,若不是,则
  1. 若且存在从a到b的严格有向路径,则在b处添加箭头;若ab不相邻但且c-b,则
  1. 如果,则对所有与a不相邻的c[4]
      1. MMPC(Max Min parents amp; children)

可针对高维数据,只研究局部结构local learning

给定忠诚于某个贝叶斯网络N的分布J和目标节点集T,确定PC(T)

首先在CPC(candidates parents amp; children)根据关联性质(G^2test)增加变量,(增加的变量满足条件:在与此变量关联最小的CPC子集条件下,此变量与T的关联最大),然后通过条件独立性删除变量得到PC(T)[5]

      1. MMMB(确定马尔科夫毯MB(T)的算法)

MB(T)包含T的配偶(parents of common children)

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。