date: 2025-01-17
title: CSN & cCSN & PC
status: TOBECONTINUED
author:
- AllenYGY
tags:
- NOTE
- CSN
- PC
publish: true
CSN & cCSN & PC
文章提出了一种基于统计依赖性的计算方法来构建每个细胞的基因-基因网络。
通过以下公式来估算这些概率:
边缘概率估算:
其中,
可以得到每个细胞中基因对的独立性统计量
PC 算法的主要步骤如下:
初始化阶段:首先,PC 算法假设所有的变量之间都有边相连,即它开始时认为每对变量之间都有可能存在直接的因果关系。
独立性检验:然后,PC 算法通过对每对变量之间进行条件独立性检验来逐步删除图中的边。具体地,算法使用统计检验(如假设检验)来判断在控制其他变量的情况下,两个变量是否独立。如果独立,则表示这两个变量之间没有直接的因果关系,算法将删除该边。主要修改这部分代码
逐步删除边:PC 算法采用逐步消除的策略,首先检测一对变量之间的边,然后逐渐增加控制的变量集合,直到无法进一步简化图结构。
有向边与无向边:在完成边的删除后,PC 算法通过确定变量之间的条件独立性来确定哪些边应该是有向边。这个阶段通常需要额外的步骤来确定方向性,通常依赖于启发式规则和额外的假设(例如,假设数据来自于一个“真实”因果过程)。
生成因果图:最后,PC 算法会输出一个因果结构图,图中的边表示变量之间可能的因果关系。
两个随机变量
换句话说,
条件独立性表示,在给定一个或多个变量的条件下,两个变量独立。用数学公式表示,如果给定了一个变量集合
这意味着,在已知
即,条件独立性意味着,在条件
贝叶斯定理可以用以下公式表示:
其中: