《基因芯片技术》第8章-利用基因芯片进行差异表达基因分析课件.ppt
《《基因芯片技术》第8章-利用基因芯片进行差异表达基因分析课件.ppt》由会员分享,可在线阅读,更多相关《《基因芯片技术》第8章-利用基因芯片进行差异表达基因分析课件.ppt(62页珍藏版)》请在三一办公上搜索。
1、基因芯片技术,Gene chip technology,内容提要:第一节 差异表达基因分析第二节 聚类分析第三节 主成分分析,第8章 利用基因芯片进行差异表达基因分析,第一节 差异表达基因分析,单张cDNA芯片差异表达基因,Aerobic 需氧Anaerobic不需氧,差异表达基因分析,基因表达谱芯片实验的主要目的之一是发现两个样本间差异表达基因。通常采用基因在实验组和对照组中信号的比值作为衡量基因在两种状态下基因的表达差异。在双色荧光系统中,用Cy5/Cy3的比值来衡量基因的表达差异,也称表达差异值。,差异表达基因分析,在Affymetrix等短的寡核苷酸芯片中,采用单色荧光标记的方式,实验
2、组和对照组分别用两张芯片进行检测,表达差异值即为两张芯片的信号比值。噪声和芯片本身的一些因素以及生物学本身的特点给筛选差异表达基因带来了很大的麻烦。必须设定一个差异表达基因的判定标准。这个筛选的标准就称为差异表达基因的阈值。,如何确定差异表达基因的阈值倍数法,优点:简单、直接。缺点:没有考虑差异表达的统计显著性。比如,在某个实验中,基因表达水平的变化不大,如果选择判别域值为2倍,则有可能找不到几个差异表达的基因,假阴性率比较高。但如果是主观缩小判断域值,又有可能增大假阳性率。,Z值法,在一张cDNA芯片上一般都点了很多基因,其实这些基因中只有一小部分表达有差异,所以一般都假设表达的比率值满足正
3、态分布。Z=(X-)/.|Z|=1.96在寡核苷酸芯片中,芯片上的基因在相应实验条件下或相应组织中也只有一小部分基因有表达,可以假定强度满足对数正态分布,同样可以对其作Z变换,使其具有统计意义。,Z值法,缺点:如果实验体系中没有一条差异表达的基因,Z值法还是会挑选出5的差异表达基因。这是因为在芯片实验中,总有一些由于背景噪声产生的假阳性点。如果实际上实验中有大量的基因表达发生改变,Z值法还是机械的找出5的差异表达基因,丢失了一部分真阳性点。,排秩统计量法,选择一个统计量给基因排秩(研究多,方法多)为排秩统计量选择一个阈值,在阈值之上的值将被认为是表达差异显著的值,重复芯片(replicates
4、)M值法,根据比率平均值或M值对基因排序。M值为信号强度比值的log2值,M杠是任一特定基因在重复序列中M值的均值。缺点:这一排序法忽略了一个基因在重复实验中的不同芯片上表达水平的差异程度。例如,可能某一个基因在某一张芯片上M值很大,但在其他芯片上M值很小,其实这条基因并没有差异表达,但由于个别M值的影响,从而显示出一个差异表达的特性,造成假阳性。,T值排序,假如一个基因在几张重复芯片的M值都很小,但是这些M值非常接近,所以s值也非常小,这样可能会导致t值很大,从而会把这个本没有差异表达的基因误认为差异表达。,修正的T值法,修正值由样本方差的均数和标准差估计而得。结果显示:在一个模拟的数据集中
5、,虽然带有一些经验性质,但用修正t-统计量给基因排秩比用均数和一般的t-统计量效果要好。,单通道寡核苷酸芯片差异基因(两个样本直接比较),Affymetrix,illumina芯片由于有探针重复,可以利用统计方法计算出一个统计性的P值或者score值,筛选差异表达基因。,不同类样本差异基因识别,评价一组数的统计量,平均值 标准差,比较多组数的方法,T检验:平均值F检验:方差,SAM(significance analysis of microarrays)微阵列显著性分析,在单通道Oligo芯片中,尤其是affymetrix芯片数据分析中用得较多,双通道cDNA芯片数据分析用得较多,False
6、 Discovery Rate(FDR)错误发现率,统计学家都想用更符合统计学的手段得到差异基因,即通过假设检验后,赋予每个基因统计显著性或者P值,使得每个基因的判别更有统计学上的意义。为了达到这个目的,统计学家们常常用控制错误发现率(False Discovery Rate)的方法来判断差异基因。错误发现率是评估检验统计显著性的最有力工具之一。,Multiple test(P-value adjustment)多重检验(P-价值判断),火山图(volcano plot),Statistical test:P-value(统计检验:P值)Fold change:Ratio(折叠变换:比率),其
7、他方法,B-statistics(Smyth,2004)Bayes T-test(Baldi and Long,2001)SAMROC(Broberg,2002)Zhao-Pan method(Zhao and Pan,2003),Improved Detection of Differentially Expressed Genes对差异表达基因的改良性观测 Time series microarray dataset 微阵列数据的时间序列,聚类:发现一些未知的细胞状态、疾病的亚型以及一些能识别这些样本状态的基因,或者说发现一类功能相似的基因或者一类有共同调控机制的基因。归类(分类):基于已
8、有知识,并有改进现有知识的潜力,通过训练分类器来辨识与已知细胞状态或疾病亚型相类似的样本,或者是与已知的共调控基因表达相似的基因。,第二节 基因芯片聚类分析,分类(classification),分类(classification),样本分类情况已知分类基因选取分类准确性判断:准确率,相关性,层级聚类方法:,得到类似于进化分析的系统树图,具有相似表达谱的基因彼此临近,他们可能具有相似的功能。其重要思想是:先将n个样本看成n类,计算类间的距离,再将相似性最高的两类合并成为一个新类,得到n-1类,再重新计算关系矩阵,不断重复这个过程直至所有的基因融合成为一个,基因表达数据矩阵(Affymetrix
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因芯片技术 基因芯片 技术 利用 进行 差异 表达 基因 分析 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4023244.html