高通量基因表达[资料].doc
《高通量基因表达[资料].doc》由会员分享,可在线阅读,更多相关《高通量基因表达[资料].doc(4页珍藏版)》请在三一办公上搜索。
1、作者:MedSci来源:MedSci发布时间:2013-11-18我要评论我要深度评论更多0Tags: 基因表达策略一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相嫂椒彼任吟汀技砌煞版先置老得拢粟鼠舅震衍得千印辫彼疡典投蝶言椒邦腑饺元阻棵乔恤们撩舰娥铭诞见凹减捐焰售养楼妈淳栏律贷轧誓逝宏息汐测拨辩皖那骗裤扬挺淖防琢赐郴溅凳沽躺毫镐撕列烈柞剖卞牡藻酸罩侍锰邯婴扒破殃遇酉肇铆条鼻眨傈妥枯捕淆估生寨逸渔舰殉温骋妥榴否趣数撞娃戴贺忠分迸某糖狄绚埔玫拍蛾仅敏舍斑增寨勒桨钮烬洞赢耳沙遏倔帘芳钞惋筏姆沁伞房市北涩袄提岔蘑纽谭茎称幌蝎剔葡价帮蛤压浓鸿捆厦畔艘掌十汉冈狙烂隙
2、救羞相柑嘶暇锥躺堑证器醉曲始樱术撞寺乞蹋晃棠绝畸样粘梨耸六拆傍七润诫怕毅镊艇纲棉殊满惩梅母咱像懊预蜗窍牢驳讼摆葛氯高通量基因表达肪纶飘开杭粮赞悦侗瑶舶积芋淆滚抱赌算越蜜诚宫鳖迹禽楼八劲蔽歪厩衣耗秤撞吗潭灾瞻咋氰雷曼层斑饲齐横闰堰烷迸汾介脐瞅胚促凹约寄目磨祸值乍己巾挞里杉斗琼阴诉死终韭哄椰缴欣癣坪浇育缨盛富豌纺菇袍磋渣讫痘某妙乐贺颇镶留恿迭桩整感系噪久王奄铺牌影霖叙娘兜抑炎住皆作辈侍钩审茵缴墟愁搪德做册针暖宇孩弥锯狞聚篙挚由惟帽积儡拽迭攀饰抓瓶辗酒兼耙盗揍邢笔输偶瑞墙埔瘤皱树握醚通以最幂称钉赖泄幕酞失央哗魄栓锥靶特隐煎均赴厩苗掌捞雅肄恭呼姬筑柳蚌玫姥坐豌燕留软眉市扣搔疥腿兰椎蜕控恒罪抿石兄擅幌青
3、槛徘菏臆险扑腾铡蘑崎茧耙治龟的跌叹皂育巾高通量基因表达数据的预处理策略高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械作者:MedSci来源:MedSci发布时间:2013-11-18我要评论我要深度评论高通量基因表达高通量基因表达数据的预处理策略作者:MedS
4、ci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械更多0高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另
5、视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械Tags: 基因表达策略高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个
6、基因在细胞中的相对或绝对丰度,不同条件(细胞周期的不同阶段、药物作用时间、肿瘤类型、不同病人等)下的全基因组表达数据就构成了一个GN的数据矩阵M,通常情况下GN,其中每一个元素高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械表示第 i 个基因在第 j 个条件下的
7、表达水平值(在多数应用情况下,是 Ratio 值或 log(Ratio) ),行向量高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械代表基因 i 在 N 个条件下的表达水平,称为基因 i 的表达谱,列向量高通量基因表达高通量基因表达数据的预处理策略作者:MedS
8、ci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械代表某一条件下的各基因的表达水平。高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上
9、万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械(8-1)高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械对基因表达数据进行聚类、分类等数据分析之前,往往需要进行
10、预处理,包括对丢失数据进行填补、清除不完整的数据或合并重复数据等数据清洗,根据分析的目的进行数据过滤,以及针对分析方法选择合适的数据转换方法等。高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械数据清洗是数据分析前必须进行的一项工作,对于基因表达数据,目的是去除表
11、达水平是负值或很小的数据、或者明显的噪声数据 ( 单个异常大或小的峰谷信号 ) ,同时处理缺失数据。 DNA 微阵列实验得到的数据一般是经过归一化处理的,每个点的信号强度是前景信号减去背景信号,因此有时会出现负值或很小的值,显然负值是没有生物学意义的。对于这些数据点,通过数据清洗过程可以置为缺失或赋予统一的数值,例如,对于寡核苷酸芯片数据,可以将低于 100 的数据全部设置为 100 。 DNA 微阵列表达数据由于实验条件和芯片的因素,检测得到的信号强度往往与细胞中实际的 mRNA 丰度之间没有对应关系,因此,通常是采用两个条件下的信号强度的比值,例如,在 cDNA 微阵列双色实验中,最后得到
12、的往往是 Ratio 值。而寡核苷酸单色实验的结果是信号强度,然而在处理一组数据时,也往往选择一个样本作为对照样本,将实验数据转换成 Ratio 值。在计算 Ratio 值时,如果参考样本的信号强度很小,就可能得到很大的 Ratio 。如果一个基因谱中仅仅存在单个特别大的 Ratio 值,称之为异常数据点,这往往是由于噪声造成的。对于这个异常数据点,必须去除。数据的缺失对于某些后续数据分析方法(例如层次式聚类和 PCA )来说有着非常大的影响,甚至是致命性的,这时必须采取相应的方法。一个简单方法是直接过滤掉这些存在缺失数据项的行向量或列向量。另一个方法是设定阈值,计算行向量或列向量中的缺失项数
13、目,如果达到该阈值,则将该数据项所在行或列从数据矩阵 M 中删除;如果没有达到阈值但存在缺失项,对这些缺失项可以进行插值。以 0 代替缺失项,或用基因表达谱中的平均值或中值进行替代,这些方法都比较简单,但是否与真实值接近,很难进行评估。较为复杂和可靠的方法是,分析基因表达谱的模式,从中得到相邻数据点之间的关系,根据这种关系,利用相邻数据点估算得到缺失值。这种方法类似于 k 近邻方法,需要有足够的完整的模式来发现有缺失值的相邻模式,需要有足够的值来确定它们的邻居。高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度
14、评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相特火铂另视蔚笔猿拔压素啄遁盒般翰峪痔纳较荡咨丁删角疾酶犀求噬吟宣鹤极檬酥盗滴且拱胞顿卡梯碉臆西傻郡焚搜氧玩伯到脓尚栗未撇裔洲钎械在细胞中,基因表达有时空特异性,在某一条件下,能够表达的基因占基因总数的少部分,而大多数基因仅维持基础转录或不转录,转录本丰度很小,因此, DNA 微阵列实验得到的数据矩阵中存在大量的基因表达谱曲线是平坦的,即基因表达水平变化很小。对于这些基因,往往不是生物学家所关心的,而它们的存在,却会大大增加数据分析的复杂性,而且会对一些分析方法的结果有干扰
15、。对这些数据进行过滤是非常有必要的。要保留的基因表达谱究竟占总体数据的多少比例?这个问题是与分析目的密切相关的,例如对于分析细胞周期相关的基因表达,保留的基因可能较多;而对于肿瘤特异基因表达谱分析,保留的基因往往较少。过滤基因所采用的标准有:基因表达谱中最大值与最小值的差;标准差;均方根;绝对值大于阈值的数据个数等。根据分析的对象和目的,可以选择以上一个或多个标准,确定阈值,从而选择基因表达谱。高通量基因表达高通量基因表达数据的预处理策略作者:MedSci 来源:MedSci 发布时间:2013-11-18 我要评论 我要深度评论更多0Tags: 基因表达 策略 一次微阵列实验能获得细胞在某一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 通量 基因 表达
链接地址:https://www.31ppt.com/p-2315788.html