《《组学研究技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《组学研究技术》PPT课件.ppt(85页珍藏版)》请在三一办公上搜索。
1、Chapter 10 基因组学研究技术,Capter 1,物理图谱 基因转录图谱 基因组功能分析技术 生物信息学技术,主要内容,物理图谱,物理图谱(physical map)测定DNA分子,绘制构成基因组的全部基因的排列和间距。即直接将DNA分子标记、基因或克隆标定在基因组的实际位置。目的 把基因的遗传信息 在染色体上的相对位置 线性而系统地排列出来,染色体上每个DNA片段的顺序以已知核苷酸序列的DNA片段(STS)为“路标”,以碱基对(bp,kb,Mb)作为基本测量单位(图距)的基因组图。,物理图谱,物理图的距离 依作图方法而异 辐射杂种作图的计算单位为厘镭(cR)限制性片段作图与克隆作图
2、图距单位为碱基对(bp)。,【cR(厘镭):在确定的辐射剂量下染色体断裂的百分率。】,物理图谱要素 序列 位置 长的序列中 物理图:标明各个序列的路标 通过分子杂交的办法 利用DNA双链互补特点 一个DNA片段杂交在这个位置 说明这个位置的结构与它相似即这个位置的标记 以序列作为标记的位置,物理作图的方法 限制酶作图(Restriction Mapping)基于克隆的基因组作图(clone-based mapping)荧光原位杂交(Fish,Fluorescent in situ hybridization)序标位作图(STS,Sequence taged site),物理图谱的意义 获得分布
3、于整个基因组的30000个序列标签位点(sequence tagged site,STS),使基因组每隔100kb距离就有一个标记 在此基础上构建覆盖每条染色体的大片段DNA克隆 如:,酵母人工染色体(yeast artificial chromosome,YAC)细菌人工染色体(bacterial artificial chromosome,BAC)人工附加染色体(human artificial episomal chromosome,HAEC)人工噬菌体染色体(P1 bacteriophage artificial chromosome,PAC)等连续克隆(Contig),限制酶作图,D
4、NA链的限制性酶切片段的排列顺序 即酶切片段在DNA链上的定位 限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,构成独特的酶切图谱(Restriction Mapping)。又称DNA物理图谱 DNA分子结构的特征之一,DNA是很大的分子,限制酶产生用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系即DNA物理图谱解决的问题,DNA物理图谱是顺序测定的基础 指导DNA测序的蓝图 Why?,限制性作图 将限制性酶切位点标定在DNA分子的相对位置 只能应用于较小的DNA分子 上限取决于作图分子中限制酶位点
5、的频率 采用6碱基对识别顺序的限制酶 适合50KbDNA分子的精确作图,限制酶作图,基本原理,把庞大的DNA先“敲碎”,再拼接 以Mb、kb、bp作为图距 以STS(sequence tags site)探针序列为路标,主要是把含有STS对应序列的DNA的克隆片段 连接成相互重叠的“片段重叠群(contig),(1)完全降解,选择合适的限制性内切酶 完全降解待测DNA链(同位素标记)凝胶电泳分离 自显影 获得图谱 即组成该DNA链的酶切片段数目和大小,基本步骤,同位素标记,32P,限制性内切酶,电泳,末端标记待测DNA的一条链(同位素)酶部分降解 控制反应条件使DNA链上酶切口随机断裂 避免所
6、有切口断裂的完全降解 电泳分离 自显影 比较自显影图谱 根据片段大小及彼此间的差异 排出酶切片段在DNA链上的位置,(2)部分降解,1,2,比较,排出酶切片段,完整的物理图谱应包括 基因组的不同载体DNA克隆片段重叠群图 大片段限制性内切酶切点图 DNA片段或一特异DNA序列(STS)的路标图 基因组中广泛存在的特征型序列等的标记图(如CpG序列、Alu序列,isochore)【具有mosaic结构,称为isochore。即基因组是由一些较长的大片段(平均长度300 Kb)组成,GC含量相对均匀,而在这些大片段的两端GC含量是跃变的,而不是渐变的】,荧光原位杂交(Fish,Fluorescen
7、t in situ hybridization),将探针用荧光标记,与细胞分裂中期的染色体杂交,用荧光显微镜观察信号所处的位置,将探针标定在连锁图上。,荧光原位杂交(fluorescent in situ hybridization,FISH),荧光原位杂交(fluorescent in situ hybridization,FISH),荧光原位杂交(fluorescent in situ hybridization,FISH),荧光原位杂交(fluorescent in situ hybridization,FISH),用DNA纤维分析水稻第4号染色体,基于克隆的基因组作图,大片段DNA的克
8、隆载体 YAC:酵母人工染色体 230-1700Kb BAC:细菌人工染色体 300Kb PAC:P1人工染色体 300Kb Cosmids:30Kb,重叠群(Contig):相互重叠的DNA片段组成的物理图 Contig组建方法:染色体步移 指纹作图,克隆作图,构建全基因组DNA 基因文库,构建指定单一染色体的基因文库,PCR检测STS分子标记,根据重叠STS标记绘制克隆连锁图,提取基因组DNA,流式细胞仪分离染色体,打断 打断,染色体步移,原理,chromosome walking,酶切,插入,A基因探针筛选,亚克隆片段重新筛选,亚克隆片段重新筛选,亚克隆1,相邻亚克隆2,指纹:确定DNA
9、样品所具有的DNA片段 一个克隆的指纹 即表示该克隆所具有的限定的顺序特征,克隆指纹分析原理,如果2个克隆彼此重叠 它们一定含有相同的序列克隆指纹主要用于重叠群(Contig)的构建,指纹分析方法,限制性带型(restriction patterns)指纹 重复顺序DNA指纹(repetitive DNA fingerprints)STS目录作图(STS content mapping)重复DNA PCR(repetitive DNA PCR)或分散重复顺序PCR指纹(interspersed repeat element PCR,IRE-PCR),限制性片段指纹,重叠顺序DNA指纹,STS指
10、纹,Contig,序标位(STS)作图,长度:100-500 bp 序列已知,可以设计PCR反应 单拷贝,在染色体上的位置是唯一的 EST(Expressed sequence tag)可以作STS,STS:sequence tag sit,STS作图原理,成套片段,2个标签同时出现在6个大片段中,只有2个大片段有2个标签,染色体DNA,STS作图原理,寻找STS的方法,表达顺序标签(expressed sequence tag,EST)从cDNA中找到的小段顺序 基因家族成员间共有的序列不能用于STS SSLP(simple sequence length polymorphisrns)随机
11、基因组顺序,表达顺序标签EST 随机挑选cDNA克隆进行单向、一步大规模测序 所获得的部分cDNA序列即EST,EST是一个cDNA克隆快速大规模测序后 所获得的端和端部分cDNA随机片段 每个EST长度约200600bp 代表了一个单拷贝基因的部分cDNA表达序列,大多数EST的长度不足400bp Why?一个基因转录本的cDNA序列 可能包含多个序列重叠的EST,一个基因mRNA剪接点不同 可以获得多个cDNA克隆那么,EST既可能对应于一个cDNA的某一部分 又可能代表mRNA的不同剪接方式,基因转录图谱,(transcription map),转录图谱(基因图谱)在识别基因组所包含的蛋
12、白质编码序列的基础上 绘制的结合有关基因序列、位置及表达模式等信息的图谱。,即利用EST作为标记所构建的分子遗传图谱。,(gene map),Or transcription map:在人类基因组中鉴别出占2%至5%的全部基因的位置结构与功能。基本原理:蛋白质推测mRNA的序列,mRNA反转录为cDNA,然后利用其与所测序列进行杂交,鉴别出与转录有关的基因。,基本原理,生物性状和疾病 由结构或功能蛋白质决定 已知的蛋白质 由mRNA编码 mRNA反转录 合成cDNA 即EST的cDNA片段 用这种稳定的cDNA或EST 作为“探针”进行分子杂交 鉴别出与转录有关的基因,基本原理,或用PolyA
13、互补的寡聚T 或克隆载体的相关序列作为引物 对mRNA双端尾侧的几百个bp进行测序 得到EST(表达序列标签),表达序列标签(EST),克隆测序,获得EST,基本过程,细胞/组织,高质量mRNA,构建cDNA文库,克隆3和5端探针,估计全长和复杂性,杂交阵列文库,克隆3和5端,全长候选基因,纯化克隆,证实5端,基因图谱的意义1、能为估计人类基因的数目提供可靠的依据。2、提供不同组织、不同时期基因表达的信息(数目、种类及结构功能)。3、提供结构基因的标记,可以作为筛选基因的探针,有直接的经济价值。4、鉴定病态基因(如癌基因)的变异位置。,单核苷酸多态性(Single Nucleotide Pol
14、ymorphisms,SNPs),人类是一个具有多态性的群体。不同的群体和个体在生物学性状(对疾病的易感性抗性)上的差别,是进化过程中基因组与环境相互作用的结果,不同个体间在基因水平上的单核苷酸变异,平均每1000对碱基出现一个SNP,2个无关个体间有300万SNPs.,SNP作图的一般步骤包括:,获取DNA序列;从DNA序列确定序列标签位点(sequence tagged sites,STSs);扫描STSs或ESTs确定候选SNPs;确定SNPs;将SNPs定位于染色体特定位置。,特异杂交,SNP不同于罕见的单碱基突变(Mutation)SNP等位位点出现的频率1 位于基因的编码序列中的S
15、NP称为cSNP 如果cSNP引起蛋白质重要部位AA变异 导致其功能发生改变 位于基因调控序列中的SNP影响基因的表达调控 SNP因连锁不平衡所形成的单倍型 用于关联研究(Association studies)确定与之联锁的生物学性状相关序列,连锁分析与基因定位 疾病的关联研究 多基因疾病的基因定位 个体识别和亲子鉴定 发病机理的研究 个体用药 生物进化和生物间相互关系,SNP应用,【例1】镰刀型贫血症(sickle-cell anemia)血红蛋白的珠蛋白基因 17位的A突变为T 导致Val变Glu 血红蛋白构型改变 携氧能力大大降低,引发严重贫血,SNP与临床,直接导致遗传病,【例2】静
16、脉血栓(venous thrombosis)凝血因子5(factor V)基因 1691位的G突变为A 导致Arg变为Glu 封闭了抗凝血因子APC(activated Protein C)对factor V的切割位点 促使血栓形成,关联分析(Association studies):如果某一因素可增加某种疾病的发生风险 即与正常对照人群相比 该因素在疾病人群中的频率较高 那么,该因素与疾病相关联 如 非遗传因素吸烟与肺癌相关 遗传因素中,APOE4与Alzheimers相关,SNP与遗传标记,研究复杂性状与疾病的遗传,以及群体的基因识别,老年痴呆/阿尔海默症,遗传标记 用于遗传分析或关联分析
17、的特征核酸位点SNP 数量多,分布广泛SNP 适于快速、规模化筛查SNP 等位基因频率的容易估计 易于基因分型,同样药物的剂量 对病人甲有效 对病人乙不起作用 对病人丙则可能有副作用药物的疗效与副作用方面,病人的反应差异很大 Why?病人遗传学上存在差异(单核苷酸多态性SNP)导致对药物产生不同的反应,SNP与个体用药,【例】细胞色素P450酶 与大约25%广泛使用的药物的代谢有关 如果病人该酶的基因发生突变 就会对降压药异喹胍产生明显的副作用 那么,查明病人的SNP图谱 检测病人是那一个或多个基因发生突变 对症下药 个体医疗。,美国国立卫生研究院(NIH)提供(National Instit
18、utes of Health)与癌症和肿瘤相关的候选SNP数据库:http:/GAI 适于生物医学研究的dbSNP多态数据库:http:/SNP,SNP公用数据库,基因组功能分析技术,基因分离技术,差异基因分离技术 SAGE(Serial Analysis of Gene Expression)基因芯片技术 遗传连锁分析 位点关联分析;,双杂交技术 蛋白组学 基因封闭技术(反义核酸、核酶、RNAi、基因剔除)基因替代技术(基因转移、可控性基因表达)蛋白修饰技术 生物信息学分析技术,基因功能研究技术,变性高压液相色谱(DHPLC)(denaturing high-performance liqu
19、id chromatography)基质辅助激光解吸飞行时间质谱(MALDI-TOF)(Matrix-assisted laser desorption/ionization-time of flight)DNA Chip SSCP(单链构像多肽性)动态特异等位基因杂交(dynamic allele-specific hybridization),SNP大规模分离检测技术,新基因功能研究策略,基因表达系列分析SAGE(serials analysis of gene expression)1995 Velculescu 及其同事年创立,原 理来自转录物内特定位置的一小段寡核苷酸序列(911bp
20、)含有鉴定一个转录物特异性的足够信息,可作为区别转录物的标签(tag);通过简单的方法将这些标签串联在一起,形成大量多联体(concatemer),对每个克隆到载体的多联体进行测序,并应用SAGE软件分析,可确定表达的基因种类,并可根据标签出现的频率确定基因的表达丰度(abundance)。,SAGE 步骤,磁珠,磁珠,磁珠,磁珠,磁珠,磁珠,识别序列,识别序列,标签,连接,扩增,SAGE实例,锚定酶辟分 AE,一半结合结头B,一半结合结头A,标签酶辟分 TE,标签酶 辟分 TE,连接、用引物A、B扩增,双标标签,锚定酶辟分 分离双标标签,连接、用引物A、B扩增,串联克隆,双标标签,双标标签,
21、SAGE,SAGE特点:研究转录物组转录水平;可寻找较低丰度的转录物,最大限度地收集基因组的基因表达信息;,快速详细分析成千上万个EST,寻找表达丰度不同的SAGE标签序列,完整获得基因组的表达信息;SAGE可用于在不同环境、不同生理状态及不同生长阶段的细胞和组织表达图谱构建,对不同状态下基因表达水平的定量或定性比较,特别是对疾病组织与正常组织的比较发展迅速;,生物信息学技术,读懂“天书”,生物信息学技术,读懂“天书”,什么是生物信息学?,建立生物学信息系统框架 支持生物学的信息管理系统 分析工具 通讯网络 即传统的生物信息学(Bioinformatics),两个交叉领域的工作,生物信息学计算机技术,基于计算理解基本生物学问题 即计算生物学(Computational Biology),基因组信息的收集、储存、管理与提供 新基因的发现与鉴定 非编码区信息结构分析 生物进化的研究 完整基因组的比较研究 基因组信息分析的方法研究 大规模基因功能表达谱的分析 蛋白质分子空间结构预测模拟和分子设计 药物设计等。,研究内容与应用范围,EST数据库(包括SAGE数据库)STS数据库(遗传标记,电子PCR)SNP数据库 蛋白数据库 蛋白结构数据库 蛋白功能位点数据库(PROSITES)UNIGENE,基因数据库,同源性分析,分子进化分析,END,
链接地址:https://www.31ppt.com/p-5589552.html