基因组转录组和蛋白组ppt课件.pptx
,基因组、转录组和蛋白质组Genomes, Transcriptomes and Proteomes结构基因组学、功能基因组学、比较基因组学,概念,基因组是指一个单倍体细胞中遗传物质得总量。染色体或基因,转录组一个细胞全部的mRNA 含量,是一个细胞在某一阶段必须的生物信息,这些RNA分子会指导合成基因组表达的最终产物,蛋白质组。,蛋白质组一个细胞合成的功能蛋白质的总和。,蛋白质组学是人类基因组计划研究发展的基础上形成的交叉学科,主要是从整体水平研究细胞内蛋白质的组成,结构及其自身特有的活动规律,蛋白质组研究的意义,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体,蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质结构等问题,必须要依赖于对蛋白质组学的研究来解决。,任何一种疾病在表现出可察觉的症状之前,就已经有一些蛋白质发生了变化。因此寻找各种疾病的关键蛋白和标志蛋白,对于疾病的诊断、病理的研究和药物的筛选都具有重要意义。,肿瘤组织与正常组织之间蛋白质谱差异,找到肿瘤特异性的蛋白分子,可能会对揭示肿瘤发生的机制有帮助,目前已应用于肝癌、膀胱癌、前列腺癌等研究中。开发新蛋白质、获得新基因,Figure 3.1. The genome, transcriptome and proteome.,基因组的表达不仅仅是一个遗传信息由DNA-RNA-蛋白质的一个过程,这个法则忽略了信息流由基因组到蛋白质组传递过程是被调控的,这个过程每一步都是受到调控,从而使得转录组和蛋白组的成分能够做出迅速和准确的改变,并能使细胞调整自己的生化状态能对外界的刺激做出反应,,转 录 组 Transcriptomes,转录组是特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括和非编码。,蛋白质是行使细胞功能的主要承担者,蛋白质组是细胞功能和状态的最直接描述,而由于目前蛋白质实验技术的限制,转录组成为研究基因表达的主要手段。转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带,转录水平的调控是目前研究最多的,也是生物体最重要的调控方式。,编码和非编码RNA,细胞的RNA含量可以分为两类编码RNA非编码RNA,编码和非编码RNA,编码RNAmRNA4%寿命短细菌的mRNA半衰期几分钟,真核细胞大部分mRNA的半衰期也只有几小时转录组的成分不是固定的,可以通过快速的改变mRNA的合成来改变,编码和非编码RNA,非编码RNArRNAtRNA真核生物特有的RNA小核RNA(Small nuclear RNA) (snRNA; 也叫 U-RNA )参与前体mRNA的剪接小核仁RNA(Small nucleolar RNA) (snoRNA),参与rRNA前体的加工以及 核糖体亚基的装配。小胞质RNA(scRNA), 包括几种,有些功能已知,有些功能还未知,小核RNA( snRNA,核内小RNA),存在于真核细胞的细胞核内,为小分子核糖核酸,长度为106-189个核苷酸。作用:参与hnRNA 的剪接和转运。hnRNA:核内不均一RNA,是成熟mRNA的前体。,Figure 3.3. The RNA content of a cell. This scheme shows the types of RNA present in all organisms (eukaryotes, bacteria and archaea) and those categories found only in eukaryotic or bacterial cells. The non-coding RNAs of archaea have not yet been fully characterized and it is not clear which types are present in addition to rRNA and tRNA. For abbreviations, see the text.,1. 无参考基因组的大规模功能基因的发掘(de novo transcriptome analysis); 2. 非编码区域功能研究:Non-coding RNA研究、microRNA前体研究等 3. 转录本结构研究,包括UTR(Untranslated Regions即非翻译区)鉴定、Intron边界鉴定、可变剪切研究,融合基因鉴定等 4. 基因转录水平研究 5. 全新转录区域研究,转录组研究的应用领域,转录组检测的方法,(一)构建cDNA文库并测序(二)基因表达序列分析技术 Serial analysis of gene expression (SAGE) (三)利用DNA chip 可以比较不同的转录组(四)大规模平行信号测序系统MPSS(massively parallel signature sequencing,MPSS)。,(一)cDNA文库(cDNAlibrary)的构建,cDNA:以RNA为模板,在反转录酶的作用下合成的DNAcDNA基因文库:从一定生长阶段或条件的某种细胞分离到的全部mRNA经反转录成 cDNA后再重组和增殖形成的基因文库。,cDNA文库的特点 1. 细胞特异性 来自结构基因,仅代表正在表达的基因的遗传信息:15% mRNA,8085% rRNA,1015% tRNA 2. 组织、器官特异性 不同器官或组织的功能不一样,4. 可了解基因的表达丰度 在同一个cDNA文库中,不同类型的cDNA分子的数目是大不相同的,尽管它们都是由单拷贝基因转录而来的。这与基因组文库中的单拷贝基因均具有相同的克隆数相较,这是两种文库的另一差别。,3. 代谢或发育特异性 处于不同代谢阶段(或发育阶段)的结构基因表达亦不相同,cDNA文库的优点,cDNA不存在间隔序列,cDNA文库的缺点,要测序所有的cDNA克隆,费时费力,每一个cDNA克隆都只含有一种mRNA序列,cDNA基因文库 是分离基因的重要手段,(二)基因表达序列分析技术 Serial analysis of gene expression (SAGE),表达的基因和表达丰度,Sage技术的主要理论依据 一个短得寡核苷酸序列(12bp)含有鉴定一个转录物特异性的足够信息,可以作为区别转录物的标签(tag)4这些标签串联在一起,形成大量多联体(concatemer),对每个克隆到的多联体进行测序并应用SAGE软件分析,可确定表达的基因的种类和丰度,12,Figure 7.22. SAGE. See the text for details. In this example, the first restriction enzyme to be used is Alu I, which recognizes the 4-bp target site 5 -AGCT-3 (see Table 4.3 ). The oligonucleotide that is ligated to the cDNA contains the recognition sequence for Bsm FI, which cuts 10 14 nucleotides downstream, and so cleaves off a fragment of the cDNA. Fragments of different cDNAs are ligated to produce the concatamer that is sequenced. Using this method, the concatamer that is formed is made up partly of sequences derived from the Bsm FI oligonucleotides. To avoid this, and so obtain a concatamer made up entirely of cDNA fragments, the oligonucleotide can be designed so that the end that ligates to the cDNA contains the recognition sequence for a third restriction enzyme. Treatment with this enzyme cleaves the oligonucleotide from the cDNA fragment.,用生物素酰化的oligo(dT)引导合成cDNA第一链,再合成双链cDNA,用专门识别4bp碱基的锚定酶(anchoring enzyme),如NlaIII(识别位点为CATG)消化合成的双链cDNA,释放5序列,而生物素酰化的3端仍被吸附在链霉亲和素蛋白磁珠(streptavidincoatedbeads)上分离与磁珠结合的具3端poly(A)尾巴的cDNA片断,与含有IIS类限制酶位点的接头连接,酶切位点一般位于识别位点后20bp处,再用标签酶(tagging enzyme),如BsmFI等IIS类限制酶处理样品,释放带有接头的SAGE标签带有接头的SAGE标签经DNA聚合酶(Klenow)补平后,由连接酶产生带有两个接头的双标签(ditag),对双标签PCR扩增后,再用锚定酶消化,得到尾尾相连的SAGE双标签,双标签的两端分布着锚定酶的酶切位点去除接头的SAGE双标签彼此连接形成长短不一的多联体,电泳分离后收集大小适中的片段克隆到高拷贝的质粒载体,由此形成SAGE库随机挑选SAGE库中的克隆测序,用专门设计的SAGE软件分析得到的标签序列,通过与GenBank、dbEST或SAGEmap等数据库进行比较,获取所需的资料。,SAGE的应用确定不同组织或细胞的表达谱,并能确定基因的表达丰度1995年Velculescu等首次从人类胰腺中得到了1000个标签,其中351个(41.6)只出现一次,77个标签出现多次,10个丰度最高的标签中有9个至少与GenBank序列匹配一致。这个结果与cDNA文库结果一致鉴定新的基因利用13bp寡核苷酸(9bp标签加上4bp锚定酶位点)做为探针,筛选胰腺cDNA文库分离了4个未确定标签所对应的克隆,结果有3个标签对应的克隆代表了两个已知的基因,其中一个可能代表新的基因,(三)生物芯片技术,生物芯片技术是20世纪90年代生命科学领域中迅速发展起来的一项新技术,是综合运用生物、微电子、微加工和计算机等知识制作的高科技杰作。其本质是固定在玻片等载体上的微型生物化学分析系统,芯片上每平方厘米可密集排列成千上万个生物分子,能快速准确地检测细胞、蛋白质、DNA及其他生物组分,并获得样品的有关信息,其效率是传统方法的成百上千倍,被美国科学促进会评为1998年的世界十大科技突破成果之一。,生物芯片技术:高通量的杂交技术。,生物芯片分类根据芯片上的固定的探针不同,基因芯片、蛋白质芯片、细胞芯片、组织芯片,根据原理元件型微阵列芯片、通道型微阵列芯片、生物传感芯片等新型生物芯片,基因芯片(genechip),http:/bmes.alfred.edu/degree.html,基因芯片(Genechip)DNA微阵列(DNA Microarray),原理基本原理与传统的核酸印迹杂交(Southern blot, Northern blot)相似,是基于核酸探针互补杂交技术原理而研制的。所谓核酸探针只是一段人工合成的碱基序列,在探针上连接上一些可检测的物质,根据碱基互补的原理,利用基因探针到基因混合物中识别特定基因,当探针与芯片上的靶基因杂交后,经严格的洗涤,除去未杂交或部分配对的探针DNA分子(正常配对的双链热力学稳定性比错配双链高),用荧光检测仪定量分析杂交信号强度,由于探针与靶基因完全配对时产生的荧光信号强度比含一个或两个错配碱基的杂合分子高数十倍,因而精确测定荧光信号即可实现检测的特异性。同时通过检测每个靶基因分子的杂交信号强度,就可获得样品分子的数量和序列信息。 分类cDNA芯片有寡核苷酸芯片Genomic芯片,优点:大规模、高通量、高效率、并行性、自动化,Figure 7.23. Transcriptome analysis. (A) Transcriptome analysis with a DNA chip carrying oligonucleotides representing all the genes in a small genome. After adding labeled cDNA, the positions of the hybridization signals on the chip indicate which genes have contributed to the transcriptome under study. (B) With a larger genome, cDNA clones prepared from the transcriptome of one tissue are immobilized as a microarray and probed with cDNAs representing the same or a different transcriptome. By comparing the hybridization patterns, genes that are expressed differently in the tissues from which the transcriptomes are obtained can be identified.,基因芯片的应用,根据应用领域的不同可将基因芯片分为表达谱芯片、测序芯片和诊断芯片三大类。表达谱基因芯片:基因的功能分析、疾病发生机理探讨、发育模式调控机理探讨、药物研究和筛选等众多方面;测序芯片:主要用于测定DNA序列;诊断芯片:检测基因变异和诊断疾病。,分析基因的表达与功能例1:拟南芥Schena等采用拟南芥基因组内共45个基因的cDNA微阵列(其中14个为完全序列,31个为EST)检测该植物的根、叶组织内这些基因的表达水平,用不同颜色的荧光素标记逆转录产物后分别与该微阵列杂交根和叶组织中存在26个基因的表达差异,而参与叶绿素合成的CAB1基因在叶组织较根组织表达高500倍,检测基因变异与诊断疾病 正常人的基因组中分离出DNA与DNA芯片杂交就可以得出标准图谱。从病人的基因组中分离出DNA与DNA芯片杂交就可以得出病变图谱。通过比较、分析这两种图谱,就可以得出病变的DNA信息 Affymetrix公司,把P53基因全长序列和已知突变的探针集成在芯片上,制成P53基因芯片,将在癌症早期诊断中发挥作用Heller等构建了96个基因的cDNA微阵,用于检测分析风湿性关节炎(RA)相关的基因现在,肝炎病毒检测诊断芯片、结核杆菌耐药性检测芯片、多种恶性肿瘤相关病毒基因芯片等一系列诊断芯片逐步开始进入市场。,筛选药物 即可以利用基因芯片分析用药前后机体的不同组织、器官基因表达的差异,但是芯片无法同时大量地分析组织或细胞内基因组表达的状况,而且由于芯片技术需要准备基因探针,所以可能漏掉那些未知的、表达丰度不高的、可能是很重要的调节基因,(四)大规模平行信号测序系统MPSS(massively parallel signature sequencing,MPSS),2002年诺贝尔生理学或医学奖获得者Sydney Brenner发明 是微阵列的替代方法:可以在一个sample中计数所有的mRNA是设计用来捕获完整的转录组 对低丰度转录子高度敏感一般可以分析100万个转录子数字资料容易构建大的相关数据库Digital data that is amenable to developing large relational databases可以被应用于任何生物,大规模平行测序技术( massively parallel signature sequencing , MPSS) 是Brenner 等于2000 年建立, 由美国Lynex 公司将其商品化的一种基因克隆新技术.是基于序列分析技术的高通量、高特异性和高敏感性的基因分析技术. 本文就最新建立的大规模平行测序技术做简要介绍, 并比较该技术与其他几种常用技术的优缺点.,布伦纳在学术上极富开拓创新精神。他参与开创和独立开拓的科学领域一个接着一个,并且在每个领域中他的原创性研究成果都绚丽夺目。布伦纳是参与分子生物学创建的主要功臣之一1956年底,布伦纳成为克里克最亲密的合作者在基因如何指导蛋白质合成的研究中, 用实验证明遗传密码的“非重叠”、“无逗号”和“三联体”等性质方面作出了重大贡献。1961年布伦纳同雅各布(F.Jacob)和梅塞尔森(M.Meselson)合作,用实验证明了mRNA的存在。使得用实验方法破译遗传密码的研究才有可能开始,这些重要发现使得当时的分子生物学家都把布伦纳视作生命科学革命的领军人物之一,期待着他何时能获诺贝尔奖,因为,他在破译遗传密码和证明mRNA的存在这两项工作中的贡献,任何一项都可获诺贝尔奖;而此时的布伦纳却在想别的事。,经过多年探索,布伦纳证明了用乙基甲磺酸能诱导秀丽新小杆线虫(Caenorhabditis elegans)基因组特定的基因突变,完成了秀虫的遗传学分析,并在1974年的遗传学杂志上发表了“秀丽线虫的遗传学”一文。在这篇具有里程碑意义的论文中,他把遗传学分析方法和显微镜观察方法结合起来,即首先制备秀虫的各种突变体,然后分析某个特定的基因突变对发育的影响。这项工作成为其后大量出现的发育生物学研究的重要基础之一;秀丽线虫作为一种新的模式生物也迅速走红。,秀丽线虫,秀虫的确是很合适的实验材料。它与人蛔虫、人蛲虫等营寄生生活的线虫不同,是营自由生活的线虫。它身长1mm透明的表皮使每个细胞清晰可见。它在20时的生命周期是3天半,非常适合做遗传学研究。最可贵的是细胞数目少且固定,在发育过程中总是产生1090个细胞,其中有131个细胞注定要凋亡。,1976年,与布伦纳合作研究的苏尔斯顿(J.E.Sulston)首次为秀虫发育中的神经系统描绘了细胞谱系图,后来,又描绘出完整的细胞谱系图,使秀虫成为唯一一种从单细胞受精卵开始直到成熟成体的全部细胞分裂过程被阐明的多细胞生物。1986年,曾与布伦纳合作研究的霍维茨(H.R.Horvitz)首次用遗传学方法鉴定了2个与秀虫细胞凋亡有关的基因ced-3和ced-4。后来,又鉴定出14个基因与秀虫细胞凋亡有关。,布伦纳、苏尔斯顿和霍维茨因在器官发育和程序性细胞死亡(细胞凋亡)过程的基因调节方面的发现而获2002年诺贝尔生理学或医学奖。有人认为,“有的人需要诺贝尔奖为自己增辉,而有的人的获奖却是让诺贝尔奖增辉。布伦纳的获奖无疑是属于后者。”世人对布伦纳的评价是:“他用强烈的好奇心、想像力、智慧和决断力这样4根丝线编织了丰富多彩的具有特定结构的科学画面。他在许多探索领域留下的研究成果必将延伸到未来。”,生物:侦测基因表现的最新有力工具:MPSS时间:2007-09-13 00:00来源: 作者: 点击: 240次 生物:侦测基因表现的最新有力工具:MPSS 编辑 YPChang 报导 随着人类基因计画的进行,我们对于基因的序列有更多的掌握。对生物科技界来说,下一个挑战,便在于正确侦测基因的表现程度。怎样在速度和正确性之中得到一个平衡 ? 在六月的Nature Biotechnology中,Sydney Brenner的研究团队发表了一个名之为MPSS的新工具,或许正是提供解答的生物新技术。研究人员一直在寻找一个测量基因表现的最好方法,然而,一直以来他们面对着研究方法的两难。DNA晶片是快速而方便的一个技术,却被它有限的敏感度所限,而使用PCR来侦测基因表现相对来说较可信赖,却因需要跑大量的电泳而需花费较多的金钱、时间和人力。最近Sydney Brenner和他的同事将这两种方式合并在一起,发明了被取名为微球状阵列(Microbead Array)的新技术,使我们能够在复制数以千计的基因碎片之同时,亦进行被称之为多重性平行定序(Multiple parallel signature sequencing,简称MPSS) 的快速分析。MPSS可被分为两个步骤。首先,一个基因复本的DNA被黏至十分微小的微球体上,然后,在第二个步骤里,我们利用基因库的资料,比对辨认这些黏在微球体上的DNA。由此,藉由微球体的数目,我们便可以轻易地找出该基因被表现的程度。问题是,我们应该怎样辨认特定的基因呢? Brenner团队利用了萤光和限制酵素的知识,成功地发展出一套辨认基因末端16对碱基对的方法。这16对碱基对的辨认便使我们有能力决定酵母菌的基因体中所有的基因。MPSS这个最新的技术,不但和目前广被使用的技术有同等的正确性,在人类白血球上的实验更说明它的错误率极小。此外,MPSS可以侦测到极为罕见的基因表现,并同时对基因体中所有基因的表现程度,提供一个统计上的数字指标。有了这样的工具,我们就能够对细胞中因应不同外在环境而有所不同基因表现,有更深一步的认识和了解,它不但为生物晶片技术开启了一扇新的门窗,亦为分子生物学及人类基因计画的研究提供了有力的工具。,MASS 与 Microarray比较,MPSS确实能在一个样品中检测到所有的mRNAs , microarrays对检测的基因成分有限制(因为需要已知基因的序列做探针)。 MPSS 即使是一般的检测都对低丰度基因具有很高的敏感性,而microarray的敏感性受许多因素的影响而且很难进行严格的控制 MPSS的结果是以数字资料的形式输出,使得这些结果很容易整合进复杂的相关数据库而 microarray的输出的数据时根据荧光的强度算出的比率很难准确反应表达水平相 MPSS可以用于基因表达的定量分析,可以用于任何生物,即使对那些基因组未被测序或进行过详细研究的生物。Microarrays 的优点是高通量,可以分析大量的样本。,MPSS和Sage比较,SAGE 的特征序列是14个核苷酸,而MPSS是17个基因组作图时会少了歧义很容易把MPSS的标签与已知的基因对应起来典型的SAGE的数据集是20,000-60,000个标签,而MPSS有约百万个特征序列 MSPP很容易实现高通量,因为其克隆和测序用的是不同的技术SAGE是利用的传统的克隆和测序技术,昂贵、耗时、劳动强度大 更大的MPSS数据集可以增强分析的深度,MPSS和Sage比较,Signature sequence of SAGE is 14 nucleotides compared with 17 nucleotides with MPSS: Less ambiguity with MPSS when mapping to the mammalian genome Easier to connect MPSS tags with known genes Typical SAGE data set is 20,000-60,000 tags compared to over a million signatures sequences for MPSS Lynx cloning and MPSS sequencing done on a miniaturized platform that is amenable to high-through SAGE conducted with standard cloning and sequencing that are expensive, time consuming and labor intensive Larger MPSS data sets provide enhanced depth of analysis,MASS 与 Microarray比较,MPSS detects virtually all mRNAs in a sample, while microarrays are limited to gene elements on the array MPSS has greater sensitivity for routine detection of low level expressed transcripts; microarray sensitivity influenced by many factors that can be difficult to rigorously control “Digital” data output of MPSS makes it possible to readily import data into complex relational databases; microarray data provides a ratio between an experimental and control fluorescence that is difficult to convert into values for quantitative expression levels MPSS can be used to conduct quantitative and in-depth expression analysis on any organism, including those with a genome that has not been sequenced or studied in great detail Microarrays have the advantage of being a high-throughput technology for analyzing large numbers of samples,MPSS是对SAGE的改进,它能在短时间内检测细胞或组织内全部基因的表达情况,是功能基因组研究的有效工具。因其需要配套的软硬件较为昂贵,目前国内外的相关应用报道不多。MPSS技术对于致病基因的识别、揭示基因在疾病中的作用、分析药物的药效等都非常有价值,该技术的发展将在基因组功能方面及其相关领域研究中发挥巨大的作用。,MPSS的特点是: a1 不必事先知道基因的序列, 适用于任何生物体及任何性状; b1 基因组覆盖面高, 能测量出样品中几乎所有表达了的基因;c1 基因表达水平的测量是通过直接计算样品中cDNA 的拷贝数目, 属于非连续变量, 所以只要有病理和正常个体(或组织) 两个样品即可以进行严格的统计检验, 能有效地检测差异性中等或较小的基因; d1 实验效率高, 只要两个星期即可获得几十万个克隆的16 至20 个碱基序列.,深度测序技术,测序深度是测序量除以基因组长度,例如测序深度10*就相当于测了10次的全基因组,Nature methods:高通量深度测序法探测RNA结构在2010的(Nature Methods)(Nature)杂志两篇最新的论文中Underwood和Kertesz两个研究小组利用高通量测序技术确定了所有RNA转录物的二级结构。,最近的研究证实RNAs在调控基因表达和基因组稳定性中发挥了多重功能(RNAi),这一课题日益引起了研究界的广泛关注。在这些调控过程中,RNA的结构是一个关键的影响因素决定了是直接监控外部或内部信号,或是为反式作用因子提供特异的结合位点。 RNA转录物是一种单链分子,当其发生自身折叠并形成碱基对,可形成各种长度和不同复杂性的发夹结构。发夹结构是RNA中最普通的二级结构形式,其进一步组装则形成了复杂的三维结构。了解RNA二级结构是研究人员揭示RNA活性,发现伴侣蛋白结合印迹及突变影响关键性的第一步。,高通量测序技术-深度测序-deep sequencing,高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。,Roche(罗氏公司)推出了454FLX焦磷酸测序平台(454FLXpyrosequencingplatform)2006年美国Illumina公司推出的Solexa基因组分析平台(GenomeAnalyzer platform)2007年ABI公司推出了SOLiD 测序仪。 这三个测序平台即为目前高通量测序平台的代表。,高通量测序的应用,可以帮助研究者跨过文库构建这一实验步骤,可以非常轻松完成基因组重测序(re-sequence)。但是也应该看到,由于高通量测序读取长度的限制,使其在对未知基因组进行从头测序(novo sequencing)的应用受到限制,这部分工作仍然需要传统测序(读取长度达到850 碱基)的协助。但是这并不影响高通量测序技术在全基因组mRNA表达谱,microRNA表达谱,ChIP-chip以及DNA甲基化等方面的应用。 2008年Mortazavi等人对小鼠的大脑、肝脏和骨骼肌进行了RNA 深度测序,这项工作展示了深度测序在转录组研究上的两大进展,表达计数和序列分析。,高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易的解决芯片技术在检测小分子时遇到的技术难题(短序列,高度同源),而且小分子RNA的短序列正好配合了高通量测序的长度,使得数据“不浪费”,同时测序方法还能在实验中发现新的小分子RNA。在DNA蛋白质相互作用的研究上,染色质免疫沉淀深度测序(ChIP-seq)实验也展示了其非常大的潜力。染色质免疫沉淀以后的DNA 直接进行测序,对比ref seq可以直接获得蛋白与DNA结合的位点信息,相比ChIP-chip,ChIP-seq可以检测更小的结合区段、未知的结合位点、结合位点内的突变情况和蛋白亲合力较低的区段。,高通量测序的应用,深度测序带来人类转录组“空前”全貌,德国马普分子遗传学研究所和Genomatix测序软件公司的科学家通过胚肾和B细胞系的转录子(本)进行测序,揭示出人类转录组前所未有的复杂性和可变性。他们发现,50%的转录子对应于特定的基因组域,其中有80%吻合已知的基因。多聚腺苷酸化的转录组(polyadenylated transcriptome)的66%对应于已知基因,其余的34%则为新的基因。此外,研究人员还进行了一项关于信使RNA剪接(mRNA splicing)的全局研究。他们共确定出94241个剪接位点,其中有4096个是全新的。领导该项研究的马普分子遗传学研究所Marie-Laure Yaspo博士说,“深度测序(deep sequencing)让我们首次直接探索人类转录组的复杂性和动力学成为可能。而此次的细胞内和细胞间选择性剪接的对比研究,以及对基因表达的同步分析是此前从未进行过的。新的研究结果将导致远超出现有程度的全新哺乳动物基因组注释图。此外,一个越来越明显的情况就是,目前可用的方法只能带来哺乳动物细胞的部分表达图谱,尤其是当考虑到基因调控分析时。”,2008 science,一个典型的哺乳动物细胞,例肝细胞,大约包含1000020000个不同的蛋白,大约8 10 个分子。占细胞总重量的1820,蛋白质组 the proteome,某一特殊时期细胞中所有蛋白的总和,9,高丰度蛋白:每个细胞中,一个蛋白分子超过50 000个copy的时候,属于高丰度蛋白。哺乳动物细胞中有2000个蛋白属于高丰度蛋白,高丰度的蛋白含量变化小,说明这些是看家基因的蛋白,在细胞中执行基本的生理功能,通常与细胞的特异性无关。,Figure 3.12. The central role of the proteome.,蛋白质的结构,蛋白质的四级结构一级结构:氨基酸顺序二级结构:线性多肽形成的不同构型主要有a-helix 和b-sheet 多肽的氨基酸之间由氢键连接形成多数多肽可形成一系列的二级结构。,三级结构:由二级结构折叠形成的三维构型氢键、疏水作用力、二硫键(两个半胱氨酸之间)四级结构:多个形成三级结构的多肽相互作用形成的多亚基蛋白并不是所有的蛋白都形成四级结构,它是许多具有复杂功能蛋白的特点二硫键、氢键和疏水作用力,Figure 3.13. The general structure of an amino acid. All amino acids have the same general structure, comprising a central a-carbon attached to a hydrogen atom, a carboxyl group, an amino group and an R group. The R group is different for each amino acid (see Figure 3.17 ).,Figure 3.14. In polypeptides, amino acids are linked by peptide bonds. The drawing shows the chemical reaction that results in two amino acids becoming linked together by a peptide bond. The reaction is called a condensation because it results in elimination of water.,一级结构,Figure 3.15. The two main secondary structural units found in proteins: (A) the a-helix, and (B) the b-sheet. The polypeptide chains are shown in outline with the positions of the a-carbons indicated by small dots. The R groups have been omitted for clarity. Each structure is stabilized by hydrogen bonds between the C=O and N-H groups of different peptide bonds. The b-sheet conformation that is shown is anti-parallel, the two chains running in opposite directions. Parallel b-sheets also occur.,二级结构,Figure 3.16. The tertiary structure of a protein. This imaginary protein structure comprises three a-helices, shown as coils, and a four-stranded b-sheet, indicated by the arrows. Redrawn from Turner et al. (1997).,三级结构,蛋白的功能不同是因为他们的氨基酸序列不同,不同的氨基酸序列形成不同的空间结构,这不仅反映在蛋白的整体结构也反映在蛋白的活性基团在蛋白表面的位置,合成的蛋白质会经过一系列的修饰,包括乙酰化、磷酸化、糖基化等,不同的二级结构有氨基酸的偏爱,氨基酸序列决定蛋白的功能,不同的二级结构有氨基酸偏爱,可根据不同的氨基酸的序列来推测它的结构 (?),多数蛋白的三级结构都有几个结构域,它们之间具有相互作用,这些结构域都是独立折叠而成。,经尿素变性的蛋白在复性的过程中仍然能