邢立刚-微生物基因组中基因调控网络的结构与演化课件.ppt
微生物基因组中基因调控网络的结构与演化,邢立刚,2008年6月11日,关键词:基因调控网络 转录 蛋白质-DNA相互作用 原核生物 进化,摘要:随着大量微生物基因组序列的获得,至少在模式生物上从比较学的角度去理解调控系统的结构和功能成为可能。最近的研究主要集中在调控网络及其组件的拓扑性质与进化方面。我们对于基因调控网络的理解为对生物体中内在的综合调节系统的研究奠定了基础。有助于我们更加详细的理解生物体的多样性。,介绍 在后基因组时代最大的挑战之一是阐明在生物体中所有可能的刺激及其应答的完整基因表达程序。虽然完整序列基因组数量增长迅速,但我们关于转录调控的知识只限于少数模式生物。生物体提供大量的DNA片段来编码顺式调控元件,另外还提供一个重要的蛋白质编码基因片段编码TFs,这两个方面在转录水平上控制和协调基因表达发挥着重要的作用。阐明转录程序的原理和结构,对于了解环境干扰所引起的细胞反应和一些微生物引起疾病的分子基础是必需的。,现在一个普遍接受的概念是转录调控是由TFs和TGs组成的一个网络。然而,在一个较低抽象水平上,转录子包括许多顺式调控元件(如启动子、TF结合位点和转录终止子)和反式作用因子(如TFs和sigma因子)。顺式和反式元件之间的相互作用控制细胞中每个基因的转录状态(见Fig.1)。虽然现在的研究越来越多的表明:在真核生物和原核生物中通过非编码的转录后调控在生命体扮演着非常重要的作用。在这里我们查阅了在微生物体内的转录调控的计算机分析的最新进展。首先讨论了所取得的反式和顺式元件识别的进展水平,最后从网络的角度综合形成了对微生物转录调控的理解。,2反式作用因子的演化 在反式作用水平上,许多蛋白质家族如sigma因子和TFs在基因表达的调控方面起着重要的作用。转录作用取决于生物体面临的环境条件及所受的刺激,而这些元件有利于促进转录作用网络的衔接。尽管最近几年我们对于反式作用因子的数量及组成成分的了解大大提高,但对于这些蛋白所起作用的认识还远远不足。,2.1 sigma因子 sigma因子是形成原核RNA聚合酶的可解离亚基的一类蛋白质。sigma因子和聚合酶核心酶结合是转录开始的基础,是转录过程中的一个重要步骤。sigma因子在启动子和聚合酶特异识别中起到了一个桥梁的作用,从而促使DNA链分离。之后sigma因子从RNA聚合酶核心酶上解离下来,在下次反应时再被利用。对于不同的RNA序列或者是不同的基因,同一个sigma因子与其RNA聚合酶核心酶结合的紧密程度是不同的。另外,已知sigma因子与RNA聚合酶核心酶结合的亲和力大小会影响基因转录的起始频率。换句话说就是会影响特定基因表达量的大小,从而对生命活动进行调节。在细菌基因组中sigma因子的编码具有高度可变性。sigma因子可以被分成两类结构和种类不同的家族:sigma70和sigma54两个家族。,2.2 作为转录控制调节器的DNA结合转录因子 在生物体中基因表达调控主要是通过DNA结合转录因子来实现的。TFs在大多数基因组中形成了最大的蛋白质家族之一。转录因子是激活或抑制基因和操纵子的转录。在细菌基因组中大多数转录因子形成二聚体,与DNA上的顺式调控元件结合来控制转录起始。在公开的完整序列基因组中,在天蓝色链霉菌中观察到大量的转录因子。细菌基因组中的转录因子部分以整个基因组总数的平方为衡量尺度。,依照它们在特定启动子上的作用方式转录因子可被分为激活物、抑制物或二元调节器。通过启动子刺激RNA聚合酶激活刺激靶基因的表达。众所周知激活作用是通过结合转录起始位点上游的转录因子而发生的,经常在上游的启动子元件的-35区。对于转录负控制,转录因子通过结合来阻止聚合酶的起始转录,从而起到了抑制剂的作用。转录因子结合转录起始位点的下游时就会发生阻遏,导致启动子元件在-35区和-10区成环,从而通过位阻来阻断RNA聚合酶。计算机分析表明抑制物在大肠杆菌和杆状菌中占优势地位,有可能共同进化与它们的靶基因密切相关的基因组。,整体的转录调控可以理解为:调控大量属于不同功能类的基因,通过直接和间接影响不同的细胞途径和按照用不同的sigma因子作用目标启动子来控制复合调控级联。根据这些,提出了大肠杆菌中的七个整体调节器。在整个转录调控网络中大约控制50%多的基因。最近许多研究用转录因子的结合性作为一种简化的量度来估定转录因子的整体性质。,3顺式调控元件的演化 近年以来,某个生物体的多种菌株和相近种类基因组序列的积累。这使解决调控元件的保守性成为可能。现有的基因组序列不仅为我们提供了来了解像启动子区、转录因子结合位点和终止信号通路的顺式调控元件在进化上的保守性,而且还使我们能够利用各种比较基因组分析技术来预测它们。,3.1启动子区 启动子是指在细菌中转录起始需要RNA聚合酶识别和结合上游转录单元的特异性的DNA序列。启动子序列的识别是通过RNAP和sigma因子(一种小的蛋白质)结合实现的,这种在大肠杆菌中原始的持家sigma因子是通过rpoD基因编码的,也称为sigma70。在细菌中,启动子被定义为位于转录起始位点附近的(6-8bp)的一段DNA片段,它能使一个基因或一组基因被转录。,3.2 转录因子结合位点 转录因子结合位点的识别是理解基因转录调控机理的重要环节,准确的预测算法将有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。转录因子识别TGs,它们能控制转录归因于启动子区域存在有结合位点。典型的一个转录因子,与它们的靶基因或转录单元的启动子区结合,能控制基因正向或负向的表达。抑制物位点抑制基因转录已知道发生在转录起始位点的下游,激活子一般在起始位点上游的DNA相结合。在大肠杆菌里,有大量的因子充当转录抑制物,因此在转录网络中的大多数基因是负调控。,两个普遍的计算方法可用来推断在启动子区的转录因子结合位点:(1)分析共调控基因(2)上游区域的同源基因种系发育足迹法 基于选择压保持非编码区的调控元件在遗传上的相似性。两种方法的目的在于确立有效的统计学模式,这在保持定位基因间区域的背景下是保守的,因为对基因序列中的共同调控基因识别是困难的,大多数推断调控基序的计算途径用种系相近的同源基因的上游区域作为序列种组。,转录因子结合位点预测相关文献:转录因子结合位点和组合调控模式的研究(清华大学理学博士学位论文)开发出一个从相关序列中寻找出现频率高的转录因子的预测算法。在多个调控序列上得到的出现频率高的片段很可能是对于这组序列的转录调控有重要作用的序列元件。本算法通过对比目标序列和背景序列中序列元件出现的频率,识别出在目标序列中存在的出现频率高的转录因子结合位点。用已知的结合位点的位置权重矩阵为基础,本算法可以方便地将预测结果和数据库中的转录因子联系起来。测试数据表明本算法具有较高的可信度,随着算法可以利用的转录因子数据量的增加,我们的算法将为实验研究提供更有价值的信息。在此基础上,开发出相应的软件。,3.3 转录终止 典型的转录终止包括转录产物mRNA和RNA聚合酶在转录结束时从模板链上释放,正确的终止对于细菌是必须的,作为在转录单元之间的区域一般相当小。在细菌基因组中,终止一般是自然产生的,具有内在期限或Rho-依赖性终止,或者用一组反式作用因子和顺式作用元件结合,引起Rho-依赖性终止。,顺式和反式作用元件和转录网络概念之间的联系 后基因组时代的一个重要的概念是我们可以把细胞看作是一个内部生物大分子(如蛋白质、DNA)与代谢产物之间构成一个相互作用的网络。这导致了应用网络理论解决生物学问题,特别是在了解基因表达调控方面。在转录网络中典型的是反式作用元件如转录因子和Sigma因子,形成一组节点和他们的靶基因,它们能控制激活,形成另一套节点。两者之间的联系具有方向性,从反式作用元件到它们的靶基因,通过顺式调控元件来控制,形成一个复杂的和具有方向性的相互作用的网络。,转录调控网络视图:在基因组水平上的转录调控相互作用可以形象化的表示为由TFs(红色显示)和TGs(黑色或绿色显示)组成的网络。(a)转录调控网络是一个在转录水平上没有反馈调控的多层分级模型结构。,转录调控网络视图:在基因组水平上的转录调控相互作用可以形象化的表示为由TFs(红色显示)和TGs(黑色或绿色显示)组成的网络。(b)模块是转录相互作用的网络分成的子网连接簇,用多种途径来识别模块,通过一个或多个不同的网络基序类型依次形成模块。,4.1 网络结构 其中被获得的那些最重要的和明显的信息片段的分布具有联通性,即有多少连接节点,每一个节点具有特定的连接数。至于在转录网络中这些参数其实有两个方面,作为传入和传出的连接必须进行单独考虑。传入连接是转录因子调控靶基因的数量,这将对基因调节产生有意义的组合的影响。在局部水平上,在转录网络中,某些子网频繁出现比预料的多,类似于在序列中经常重复的基序。在大多数转录网络中主要有三个网络基序:(1)前馈环(EFL)(2)单输入模式(3)高重叠调控型,转录调控网络视图:在基因组水平上的转录调控相互作用可以形象化的表示为由TFs(红色显示)和TGs(黑色或绿色显示)组成的网络。(c)基序是互连的模式,在转录网络大量存在。现已知道转录调控网络有前馈环(EFLs)、多重输入模块(MIMs)和SIMs,每种基序都起着不同的作用。,4.2 网络保护 随着转录调控文献资料的有效利用,基于在模式生物中存在显著的转录因子部分的实验证据,使解决在细菌基因组中调控系统组成和结构进化方面的存在的问题成为可能。从特定生物体转录网络进化的角度来看,提出在大肠杆菌和酵母中当前已知的调控网络中转录因子的复制和它的TGs能够引起比例的显著提高。然而,从交叉基因组的角度来看,发现与TGs相比转录因子保守交叉基因组不足,因此,有可能进化比TGs快,同时也发现整体调节器与一般的转录因子相比没有更大的保守性,这表明交叉细菌的基因调控机制的进化更快。后者组显示在网络基序里调控相互作用没有显示共同进化中的选择,具有相似生活方式的生物体可能保留了相等的调控相互作用和网络基序。,4.3 网络动力学 尽管几项集中在调控网络的研究停止在一个静止的水平,但因该指出的是生物体的调控网络是具有高动态和在不同条件下网络的不同位置具有动态性。事实上,在酵母细胞中显示出通过累积表达和调控相互作用的数据表明:调控子网在不同条件应给予不同的关注。特别表明,在多级进程中,像细胞周期或孢子形成在调控网络中有多方面的变化。应该尝试在细菌系统中展开这项研究,另一项研究系统地定义了拓扑单元叫做origons,在这种概念下从完全知道的转录调控网络中的不同子网能被激活,通过不同的实验条件下依赖于通过感受TFs因子接受环境信号。另一项最近的研究用大肠杆菌静止的调控网络,研究者对当前已知调控网络中作为传感内源性或外源性信号的转录因子的集合进行了分类。整体调控与这些内在的传感信号相符合,在大肠杆菌调控网络的动态性中发现了转录因子的内在传感信号。,5.结论和展望 虽然我们对复杂的转录调控网络的设计的原则还远远没有完全了解,但是我们已开始设计生物电路和预测它们的行为。在测序技术方面的进展,高通量实验技术如染色质免疫沉淀,更进一步如噪音过滤器和振荡器,并可以结合起来,阻遏物功能性与一个双组分系统,再加上改善在高分辨率下测量细胞数量的方法,不仅使我们能够设计合成电路操纵细菌系统,而且今后还使我们能够解决几个根本无法回答的问题。,