分子生物学 课件.ppt
医学分子生物学,课程主要内容,第一章 生物大分子的分离纯化第二章 分子生物学常用技术(PCR、核酸 分子杂交、基因测序、生物芯片等)第三章 基因工程第四章 基因敲除与RNA干扰 第五章 细胞培养技术,蛋白质组和蛋白质组学,蛋白质组(proteome)是指特定细胞、组织乃至机体作为一个生命单元中所有蛋白质的集合,即某一时段所表达的全部蛋白质。,蛋白质组学(proteomics),是研究蛋白质组的科学,也即是研究生物体全套蛋白质的组成、结构与功能的科学。,蛋白质组学(proteomics) 阐明生物体全部蛋白质的表达模式与功能模式从整体的角度分析、鉴定细胞内动态变化的蛋白质的组成、结构、性质、表达水平与修饰状态了解蛋白质之间、蛋白质与大分子之间的相互作用与联系,揭示蛋白质的功能与细胞生命活动的规律,蛋白质组研究的必要性,蛋白质是生命活动的主要执行者,蛋白质与基因之间在很大程度上是一种非线性的关系,蛋白质在发挥功能的时候有其自身的特征和规律,这是在基因水平上难以预测的。,蛋白质的数量比基因的数量多。,基因组是静态的,而蛋白质组是动态的。,广泛的修饰加工过程,这些修饰加工过程是蛋白质功能发挥的结构基础,也是蛋白质高度多样性的重要原因。, 生物超分子体系是蛋白质功能发挥的更高级的组织形式,任一层次的生命活动都不是单个蛋白质分子的独立行为或功能的累加,蛋白质之间及与其它分子之间存在广泛的相互作用,形成一个网络状的非线性复杂系统,孤立地研究蛋白质结构与功能无法从整体上系统而透彻地阐释生命活动的规律。,蛋白质组学的最终目的是全方位系统地解析蛋白质的功能,而具体的研究过程只能分解为不同的层面相对独立地进行,因此这些相对独立的蛋白质功能信息必须有机地整合在一起,才能描绘出蛋白质功能的全景图。,DNA,mRNA,蛋白质,转录,翻译,基因,蛋白质,细胞特异性基因表达,生理状态,蛋白质相互作用,温度,应激状态,培养条件,药物作用,数量有限,结构相对稳定,复杂性,多变性,直接反应生命现象,复杂的调控,遗传信息的传递和表达,蛋白质组研究技术,蛋白质样品制备:包括各种组织细胞裂解、蛋白质沉淀、亚细胞组分分离及蛋白质分步提取的方法;蛋白质分离:2-DE、双向高效液相色谱、毛细管电泳等;图象分析;蛋白质鉴定:包括氨基酸组成及序列分析,用于肽质量指纹图、肽序列标签鉴定及相对分子量精确测定的质谱技术(MS)或MS联用技术、蛋白芯片技术等;,蛋白质与核酸的相互作用:凝胶阻滞分析,染色体免疫沉淀,DNAaseI足纹分析,核酸-蛋白质杂交实验;蛋白质之间的相互作用:如酵母双杂交技术、酵母三杂交技术、噬菌体展示技术及共沉淀技术等;蛋白质的亚细胞定位:荧光蛋白融合技术及免疫荧光技术等;蛋白质的三维结构测定:X-射线晶体衍射及核磁共振波谱技术;蛋白质的功能研究:不同的生物学功能有不同的研究技术与方法。另外还包括高通量实验系统与大规模样品处理机器人等,以实现大规模高通量蛋白质组研究。,蛋白质组研究技术,根据蛋白质溶解度、分子大小及形状、电离性质、生物学功能的差异进行: 1.根据等电点: 等电聚焦 2.根据分子量: 透析和超滤, 平衡离心, 凝胶过滤,一、蛋白质样品的制备,3.根据电荷: 毛细管电泳, 聚丙烯酰胺凝胶电泳 4.根据蛋白质的亲和能力:亲和层析,二维凝胶电泳(2-DE)技术,目前蛋白质组研究中最有效的分析鉴定技术之一由两相组成: 第一相:等电聚焦凝胶电泳 (根据蛋白质电荷差异) 第二相:SDS聚丙烯酰胺凝胶电泳 (根据蛋白质分子量差异),2-D Electrophoresis,等电聚焦过程,第一向等电聚焦,酸,碱,IPG胶条,H梯度,低分子量,高分子量,第二向SDS-PAGE,双向凝胶电泳示意图,2-DE分析的基本步骤,蛋白质溶解变性还原去除蛋白质杂质,利用不同pK固定化电解质配置不同pH范围的凝胶利用软件设计配置,第一相电泳(IPGIFE)平衡第二相电泳(SDSPAGE),考马斯亮蓝染色银染色铜染色,样品制备,IPG胶制备,双相电泳,染色,2-DE 技术,通过2-DE得到的蛋白质分离图谱,需要经过摄像或扫描转换为以像素为基础的、具有不同灰度强弱和一定边界方向的斑点电脑信号。,图像分析技术,2-DE获得的蛋白质图谱,原理 样品分子离子化后,根据不同离子间的质量和电荷比值(m/e)的差异确定分子量。应用 蛋白质的序列分析 研究蛋白质的修饰,二、蛋白质的鉴定质谱技术,(二) 其它蛋白质鉴定方法,Edman降解法测定蛋白质多肽的排列顺序核磁共振(NMR)、荧光光谱法测定溶液中蛋白质分子的结构X射线衍射分析法、小角中子衍射法测定晶体蛋白质的分子结构等,第三节蛋白质相互作用的研究,一) 蛋白质核酸,二) 蛋白质蛋白质,蛋白质相互作用的研究,一)蛋白质-核酸间相互作用的研究 1、凝胶阻滞分析 2、染色质免疫沉淀技术 3、DNase足纹分析 4、核酸-蛋白质杂交实验,蛋白质可以与末端标记的核酸探针特异性结合,所形成的复合物电泳时在凝胶中的泳动速度比未与蛋白结合的游离探针慢,即表现为相对滞后。该实验可以评价蛋白与核酸结合的特异性-体外,1、凝胶阻滞分析(gel retardation assay),电泳迁移率变动分析(Electrophoretic mobility shift assays,EMSA),凝胶迁移分析(gel shift assay),2、染色质免疫沉淀(Chromatin immunoprecipitation,ChIP),主要用来研究细胞内基因组DNA的某一区域与特定蛋白质(包括组蛋白如H3和非组蛋白如各种转录因子)相互作用的技术。,EMSA可用于研究DNA与蛋白质的体外结合,但这并不能说明这种结合在细胞内也是同样真实存在的。而ChIP则可以用来证实DNA与蛋白质在细胞内的特异性结合,因此,在研究DNA与蛋白质的相互作用时,EMSA和ChIP往往联合使用,互为佐证。,化学交联试剂使非组蛋白与所结合的DNA交联固定,活细胞状态,裂解细胞,释放染色质,超声或酶切处理,染色质DNA片段一般为200bp1000bp,特异性抗体沉淀蛋白质-DNA复合物,解交联释放出DNA并纯化,PCR等技术分析DNA片段,3、DNase足纹分析,目前广泛用于蛋白质精确结合位点的研究方法。原理: DNase可以随机水解核苷酸中的磷酸二酯键,将DNA切成单核苷酸,而结合有蛋白质的DNA免于DNase的水解。,DNase足纹分析原理示意图,4、核酸-蛋白质杂交实验,TBE缓冲液中DNA蛋白质杂交,放射自显影,用于鉴定蛋白质与DNA的特异性结合和确定结合蛋白质的分子量。 基本步骤:,蛋白质,SDS-PAGE,转移至NC膜或Nylon膜,缓慢复性、封闭、预杂交,加入同位素标记的DNA片段作探针,多次洗膜,(一)蛋白质-蛋白质相互作用的形式 1.蛋白质亚基的聚合 2.蛋白分子杂交 3.分子识别 4.分子的自我装配 5.多酶复合体,二)蛋白质-蛋白质相互作用,(二)蛋白质之间的相互作用力,氢键范德华力疏水键离子键,二)蛋白质之间的相互作用,1.酵母双杂交系统,2.噬菌体展示技术,3.生物传感芯片质谱,4.定点诱变技术,1.酵母双杂交系统 (yeast two-hybrid system),在真核生物的转录起始阶段,需要有转录激活因子的参与。酵母蛋白GAL是一典型的真核细胞转录激活因子,其转录激活作用是由功能相对独立的DNA结合结构域(binding domain,BD)和转录激活结构域(activation domain,AD)共同完成的, 这两个结构域通过共价或非共价连接建立起特有的空间联系是导致结合和激活发生的关键。,1.酵母双杂交系统,DNA-BD具有与报告基因转录调控区特异结合的功能,DNA-AD则具有活化转录的功能。,报告基因,与BD融合的蛋白表达载体,表达的蛋白称诱饵蛋白(bait protein);与AD融合的蛋白表达载体,表达的蛋白称捕获蛋白或猎物蛋白(prey protein);带报告基因的宿主细胞。,一、蛋白质蛋白质,DNA-BD具有与报告基因转录调控区特异结合的功能,DNA-AD则具有活化转录的功能。,若X和Y没有相互作用,则单独不能激活报告基因的转录;若X与Y之间有且发生相互作用时,就可以将BD和AD在空间结构上联结、靠近形成一个有效的转录激活子而与报告基因的上游激活序列(upstream activation sequence,UAS)结合,进而发挥激活转录的功能,使受调控的下游报告基因得到表达。,DNA-BD和DNA-AD分开时不能激活转录,只有当两者在空间上接近时,才能呈现转录因子的活性。只有当蛋白质X与蛋白质Y间发生相互作用时,才能激活报告基因的转录,而当两者单独作用时均无此功能 。,第二章,分子生物学常用技术,核酸 (DNA, RNA),碱基互补配对A=T, CG, A=U核酸变性与复性核酸合成 DNA复制(DNADNA), 逆转 录(RNADNA); 转 录(DNARNA), RNA复制(RNARNA);,DNA复制 (replication) 由亲代DNA合成两个相同的子代 DNA的过程(DNA指导的DNA生物合成)。,半保留复制,生物体内DNA复制非常复杂,按半保留复制方式,子代DNA与亲代DNA 的碱基序列一致,即子代保留了亲代的全部遗传信息,体现了遗传的保守性。,半保留复制的意义,遗传的保守性,是物种稳定性的分子基础,但不是绝对的。,DNA的酶促合成:模板 (template) : 解开成单链的DNA分子;底物(substrate): 4种脱氧核苷三磷酸(dATP,dGTP,dCTP,dTTP);DNA聚合酶 (polymerase) : 依赖DNA的DNA聚合酶(DDDP),简写为 DNA-pol ;,如何获得单链DNA模板?,多种蛋白质参与(以大肠杆菌为例),解链酶(helicase);单链结合蛋白(singlestrand DNA binding protein,SSB);DNA拓扑异构酶( DNA topoisomerase ),解链酶( helicase ), 利用 ATP 供能,作用于氢键, 使DNA双链解开成为两条单链。,单链DNA结合蛋白(SSB),DNA解链过程形成超螺旋,拓扑异构酶,解除超螺旋,DNA线性双螺旋,从中间解链,参与复制全过程,剪切-旋转-连接,DNA聚合酶DNA生物合成,大肠杆菌DNA聚合酶 ( E . Coli DNA polymerase )和Klenow片段,大肠杆菌DNA聚合酶复制中DNA链延伸,大肠杆菌DNA聚合酶,323个氨基酸,小片段,5 核酸外切酶活性,大片段 / Klenow片段,604个氨基酸,木瓜蛋白酶,Klenow片段是实验室合成DNA,进行分子生物学研究中常用的工具酶。,5 DNA聚合酶活性, 5 核酸外切酶活性,DNA聚合酶(DNA-pol I),DNA聚合酶,大肠杆菌DNA聚合酶是单一多肽链的多功能酶,分子量为103kD,它具有3种酶活性:, 5 3 DNA聚合酶活性。 3 5 核酸外切酶活性。 5 3 核酸外切酶活性。,(DNA合成)(校对)(切除RNA引物和突变序列),DNA聚合酶催化的反应,5 至 3 的聚合活性,dTTP,3,(dNMP) n + dNTP (dNMP) n+1 + ppi,依赖DNA的DNA聚合酶(DNA-dependent DNA polymerase, DDDP),3 5 外切酶活性,5 3 外切酶活性,?,切除引物或突变的DNA片段,辨认错配的碱基对,将其水解校对,核酸外切酶活性,复制的保真性 ( fidelity ),DNA聚合酶对模板的依赖性,是子链与母链能准确配对的保证。,复制过程中,复制的保真性至少依赖三种机制:,1、遵守严格的碱基配对规律2、聚合酶在复制延长时对碱基的选择功能3、复制出错时DNA-pol的及时校读功能,DNA生物合成条件:单链DNA模板 (template) ; 底物(substrate) :4种dNTPs;依赖DNA的聚合酶 (DDDP);,引物(primer),DNA复制中为何需RNA引物?,DNA聚合酶没有从头催化2个游离的脱氧核苷三磷酸聚合的能力;只能在3-OH端与按碱基配对的dNTP进行反应,生成磷酸二酯键;引物提供游离的3-OH末端;,DDRP,半不连续复制(semidiscontinuous replication),一条链合成是连续的(前导链), 一条链合成是不连续的(后随链);,DNA聚合酶: 5 3 聚合酶活性,聚合反应的方向性: 5 3 ,DNA连接酶 (DNA ligase),岗崎片段的连接,连接DNA链 3-OH末端和相邻DNA链5- P末端,使二者生成磷酸酯键,从而把两段相邻的DNA链连接成完整的链。,一、聚合酶链式反应(Polymerase Chain Reaction, PCR),在体外由引物介导的DNA序列酶促合成反应,即体外DNA扩增技术。,DNA聚合酶(DNA dependent DNA polymerase,DDDP),穆利斯 K. Mullis1945-,美国,1993年诺贝尔化学奖,PCR酶促DNA合成,DNA聚合酶(DNA dependent DNA polymerase,DDDP) 合成DNA新链,DNA模板:单链DNA引物:提供3OH末端底物:四种dNTP,基本原理:, 类似体内DNA复制(合成双链DNA)- DNA聚合酶, 核酸的热变性和退火 变性- 获单链模板 退火- 单链模板与引物结合 延伸DNA新链合成, 指数扩增循环多次,耐热的DDDP,PCR 循环 第一步 加热变性,靶序列,靶序列,PCR 循环- 第二步引物与靶序列退火,靶序列,靶序列,Primer 1,Primer 2,Biotin,Biotin,5,3,5,5,3,5,3,3,PCR 循环 - 第三步 - 引物延伸,靶序列,靶序列,Primer 1,Primer 2,Biotin,Biotin,5,3,5,5,3,5,3,3,Taq DNAPolymerase,第1个 PCR 循环完成后 得到两个拷贝的靶序列,靶序列,靶序列,Biotin,Biotin,30次循环后靶序列扩增的数量,No. ofNo. Amplicon CyclesCopies of Target122438416532664201,048,576301,073,741,766,1 cycle = 2 Amplicon,2 cycle = 4 Amplicon,3 cycle = 8 Amplicon,4 cycle = 16 Amplicon,5 cycle = 32 Amplicon,6 cycle = 64 Amplicon,7 cycle = 128 Amplicon,PCR的主要用途,(一)目的基因的克隆,序列分析(二)基因的体外突变,多态性研究(三)DNA的微量分析,PCR扩增条件,94, 300S (预变性) 94, 30S(变性) 25 40cycles 5565, 30S 72, 30120S (退火,与引物有关) 72, 10min,(延伸,与扩增长度有关),45 65 ,209bp,退火温度的选择,梯度PCR(多温控),PCR反应的影响因素:, 模板 (DNA), 聚合酶(耐热的Taq DNA聚合酶), dNTPs(dATP,dCTP, dGTP,dTTP), 缓冲液, 引物(DNA引物,10M),与待扩增目的基因两端序列互补的寡核苷酸链,决定PCR扩增产物的特异性和长度。,DNA聚合酶,耐高温,保真性(防止错配),活性(Mg2+),(35外切酶活性),Taq DNA聚合酶 (无35外切酶活性,35轮0.25%错配,与原始模板有差别) Ex Taq DNA聚合酶,Tth DNA聚合酶,Pfu DNA聚合酶等,TaqDNA聚合酶活性依赖Mg2+(激动剂) 不同的酶需不同浓度的Mg2+ Taq:Mg2+对反应影响很大,0.5mM-1.5mM 终浓度 pfu:Mg2+ 2-3mM,dNTP、primer用量约增加一倍 外界影响: EDTA鳌合Mg2+ 选较低浓度TE(10mM Tris,1mMEDTA); DNA模板、引物和dNTP的磷酸基团均可与Mg2+ 结合,降低Mg2+有效浓度。 如果扩增产物或效率不理想,要注意调整合适的 Mg2+浓度,Mg2+,质粒DNA 噬菌体DNA 染色体DNA cDNA 较小 较大 通常单拷贝 较小 变性较易 变性较难 非常大,变性难 变性较易 模板用量 Plasmid:lng,Chromosome:300-500ng, cDNA:0.5-1l 注意: 模板质量很关键,防止交叉污染,模板DNA,dNTP 四种脱氧核苷酸,浓度必须一致 终浓度:50-200 M 注意:不稳定,保存时间长会失效;,与待扩增目的DNA两端序列互补的寡核苷酸链,决定PCR扩增产物的特异性和长度。,DNA引物(primer):,解决方案: 避免反复冻融,分装冻存;,引物设计一般遵循的原则,长度:1530bp,碱基分布的随机性,G+C含量在40%60%, Tm=4(G+C)+2(A+T),两引物间避免互补,以防形成引物二聚体,引物自身也不应互补,以免引起自身折叠,引物的3端:不能修饰,不应错配,引物的5端:可加修饰位点,特异性:与非特异靶区之间的同源性不能超过70% 或有连续8个互补碱基同源, 人工合成短寡核苷酸片段,Tm=55-80, 两条引物Tm值要相近,最好一致。 上游Primer与下游Primer 正向/反向引物 一条链为设计模板,5端相同, 3端互补,引物设计(一),rat beta-nerve growth factor sequence 5-301 gttctacact ctgatcacag cgtttttgat cggcgtacag gcagaaccgt acacagagat361 caatgtccca gagggagact ctgtccctga agaccactgg actaaacttc agcattccct421 ctgacacagc cctacgcaga gcccgcagtg cccctgctga accaatagct gcccgtgtga481 agggacgacc cgcaacatca ctgtggaccc caaactgttt aagaaacgga gactccgttc541 accccgcgtg ctgtttagca cccagcctcc caaactgttt aagaaacgga gactccgttc -3Primer 1: (5) gat cgg cgt aca ggc aga ac (3) 328-347Primer 2: (5) gag gct ggg tgc taa aca gc (3) 569-550 反向互补 扩增产物长度:242bp,PCR扩增NGF基因(大鼠), Primer 本身不要出现内部互补序列 形成发夹(Hairpin),内部二级结构 如: GGGTCGATTCCTACCCATGC 减少Primer自身及引物间互补序列,一般不要超过3个互补bp 导致二聚体(dimer),引物设计(二),如:CCCATGC ATGGAGTC : : : : : : : : GGGTCTA TCAGTAAGC,修饰: 如:32P、生物素、荧光素,酶切位点等,不影响其效果 突变:模板 3 AGCTCCATGACCCAG 5引物 5 CGCTCCATGACCCAG 3 注意:绝不可以在3端进行上述改造 DNA聚合酶是53聚合,若3端改造不能互补不能延伸,Primer 5未端可修饰、突变:,引物设计(三),rimer 5端增加碱基 限制性内切酶识别序列: (G)GAATTC GCTCCATGACCCAG 保护bp 便于内切酶消化,不同内切酶需保护bP数量不同 如果所用保护bp数量不合适 影响内切酶消化 影响下步克隆,引物设计,包含待扩增DNA的核酸序列;引物设计软件;设计的引物序列特异性分析;,