第十二章非编码RNA与复杂疾病ppt课件.ppt
《第十二章非编码RNA与复杂疾病ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十二章非编码RNA与复杂疾病ppt课件.ppt(189页珍藏版)》请在三一办公上搜索。
1、第十二章 非编码RNA与复杂疾病,生物信息学,人类基因组的蛋白质编码区的总和占总基因组长度为12,那么其他98的基因组有什么功能呢(junk dna)?(1)42的基因组是插入编码序列的内含子序列;人类基因平均每个基因有7个内含子。但这么冗长的内含子序列有什么生物学功能呢?(2)其他55%的基因组的功能是什么?【注:90%以上的基因组都是转录的!】,人类基因组草图带给科学家们的困惑,人类基因组绝大部分都被转录成RNA,细胞内非编码RNA的数量是编码RNA的上百倍。这促使许多科学家认为生物体复杂性被隐藏在它们所输出的非编码RNA内,而非编码序列内。,non-coding RNA,ncRNA,不能
2、翻译成蛋白的功能性RNA分子Housekeeping non-coding RNAtRNAs、rRNAs、snRNAs etc.Regulatory non-coding RNAsmall non-coding RNAsiRNA、miRNA、piRNA etc.Long non-coding RNA(lncRNA,200 nt),第一节 引言,Section 1 Introduction,随着ncRNA在复杂疾病中的研究深入,研究者发现其在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使ncRNA可能成为疾病诊断、预后的新的生物学标记(biomark),并为
3、更进一步理解复杂疾病的发病机理提供了新的手段。,第二节 非编码RNA与其靶基因,Section 2 Non-coding RNAs and Targets,(一)miRNA的发现,一、miRNA概述,miRNA was first discovered in 1993 by Victor Ambros at Harvard(lin-4)The second miRNA Let-7 was discovered in 2000 by Frank Slack as a postdoc at Harvard(Gary Ruvkun lab),The discovery of miRNAs,Victo
4、r Ambros,Gary Ruvkun,microRNAs had been neglected for so many years because of their small size.,The underlying reason is:people never dream that small RNAs will have important biological roles.,The number of the identified miRNAs is growing rapidly in recent years.Release 21(July 2014)of the miRBas
5、e database have added 4196 new hairpin sequences and 5441 new mature productsRelease 20 contains 24521 entries representing hairpin precursor miRNAs,expressing 30424 mature miRNA products,in 206 species.,These miRNAs are from primates,rodents啮齿类,birds,fish,worms,flies,plants and viruses.The data are
6、 freely available to all through the web interface at http:/www.mirbase.org/.,Since around 2007,the overwhelming majority of microRNAs deposited in miRBase have been predicted from small RNA deep sequencing experiments.,miRNA的生物合成过程,mature miRNA,Precursor miRNA,Primary miRNA,miRNA gene,转录,剪切,剪切,miRN
7、A,(二)miRNA的生物合成,几百几千碱基,约70 90碱基,约22碱基,miRNA 例子,The miRNA genes and Structure of pri-miRNAs,Pri-miRNAs bear the 5 cap and 3 poly(A)tails,(三)miRNA的特点、作用机制及分类,microRNA命名规则,hsa-miR-181a-2*hsa人,mus小鼠,rat大鼠let,lin,mir,miR,181:编号,按注册顺序a:与已注册的miRNA序列高度同源,2:由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的 miRNA,则在后面加上阿拉伯数字以区分
8、*:如果一个前体的2个臂分别产生miRNA,则根据克隆实验,在表达水平较低的miRNA 后加“*”;或进行如下命名 hsa-miR-188-5p(或hsa-miR-188-3p)5p:表示从 5 端的臂加工而来;3p:表示从 3 端的臂加工而来,miRNA/miRNA-star VS-5p/-3p,the dominant strand could change in different biological settings leading to different names describing the same molecule,5p arm(placenta)to the 3p ar
9、m(heart,liver,and kidney),物理位置特点miRNA基因以单拷贝、多拷贝和基因簇等多种形式存在于基因组中。miRNA簇(miRNA clusters)是指在染色体上彼此紧密相邻的两个或者多个miRNA构成的miRNA群miRNA倾向于成簇出现在染色体上;通常定义50kb的距离为一簇同一簇中的miRNA倾向是共表达的,miRNA一般特点 miRNA家族/簇,序列(特别是种子序列)高度同源的miRNA被归为一个miRNA家族同一家族中的miRNA并不一定是成簇的。,seed,miRNA的一般特点,序列特点非编码性成熟的miRNA 5 端为单一磷酸基团,3端为羟基,这一特点使它
10、与大多数寡核苷酸和功能RNA 的降解片段区别开来;,表达特点miRNA具有时序性以及组织特异性在特定的时间,组织中才会表达保守性特点在物种间高度保守,miRNA的作用机制,通过和靶基因3UTR(3非翻译区)结合导致RNA诱导的沉默复合体(RNA-induced silencing complex,简称RISC)降解其靶mRNA或阻碍其靶的翻译。,RISC,转录后层面调控基因表达,二、基于序列的miRNA靶基因预测方法,miRNA靶基因预测遵循的基本原则 miRanda TargetScan,Three Classes of miRNA Target Sites(Brennecke et al.
11、Plos Biology 2005),(一)miRNA靶基因预测遵循的原则和基本步骤,miRNA的“种子区”与mRNA的3UTR序列碱基互补靶点在多物种间的序列保守性miRNA与mRNA形成双链结构的热力学稳定性靶基因二级结构和靶点外的序列对靶基因预测的影响,遵循的原则,miRNA靶位点预测的难点:miRNA与靶位点的不完全互不配对,基本步骤,在3UTR上探寻和miRNA“种子区”完全互补的序列;计算miRNA和这些序列结合产生的自由能下降值,对靶点进行筛选;对靶点进行物种间序列比对,利用物种保守性进一步筛选。,(三)TargetScan,TargetScan主要考虑物种间保守的miRNA靶基
12、因,并且在TargetScan中首次提出了“种子匹配”(seed match)的概念。,http:/www.targetscan.org/,TargetScan算法的基本步骤,在TargetScan算法中,“种子匹配”被定义为miRNA 5端的第28位碱基与mRNA 3UTR 上的一段7nt(nucleotide)序列完全互补,miRNA上的这7个核苷酸被称为miRNA“种子区”。从种子区开始向miRNA两侧寻找互补碱基,允许G-U配对,直到出现碱基错配为止。在物种保守方面,TargetScan算法发现随着物种数目的增多,预测的靶基因数目逐渐减少,但预测结果的准确率得到提高。,三、基于表达信息
13、预测miRNA靶基因,Huang等人利用在88个组织中同时检测了miRNA和mRNA表达的数据,并结合贝叶斯方法开发了靶基因预测算法GenMiR+,得到了104个人类miRNA的高精度靶基因,并通过实验证实了预测的let-7b靶基因,结果表明,与基于序列的方法相比,利用相同样本中同时检测miRNA和mRNA的表达谱可以更准确的预测miRNA靶基因。(Huang,Using expression profiling data to identify human microRNA targets.Nat.Methods.),四、基于高通量测序结果预测miRNA靶基因,Argonaute CLIP-
14、SeqRIP-CLIPpSILACDegradome-Seq,Ago binds in a ternary 三元的 complex to both miRNA and mRNA,with sufficiently close contacts to allow UV-crosslinking to either RNA;mRNA tags will be in the immediate vicinity of miRNA binding sites.,Argonaute CLIP-Seq,Argonaute CLIP-Seq,Argonaute CLIP-Seq,又称为HITS-CLIP(u
15、ltraviolet cross-linking and immune-precipitationand and high-throughput sequencing),即紫外交联免疫共沉淀与高通量测序偶联技术。CLIP 技术是研究RNA结合蛋白(或者RNA)体内结合靶标的新技术。通过紫外交联将RNA结合蛋白与体内结合的RNA分子进行固定,用Ago蛋白的抗体免疫共沉淀之后酶解未受蛋白保护的RNA,可以获得Ago蛋白直接结合的RNA序列。,针对AGO蛋白的CLIP-seq技术能够在全基因组范围内鉴定与AGO蛋白结合的小RNA及其mRNA靶标。Chi,SW,Zang,JB,Mele,A,Darne
16、ll,RB.2009.Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps.Nature.460:479-86。,Furthermore HITS-CLIP reads do not precisely pinpoint the position of crosslinking between the RNA and protein,and thus can only identify a targeted region(100-nt)as opposed to a specific target site.,2010年,Gene
17、 W.Yeo采用AGO-CLIPseq技术在线虫中鉴定了Argonaute的结合位点,发现其不仅结合mRNA的3UTR区域,也会结合编码外显子区域,还发现Argonaute大量结合的区域对于miRNA 的功能非常重要,揭示了其新的自我调控的功能。,要想获得检测区域被哪个miRNA调控,还需结合预测算法,五、整合已有知识预测miRNA靶基因,在当前的miRNA靶基因预测研究中,研究人员逐渐意识到单一依靠序列信息或表达信息已不能继续提高miRNA靶基因预测效能。整合功能信息、蛋白质互作信息、表达信息、序列信息以及当前实验证实的miRNA靶基因等已有资源预测miRNA靶基因十分必要。,miRNA靶点
18、优化算法,六、lncRNA概述及靶基因识别,lncRNA定义lncRNA特点lncRNA作用机制,Definition of lncRNA,Long non-coding RNAs(long ncRNAs,lncRNAs)are non-protein coding transcripts longer than 200 nucleotides(Perkel 2013).lncRNAs are transcripts that are 200 nucleotides in length and do not have the potential to encode for proteins e
19、xceeding lengths of 30 amino acids(Mercer TR.Nat.Rev.Genet.2009,Li X Med.Res.Rev.2012).,This somewhat arbitrary limit distinguishes long ncRNAs from small regulatory RNAs such as miRNAs,siRNAs,piRNAs,snoRNAs,and other short RNAs.,Large scale RNA-seqindicate that lncRNA number in the order of tens of
20、 thousands in mammals.9277 manually annotated genes producing 14880 transcripts(GENCODE v7).The number of protein coding genes in our genome has been revised downward multiple timeswhereas the number of known non protein coding transcripts has increased exponentially over the past decade.,Features o
21、f lncRNAs,Features of lncRNAs,lncRNAs are generated by the same transcriptional machinery as are other mRNAs lncRNAs are with similar histone-modification profiles,splicing signals.H3K4me3,H3K36me3lncRNAs are predominantly localized in the chromatin and nucleus,and a fraction appear to be preferenti
22、ally processed into small RNAs.,lncRNA expression,Tissue-specific lncRNAs expressed in the brain.,conservation,Many small RNAs,such as miRNAs or snoRNAs,exhibit strong conservation across diverse species(Bentwich 2005).In contrast,in general lncRNAs lack strong conservation,which is often cited as e
23、vidence of non-functionality(Brosius 2005;Struhl 2007).Despite low conservation of long ncRNAs in general,it should be noted that many long ncRNAs still contain strongly conserved elements,生化鉴定和功能研究尚处于起步阶段,目前仅有大约100多种已知功能的lncRNAs。As of December 2012,127 LncRNAs have been functionally annotated inLnc
24、RNAdb(a database of literature described LncRNAs)(Amral 2011).lncRNA通过表观遗传学调控、转录调控、转录后调控、蛋白活性调控等多种方式调控相关基因的作用,LncRNA as Scaffold for Transcription Repression,HOTAIR and PRC2,lncRNA as miRNA Decoy,Poliseno et al,Nat 2011,lncRNA研究存在的问题,lncRNA的定义 200nt,过于武断lncRNA的命名原则:目前根据功能、结构、作用方式等命名lncRNA相关数据库的内容不够全
25、,注释内容不够丰富,lncRNA生物学功能的阐明lncRNA功能预测的工具不多区分功能性和非功能性非编码转录本种类和功能复杂,使不同的lncRNA研究结果之间的借鉴意义并不高,七、ncRNA数据资源,ncRNA常用数据库,miRBase是一个集miRNA序列、注释信息以及预测的靶基因数据为一体的数据库,是目前存储miRNA信息最主要的公共数据库之一网址:http:/www.mirbase.org/,(一)miRBase数据库,TarBase是一个目前使用广泛的存储实验检测的miRNA与靶基因间关系的数据库,涵盖多种实验方法检测的超过65000个miRNA与靶基因关系对。其网址为:http:/d
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十二 编码 RNA 复杂 疾病 ppt 课件
链接地址:https://www.31ppt.com/p-2106816.html