生物信息学幻灯讲义课件.ppt
《生物信息学幻灯讲义课件.ppt》由会员分享,可在线阅读,更多相关《生物信息学幻灯讲义课件.ppt(109页珍藏版)》请在三一办公上搜索。
1、Bioinformatics,生物信息学,授课教师:贾小平单位:河南科技大学农学院,第一章:绪 论,第一节 生物信息学及其发展历史 第二节 生物信息学主要研究内容 第三节 生物信息学的基本方法和技术第四节 生物信息学应用与展望,生物信息学是一门新兴的交叉学科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。,生物信息学的概念:,生物信息学的概念:,“Bioinformatics is the science of using information to understand biology.Its the discipli
2、ne of obtaining information about genomic or protein sequence data.This may involve similarity searches of databases,comparing your unidentified sequence to the sequences in a database,or making predictions about the sequence based on current knowledge of similar sequences.”Claverie(2000),生物信息学的诞生:,
3、生物信息膨胀,生物信息学发展史,(1)萌芽期(60-70年代)序列比较(2)形成期(80年代)分子数据库和BLAST等相似性搜索程序(3)高速发展期(90年代-至今)基因组测序与分析,1962 Pauling提出分子进化理论 1967 Dayhoff构建蛋白质序列数据库 1970 Needleman-Wunsch算法被提出 1977 Staden利用计算机软件分析DNA序列 1981 Smith-Waterman算法出现 1981 序列模序(motif)的概念被提出(Doolittle)1982 GenBank数据库(Release3)公开;EMBL创立 1982-噬菌体基因组被测序1983
4、Wilbur和Lipman提出序列数据库的搜索算法(Wilber-Lipman算法)1985 快速序列相似性搜索程度FASTP/FASTN发布 1988 美国家生物技术信息中心(NCBI)创立 1988 欧洲分子生物学网络EMBnet创立;三大核酸数据库(GenBank、EMBL和DDBJ)开始国际合作,1990 快速序列相似性搜索程序BLAST发布 1991 表达序列标签(EST)概念被提出,从此开创EST测序 1993 英国Sanger中心在英国休斯顿建立 1994 欧洲生物信息学研究所在英国Hinxton成立 1995 第一个细菌基因组测序完成 1996 酶母基因组测序完成 1997 P
5、SI-BLAST(BLAST系列程序之一)发布 1998 PhilGreen等人研制的自动测序组装系统Phred-Phrap-Consed系统正式发布1998 多细胞线虫基因组测序完成 1999 果蝇基因组测序完成 2000 人类基因组测序基本完成 2001 人类基因组初步分析结果公布,生物信息学研究内容,建立和管理各种生物数据库生物信息数据库使用生物信息学中的数学模式和方法研究数据库接口和检索工具的研制HGP的实施,对信息采集和处理提出的要求从大量数据中提取新知识DNA芯片和微阵列的发展,生物信息学基本方法和技术,建立生物数据库各种公共数据库 本地化数据库数据库检索各种数据检索工具的开发和使
6、用Entrez检索体系 BLAST检索体系,生物大分子序列分析Homologous sequence analysis(同源序列分析)Multiple sequence alignment 多序列比对 Evolution analysis(进化分析)Phylogenetic prediction(系统发育分析)进化方式分析 进化位点分析基因组分析序列拼接 序列注释,基因功能、结构分析蛋白质功能、结构分析 蛋白质三维结构预测 蛋白质修饰 Electron PCR统计模型Hidden Markov model(HMM,隐马尔可夫模型)基因识别和药物设计 Maximum likelihood mod
7、el(最大似然模型)序列进化分析,数学算法自动序列拼接 外显子预测 同源序列比较,生物信息学应用与展望,基础研究和教学分子生物学研究的重要手段之一 生命科学的教学药物开发新药筛选 药靶设计 分子药理学研究,疾病诊断利用疑难病症的病原DNA序列诊断疾病 遗传病其他环境监测 食品安全检测 海关检测,展望用于序列分类、相似性搜索、DNA序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具已成为研究工作的重要组成部分生物信息学研究的一个核心问题是数据库的开发数据的共享性和应用性非常重要在我国,生物信息学随着人类和水稻等基因组研究的展开已显露出蓬勃发展的势头。生物信息学作为基因研究的有力武
8、器,被广泛用于新基因的发现,以达到将有用新基因抢先注册专利的目的。在这场抢基因的国际竞争中,如何结合我国科研、开发状况,重点投入以求得局部优势和商业回报,是中国科学家和相关部门必须面对的新课题。,第二章:生物信息学数据库,第一节 模式生物第二节 生物数据库,human,Arabidopsis拟南芥,Thermotoga maritima,Escherichia coli大肠杆菌,Buchnerasp.APS,Rickettsia prowazekii,Ureaplasma urealyticum,Bacillus subtilis,Drosophila melanogaster,Thermop
9、lasma acidophilum,Plasmodium falciparum,Helicobacter pylori,mouse,Caenorhabitis elegans,rat,Borrelia burgorferi,Borrelia burgorferi,Aquifex aeolicus,Neisseria meningitidis Z2491,Mycobacterium tuberculosis,常见的模式生物,人类基因组,模式生物基因组计划,1、人类基因组计划 与曼哈顿原子 计划、阿波罗登月计划并称的人类科学史上的重大工程。于1990年首先在美国启 动,后有德、日、英、法、中等国的
10、科学家先后正式加入。,60年代初,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划 人类遗传信息的复杂性,人类基因组计划(HGP,Human Genome Project)目标:整体上破解人类遗传信息的奥秘,为什么提出HGP?,HGP的历史回顾,1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义1985 Dulbecco在Science撰文“肿瘤研究的转折点:人 类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元1989 美国成立“国家人类基
11、因组研究中心”,Watson担任 第一任主任1990.10 经美国国会批准,人类基因组计划正式启动,James Watson,Walter Gilbert,第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划,H.inf全基因组,Saccharomyces cerevisiae酿酒酵母,Caenorhabditis elegans秀丽线虫,1997 大肠杆菌(E.coli)全基因组测序完成1998 完成人类基因组计划的物理作图 开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划1999.7 第
12、5届国际公共领域人类基因组测序会议,加快测序速度,大肠杆菌及其全基因组,水稻基因组计划,2001年2月15日Nature封面,2001年2月16日Science封面,At the White House on June 26,Francis Collins(r),Director of the National Human Genome Research Institute,President Clinton,and J.Craig Venter,President of Celara Genomics,lauded the thousands of scientists who contri
13、buted to the genome sequence.,1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度2000 Celera公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组拟南芥全基 因组的测序工作2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图2001.2.15 Nature刊文发表国际公共领域结果2001.2.16 Science刊文发表Celera公司及其合作者结果2003年,6国科学家宣布人类基因组序列图绘制成功,HGP的所有目标全部实现。,Drosophila melanogaster果蝇,Arabidopsis th
14、aliana拟南芥,HGP的最初目标通过国际合作,用15年时间(19902005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:HGP的终极目标阐明人类基因组全部DNA序列;识别基因;建立储存这些信息的数据库;开发数据分析工具;研究HGP实施所带来的伦理、法律和社会问题。,遗传图,物理图,序列图,转录图,Homo sapiens 智人,蛋白质编码基因数在2.7万至4万之间(但最新的估计在6.5万至7.5万之间),2、模式生物基因组计划 酵母、线虫、果蝇、细菌、水稻等共约50多种已完成,已经完成全序列测
15、定的基因组,http:/www.ebi.ac.uk/genomes/,viruses,plasmids,bacteria,fungi,plants,algae,insects,mollusks,reptiles,birds,mammals,Genome sizes in nucleotide pairs(base-pairs),104,108,105,106,107,1011,1010,109,The size of the humangenome is 3 X 109 bp;almost all of its complexityis in single-copy DNA.The human
16、 genome is thoughtto contain 30,000 to 40,000 genes.,bony fish,amphibians,噬菌体(Bacteriophage)寄生于细菌内的病毒 如:大肠杆菌噬菌体(coliphages)遗传物质:单链/双链、环状/线状、DNA/RNA,模式生物(Model Organism),模式生物(Model Organism),病毒(Virus)不具有细胞形态结构,仅由核酸和蛋白质构成;如:人艾滋病毒HIV、SARS冠状病毒 体积小,10300nm;严格的专性细胞内寄生;对抗生素不敏感。,电子显微镜下的SARS冠状病毒,100nm,Escher
17、ichia coli(大肠杆菌),大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。,Escherichia coli O157:H7,Escherichia coli K12,模式生物(Model Organism),Saccharomyces cerevisiae(酿酒酵母),真菌界的单细胞真核生物,有16个染色体。它的全基因组已在1996年测定。,模式生物(Model Organism),秀丽线虫(Caenorhabditis elegans),细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元有
18、6条染色体,全基因组于1998年测定,长9.7Mb,模式生物(Model Organism),Drosophila melanogaster(果蝇),繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。,模式生物(Model Organism),Arabidopsis thaliana(拟南芥),个体生活周期只有6周的十字花科小草,是一种理想的模式植物。,模式生物(Model Organism),模式生物(Model Organism),非洲瓜蟾(Xenopus lavias)1个受精卵在24小时内分裂到各种器官初具雏形的程度;,模式生物(Model Organism),斑马鱼(Danio
19、rerio)身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育 过程的良好对象。,模式生物(Model Organism),小鼠(Mus musculus)基因组大小与人类相近,约30亿个核苷酸对,有19条染色体;,生物信息数据库,基因和基因组数据库 GenBank美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)建立可与EMBL、DDBJ合作交换数据包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.htm
20、l(登陆网址),EMBL核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成可与GenBank、DDBJ合作交换数据登陆网址:http:/www.ebi.ac.uk/embl/DDBJ数据库日本DNA数据仓库全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据登陆网址:http:/www.ddbj.nig.ac.jp/,GenBank,PublicfreeAvailableviaInternet,EMBL Data Library,DDBJ(DNA Data Bank of Japan),三大DNA数据库之间的关系,基因组数据库(GDB)人类基因组图谱数据包括人类
21、基因组区域(基因、克隆、EST、遗传标记等)、人类基因组图谱、人类基因组变异网址:http:/www.gdb.org http:/,部分生物基因组计划网址 生物种类 Organism 网址(Address)曲霉菌 Aspergillus http:/www.ncbi.nlm.nih.gov/genome/guide/aspergillus 蜜蜂 Bee http:/www.ncbi.nlm.nih.gov/genome/guide/bee 猫 Cat http:/www.ncbi.nlm.nih.gov/genome/guide/cat 青蛙 Frog http:/www.ncbi.nlm.n
22、ih.gov/genome/guide/frog 老鼠 Mouse http:/www.ncbi.nlm.nih.gov/genome/guide/mouse 小鼠 Rat http:/www.ncbi.nlm.nih.gov/genome/guide/rat/index.html 狗 Dog http:/www.ncbi.nlm.nih.gov/genome/guide/dog 牛 Cow http:/www.ncbi.nlm.nih.gov/genome/guide/cow 猪 Pig http:/www.ncbi.nlm.nih.gov/genome/guide/pig 羊 Sheep
23、http:/www.ncbi.nlm.nih.gov/genome/guide/sheep鸡 Chicken http:/www.ncbi.nlm.nih.gov/genome/guide/chicken斑马鱼 Zebra fish http:/www.ncbi.nlm.nih.gov/genome/guide/zebrafish/index.html,海胆 Sea urchin http:/www.ncbi.nlm.nih.gov/genome/guide/sea_urchin 线虫 Caenorhabditis elegans http:/www.ncbi.nlm.nih.gov/geno
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 幻灯 讲义 课件

链接地址:https://www.31ppt.com/p-2161358.html