生物信息学高性能计算平台的构建与使用课件.ppt
《生物信息学高性能计算平台的构建与使用课件.ppt》由会员分享,可在线阅读,更多相关《生物信息学高性能计算平台的构建与使用课件.ppt(77页珍藏版)》请在三一办公上搜索。
1、2022/12/9,生物信息学高性能计算平台的构建与使用,提纲,生物信息中心情况简介生物信息学平台的构建数据库检索系统的使用高性能计算系统的使用生物信息学分析实例Q&A,2022/12/9,2022/12/9,生物信息中心情况简介生物信息学平台的构建数据库检索系统的使用高性能计算系统的使用生物信息学分析实例Q&A,2022/12/9,生物信息中心情况简介生物信息学平台的构建数据库检索系统的使用高性能计算系统的使用生物信息学分析实例Q&A,Why Bioinformatics?,2022/12/9,Bioinformatics: What do we need?,What do we need?
2、,满足各种生物信息学分析所需的大规模计算能力的平台,对分子生物信息数据能够快速获取的平台,从互联网快速接入服务器并进行生物信息学分析的平台,Why High Performance Computing(HPC)?,2022/12/9,1,超大规模的数据处理 基因组测序序列: 51020量级 蛋白质折叠计算: 31023 量级 药物设计 平均筛选10000种化合物以上才能得到一种新药,2,超大计算规模的算法 分子动力学模拟 分子相互作网络 分子进化分析 蛋白质结构模拟,3,多用户同时的计算需求 一个和尚、两个和尚、三个和尚,我们的已经完成的工作,满足各种生物信息学分析的HPC,快速获取各种分子生
3、物信息数据,随时从网络接入提交计算任务来分析数据,1. 将多个重要的生物信息数据库本地化安装,2. 建立了一个高性能计算系统,3. 将平台接入校园网/互联网,生物信息学平台的架构,http:/,磁盘存储阵列,万兆网络交换机,数据库系统,高性能服务器,刀片式服务器集群(Cluster),存储系统,高性能计算系统,生物信息学平台硬件与软件系统,What is Cluster(集群)?,2022/12/9,多台计算机通过高速网络连成一个并行计算系统,Why cluster?,2022/12/9,Why cluster?,2022/12/9,普通PC,cluster,Jaguar,Roadrunner
4、,天河1号,K Computer,What is Rocks Cluster?,Rocks Cluster 5.4 的主要功能模块,2022/12/9,我校生物信息学平台拓扑结构图,用户,One Computer!,生物信息平台物理分布视图,生物信息学平台计算机群,数据库节点双路Intel 至强5450处理器2.83GHZ8个核心,32G 内存其他节点8核、16G 内存存储系统30个1 TB硬盘的存储阵列性能指标:208个计算核心2万亿次/秒 浮点运算,以Rocks Cluster为核心的Linux操作环境,为什么选择Unix/Linux来构建平台?,科学研究的通用平台90%以上的科学软件在U
5、nix/Linux下开发多数生物信息学软件只有Unix/Linux版本数量庞大的各种小工具 Sed, awk, vi, emacs, diff, cvs, etc极多的高质量文档免费_ !,各节点的主机名称及IP地址,管理节点主机名称:big.hpc.org; IP地址:202.202.232.201计算节点(26台刀片式服务器)Blade1: compute-0-0compute-0-9Blade2: compute-1-0compute-1-9Blade3: compute-2-0compute-2-5数据库节点:主机名:databaseIP地址:202.202.232.202访问域名:h
6、ttp:/,2022/12/9,平台的并行计算环境,MPI( Message Passing Interface)MPICH2 最基本的MPI,运行简单,应用广泛,效率不高安装路径: /opt/mpich2/gnu/bin/openmpi功能强大、灵活,支持infiniband,效率高安装路径:/opt/openmpi/bin/各计算节点的公共目录/disk1 和 /disk2,容量均为8T,2022/12/9,平台的任务管理系统 SGE,任务管理系统:自动分配计算资源来运行用户的计算任务Sun Grid Engine (SGE)LSFOpenPBS本平台安装的是SGE用户在进行生物信息学计算
7、之前,需要编写SGE计算脚本文件,通过提交脚本文件来使用计算资源。,2022/12/9,其他设备:bio-linux终端计算机,1. 安装了bio-linux系统,图形操作界面 2. 集成了十多种生物信息学软件,免费使用 3. 可迅速连接高性能计算系统进行大规模计算分析,2022/12/9,生物信息学平台的使用方式,使用方式通过校园网或互联网的任意计算机远程登录使用前来我校基础部生命科学楼7楼本地使用,2022/12/9,生物信息中心情况简介生物信息学平台的构建数据库检索系统的使用高性能计算系统的使用生物信息学分析实例Q&A,国际生物信息数据库的本地化过程,下载元数据,构建检索系统,发布数据库
8、,已经收录的数据库,Genbank,Uniprot KB,PDB,EMBL,Refseq,Prosite,MRS检索系统,20多个生物医学相关的数据库主要数据库每日更新集成Blast、ClustalW、Jmol等分析工具可将自己的Web-Server程序、数据库发布到互联网,MRS数据库综合检索系统,Entrez The Life Science Search Engine - NCBISRS = Sequence Retrieval System - EBIMRS = Maartens Retrieval System - BIC at TMMUGoogle = Th best generi
9、c search and retrieval system,2022/12/9,fast,Linux x86-64 version,free,生物信息数据库的使用,生物信息数据库检索系统:一站式检索,2022/12/9,生物信息中心情况简介生物信息学平台的构建数据库检索系统的使用高性能计算系统的使用生物信息学分析实例Q&A,高性能计算系统的使用,Linux基础知识,1,已安装生物信息学软件,2,用户使用流程,3,生物信息学实例分析,4,1、Linux基础知识 什么是Linux?,免费的类Unix操作系统,适合PC机、服务器具有Unix的全部功能,稳定,高效,网络性能优异以Linux为基础的不同
10、的发行版(Distribution):Ubuntu: 适合初学者Debian: Ubuntu的始祖,适合系统管理员Fedora: 适合专业开发者Redhat/CentOS: 适合个人或企业级服务器openSUSE:适合个人办公,Linux很难吗?,看起来很复杂,不知从何下手 实际上上手很快Linux系统不好用 *nux不是用来当桌面的书太多,每本都很厚 推荐OReilly系列,Linux系统的主要组成,Linux的内核:内核是系统的核心,是运行程序和管理像磁盘和打印机等硬件设备的核心程序。Linux SHELL: Shell是系统的用户界面,提供了用户与内核进行交互操作的一种接口。Linux文
11、件系统: Linux文件系统是文件存放在磁盘等存储设备上的组织方法。Linux能支持多种文件系统,如EXT2、EXT3、FAT、VFAT、ISO9660、NFS、SMB等。Linux应用系统:标准的Linux系统都有一整套称为应用程序的程序集,包括文本编辑器、编程语言、办公套件、Internet工具、数据库等。,Linux命令模式下的基本操作命令,ls 或者 ll: 列出当前目录下全部文件相当于DOS下的dircd : 改变当前目录至指定目录例:zoulybig $ cd /disk1/biosoft/mkdir: 建立文件夹例:zoulybig $ mkdir blast-test cp:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 性能 计算 平台 构建 使用 课件
链接地址:https://www.31ppt.com/p-1594223.html