计算机组织结构第一篇.ppt
1,计算机组织结构,XX大学计算机系 2012.1,2,课程简介,计算机组织(Computer Organization)是指计算机运算器、存储器、控制器、输入设备和输出设备等主要功能部件的相互连接和相互作用,借以实现机器指令级的各种功能和特性。运算器、存储器、控制器、输入设备和输出设备看成是一台计算机的逻辑组成中最基本的功能部件。现代计算机的物理组成要比这个逻辑组成复杂得多,实际上每种功能部件可能不止一个,有些分布于全机,有些相互结合在一起。,3,计算机体系结构(Computer Architecture)是程序员所看到的计算机的属性,即概念性结构与功能特性。计算机系统结构在计算机系统的层次结构中处于机器语言级;而计算机组织作为计算机系统结构的逻辑实现和物理实现,其任务就是围绕提高性能价格比的目标,实现计算机在机器指令级的功能和特性。,4,研究和建立各功能部件间的相互连接和相互作用,完成各个功能部件内部的逻辑设计等是逻辑实现的内容;把逻辑设计深化到元件、器件级,则是物理实现的内容。有时把前者称为计算机组织,把后者称为计算机实现。但是,随着集成电路规模的日益增大,这两步实现的内容很难分开,因此将它们统称为计算机组织。,5,为什么要学习本课程?,计算机组织与结构是计算机专业一门重要的专业基础课程,也是CC2001、CC2005以及我国计算机科学与技术专业规范中确定的一门核心课程,它对于学生建立计算机整机概念,了解计算机系统的基本组成、结构和工作原理,从而对本学科其它知识领域和知识单元的内容有更深刻的理解有着非常重要的意义。,6,对于学习汽车工程专业的学生来讲,无论是搞汽车外形设计,还是研究汽车的发动机,都必须对汽车的组成和工作原理有一个基本的了解。同样,对于计算机专业的学生来讲,了解和掌握计算机的组成及工作原理也是必须的。,7,目前很多高校计算机专业的学生在不同程度上有着重软轻硬的思想。这主要有两个方面的原因:一方面,近十年来,随着各行业管理信息系统建设的发展,社会对软件工程师(尤其是应用软件工程师)的需求越来越大,从事软件设计、软件编程、软件维护等方面的人员成为了IT公司、金融、政府及企事业单位紧缺的人才;另一方面,相对软件课程来讲,硬件课程学起来比较枯燥,没有像语言类软件课程有着学完就能用的立竿见影的效果。例如,很多高校都开设了“WEB程序设计”课程,学生学完该课程后,就能设计网站、制作网页,学生当然很感兴趣。,8,实际上,在计算机系统中,计算机硬件和计算机软件是相关联的两个部分,硬件为软件的运行提供了一个平台,要编制高质量的软件程序,对计算机有一个整体的了解是十分重要的。对系统软件程序员来讲,系统软件是和硬件紧密相关的,系统软件程序员必须对机器级硬件十分的清楚,才有可能编制出适应某一机器硬件的系统软件。对应用软件程序员来讲,对机器硬件的了解有助于他们编制更高效和优化的程序。例如,阵列计算机、并行处理计算机、多处理机以及近两年出现的基于多核CPU的计算机系统,对并行计算提供了一个支持的平台。对程序员来讲,对计算机硬件实现的并行处理技术的了解,有助于他们充分利用并行计算环境,编制高效的并行程序。,9,最重要的是,计算机学科的教育有一个完整的科学体系,课程的设置也是围绕这一体系来进行的。作为学生来讲,应该认真学好每一门课,掌握计算机学科领域所要求的各方面知识。只有这样,才能对本学科有一个完整的理解,才能成为真正合格的计算机科学与技术专业的学生。,10,教材内容的组织,本教材在内容的组织上,按照CC2005和2006年我国教育部高等学校计算机科学与技术教学指导委员会制定的“计算机科学与技术专业规范”中的知识领域“CS-AR计算机体系结构与组织”所要求的内容进行编写。,11,各章节涵盖的知识单元包括,1.AR2 数据的机器级表示(核心学时):第2章,2.AR3 汇编级机器组织(核心学时):第3章,3.AR4 存储系统组织与结构(核心学时):第4章,4.AR5 接口和通信(核心学时):第5、6章,6.AR7 多处理和体系结构(核心学时):第8章,5.AR6 功能组织(核心学时):第7章,12,第1章,第2章,第3章,第4章,计算机的发展历程;按IEEE分类法的计算机的分类;最后作为本书的一个序,概括性地介绍计算机的硬件组成及计算机的层次结构。,进位计数制;计算机中数值数据和非数值数据的表示;数值数据在计算机中的二进制运算方法和实现;数据传递过程中进行差错控制的数据校验码。,计算机中汇编级指令的格式、地址结构;指令及操作数的寻址方式,以及指令的种类和功能、典型指令系统的组成等;精简指令系统RISC。,存储器的组织、分类和分层结构;计算机主存储器的组成与工作原理;提高存储系统性能的交叉存储技术、高速缓冲存储器及虚拟存储器技术等。,各章节主要内容,13,第5章,第6章,第7章,第8章,计算机输入输出系统组成;计算机输入输出的控制方式;计算机存储设备磁盘系统以及由磁盘阵列组成的RAID技术。,总线的基本概念、总线的类别和总线的控制方式等;常用总线标准:ISA、PCI等;常用的外部总线接口标准:USB、IEEE 1394和SCSI等。,CPU的功能与组成;CPU的指令周期及执行指令的过程;CPU控制部件设计的两种主要方法:硬布线设计法和微程序设计法。,计算机系统的并行性概念,提高并行性的技术途径;现代计算机普遍采用的流水线技术和多处理机技术;机群系统。,各章节主要内容,14,第1章 计算机系统概论,15,1.1 计算机系统简介,一、计算机系统的软硬件,*电子计算机:,数据存储、数据传送、数据处理,过程控制,*计算机系统的组成:,具有特定功能的信息(程序)。如系统程序、应用程序,表示应用需求,是采用按位及跳动式计算、能够根据逻辑判断结果控制计算过程的电子式机器,*计算机的功能:,计算机的物理实体;如主机、外设等,16,功能的实现方式,*计算机系统功能的实现方式:解题过程,*计算机系统组成的特性:软件功能靠硬件实现,硬件性能靠软件反映,硬件具备数据的存储、传送及处理和过程控制功能 软件表示应用的数据处理及过程控制需求 程序(指令序列,硬件用不同指令表示不同功能)执行软件实现应用的数据处理及过程控制功能,17,二、计算机系统的层次结构,机器语言级机器 M1,汇编语言级机器 M3,用汇编程序翻译 成机器语言程序,高级语言级机器 M4,用编译程序翻译 成汇编语言程序 或机器语言程序,操作系统级机器 M2,用机器语言解释 操作系统命令,微程序级机器 M0,用微程序解释 机器指令,18,三、计算机结构与组成,*计算机系统结构:机器语言程序员所看到的计算机属性 概念性结构和功能特性,*计算机组成:实现计算机系统结构时所体现的计算机属性,*计算机实现:实现计算机组成时所体现的计算机属性,19,*相互关系:计算机系统结构确定软硬件功能分配及其界面特性;计算机组成逻辑实现系统结构的内容;计算机实现物理实现计算机组成的内容,20,1.2 计算机系统基本组成,一、冯诺依曼模型计算机,*结构与组成:由运算器、存储器、控制器、输入及输出设备组成,以运算器为中心;,*数据表示与运算:指令及数据均用二进制方式表示,运算亦采用二进制方式,21,*指令组成:由操作码及地址码组成;,例:若加法运算的操作码用010表示,第01000号与第10000号两个存储单元内容相加的操作可表示为:,表示操作的性质,表示操作数在存储器中的位置,*存储程序原理程序存储方式:指令及数据预先存放(以等同地位)在存储器中;,*存储器结构:由定长单元构成的一维空间,存储器按地址访问;,22,*存储程序原理程序控制机制:按程序逻辑顺序、自动地、逐条地取出指令并执行。,下条指令地址 由当前指令产生,23,二、计算机硬件的基本组成,1、计算机硬件的结构 现代计算机均在冯诺依曼模型基础上进行改进,*采用以存储器为中心的结构:使数据传送与数据处理并行,有利于提高系统性能,直接存储器访问(DMA)技术,缓冲技术,24,*由多种存储器构成存储系统:解决速度-容量-价格间的矛盾,有利于提高性能/价格,包含辅存(如DISK等),25,*采用总线互连形式:实现部件操作标准化,有利于提高系统的可扩展性,26,2、计算机部件的基本组成,(1)存储器*功能:存储程序和数据、通过读/写操作接收/提供信息,*术语:存储元件(存储元)可存储一个二进制位的元件;存储单元可同时存储一串二进制位的元件;存储字存储单元内存储的二进制编码;存储阵列所有存储单元的集合 存储单元地址每个存储单元被赋予的惟一编号 存储容量存储阵列可存储的二进制位数,*组成:,27,*完成操作的过程:读操作接收地址及命令,内部操作;输出数据,地址译码器,I/O电路,写操作接收地址及命令;接收数据,内部操作,28,(2)运算器*功能:实现算术运算及逻辑运算,并暂存运算结果,*组成:,*(AC)+YAC的运算过程:(0)(AC)为被加数,AC,TEMP,(1)加数YTEMP(2)(AC)(TEMP)(3)ALU结果AC,约定:(X)表示寄存器X中内容,Y表示存储单元Y中内容,29,(3)控制器*功能:指挥及控制各部件协调地工作,以实现程序执行过程,*程序执行过程:循环的指令执行过程(取指令及执行指令);下条指令地址由当前指令产生(按程序逻辑顺序),指令译码器ID,功能部件,+“1”,地址形成部件,30,*控制器功能的实现方法:循环产生指令执行过程不同时段的时标信号;在不同时段产生当前指令执行所需的部件控制信号,*组成:,31,(4)输入/输出设备*功能:实现外部-内部信息的输入/输出及格式转换;*种类:键盘、鼠标、显示器、打印机、磁盘等;,*连接:通过I/O接口(又称适配器或控制器)与总线连接,I/O接口实现信息传送时的缓冲、中转等功能,32,三、计算机软件的基本组成,1、计算机软件分类 软件分为系统软件及应用软件两大类。,语言处理程序数据库管理系统服务性程序网络管理程序操作系统,科学计算信息管理自动控制人工智能虚拟现实,33,2、操作系统(Operating System,OS)OS是管理所有的硬件资源及软件环境的软件。,*进程的调度与控制:调度在适当时候、按照一定算法确定即将运行的进程;如优先级、轮转、先来先服务 如时间片已满、有I/O请求、进程结束 控制调度完成时,控制上行/下行进程的环境切换,34,四、计算机系统的工作过程,1、机器语言程序的形成*假设的计算机指令系统:,*y=x+b的机器语言程序:有编程和编译两个步骤,指令与数据等同存储,35,2、计算机硬件的工作过程,思考:MAR/MDR对写MEM操作的影响?,与REGa、REGd等无关,(0)REGaMAR(1)MARABus、ReadCBus(2)WaitMFC、结束时DBusMDR(3)MDRREGd,REGa、REGd被占用(总线),*MAR/MDR对访存操作过程的影响:以读MEM为例(1)REGaABus、ReadCBus(2)WaitMFC、结束时DBusREGd,36,(1)指令执行过程 有取指令、分析指令、执行指令3个步骤,*取数指令的执行过程:以ACX为例,MDR,MAR,PC,+“1”,IR,ID,PC,MAR,X,MDR,AC,*加法指令的执行过程:以AC(AC)+Y为例,MAR,MDR,Y,AC,37,(2)程序执行过程,*程序执行的实现方法:-控制器指挥与控制 取指(PC)MMIR,(PC)+“1”PC;分析(IR)IDCU;执行实现指令约定操作(指令转移时重写PC);循环若无中断执行的要求,转,例y=x+b的机器语言程序执行过程:00000 001 00100 ACx 00001 011 00101 AC(AC)+b 00010 010 00100 y(AC)00011 101*停机,*程序执行的初始条件:(a)程序及数据已存放在主存储器MM中;(b)PC内容已经为即将执行的程序首条指令地址,38,39,40,3、程序的执行管理,(1)程序的执行请求方式,*方式2:支持多种请求方式,由OS进行程序的执行管理,*方式1:从主存固定位置开始执行,应用常用于计算机刚启动时的程序执行(如BIOS程序)要求主存由RAM及ROM组成,执行请求方式 用户交互式请求,BOOT程序请求,OS的定时任务请求;执行请求管理 OS通过作业管理机构进行作业的登录、调度等管理,41,(2)程序的执行准备(即作业登录),(3)程序的执行管理(即进程管理)*进程调度:在适当时候、按照一定算法选择即将运行的进程*进程控制:导入所选PCB的硬件相关内容(如程序首址)到CPU中,*加载程序:-硬件资源管理所需 为进程申请主存,将程序文件内容拷贝到主存,并将相关信息(如程序首指令地址等)填到PCB中;,*创建进程:-软件环境管理所需 建立进程控制块PCB(含程序文件名、进程ID、进程状态等);,PCB,*进程执行:CPU自动按PC值取指令并执行(为进程的指令),42,1.3 计算机系统的性能指标,一、计算机系统的性能指标,*系统性能:指在计算机硬件上运行的计算机软件的性能,1、硬件性能参数,*机器字长:指CPU一次能处理的二进制位数。指ALU一次能处理的 n位CPU指机器字长为n个二进制位的CPU;例如,Core 2 CPU为64位CPU,对系统性能的影响机器字长越长,数据处理性能越好;(应用数据长度机器字长时,需分次运算)对其它硬件的影响直接影响ALU、REG长度,间接影响存储字长、数据总线位数,43,*机器主频:指CPU内部主时钟脉冲的频率,常用f 表示。主频单位1GHz=1103MHz=1106KHz=1109Hz;,*存储容量:指存储器可存储二进制信息的总位数。主存容量容量S=存储单元个数存储字长;辅存容量容量S=存储块个数存储块长度;,最大主存容量CPU能够访问的主存最大容量,它决定了CPU的地址和数据引脚数量 数据线位数:通常=机器字长或存储字长,地址线位数:=log2(最大主存容量/数据线位数),时钟周期CPU内部基本操作的时长,常用TC表示;f 与TC关系倒数关系,即f=1/TC,容量单位1GB=1210MB=1220KB=1230B=8230bit;思考:为何不用存储字长或机器字长为单位?,44,*响应时间:指一个任务从任务输入到结果输出的总时间,即 T响应=TCPU+TI/O等待,TCPU=T运算+TMEM+TI/O,2、系统性能指标 时间是唯一标准,主要有响应时间和吞吐量两个指标。,特点反映了单任务计算机系统的软硬件总体性能,CPU时间TCPU=IN CPITC=n为指令系统的指令种类数,CPIi为第i 种指令所需时钟周期数;IN 为程序执行的总指令数(程序包含的指令数,但有关联);Ii为第i 种指令的执行次数,CPI为每条指令平均所需时钟周期数;TC为时钟周期,是机器主频的倒数,TCPU与程序算法、编译程序、指令系统、CPIi及TC均相关,45,例1某计算机主频为2GHz,指令系统只有类指令及类指令,指令长度分别为1B及2B,指令执行时间分别为5个及8个时钟周期。程序A的大小为2MB,其中30%空间为类指令;程序A执行时,所有指令中共有20%的指令需重复执行30次,在这些重复执行的指令中,有40%为类指令。求完成程序A的CPU时间。,解:程序A包含的类指令数=(2MB30%)/1B=0.6220条,类指令数=(2MB70%)/2B=0.7220条;,重复执行的指令数=(0.6220+0.7220)20%=0.26220条;,执行的类指令数=0.6220+0.2622060%29次,类指令数=0.7220+0.2622040%29次;,TCPU=5.1242205TC+3.7162208TC=(25.62+29.728)220TC=55.348220(2109)29ms,46,特点反映了多任务计算机系统的软硬件总体性能,MIPS(每秒百万次指令),缺点:不能反映指令系统功能强弱(可用相对MIPS法),表示因工作量无统一定义,通常用MIPS及MFLOPS代替,*吞吐量:又称吞吐率,指单位时间内能处理的工作量,即 吞吐量=n个任务的总工作量n个任务的总时间,MFLOPS(每秒百万次浮点运算),缺点:只反映了浮点操作能力,不能反映系统整体性能,*其他:RAS(可靠性/可用性/可维护),兼容性等,47,二、性能设计,1、冯诺依曼模型计算机的性能瓶颈,*CPU-MEM瓶颈:CPU与MEM的速度差距越来越大 CPU速度45倍/3年,得益于VLSI技术、器件技术;MEM速度12倍/3年,受限于容量-速度-成本的矛盾。解决方案需从结构与技术方面解决两者速度匹配问题,*指令串行执行瓶颈:指令逐条执行导致性能受限 解决方案1快速串行处理,性能受器件技术的限制,改进效果不佳;解决方案2并行处理,性能受串行程序指令间相关的限制,需从结构与技术方面解决指令间相关问题,48,2、性能平衡设计 重点解决CPU-MEM瓶颈,减少访存延迟、或提高访存效率,*增设Cache:减少访存延迟,减少访问主存频率;*增加总线数据宽度:提高访存效率,以减少访存次数;*采用多级总线:主存连接在最快速总线上,减少访存延迟,3、CPU性能设计 重点解决指令串行执行瓶颈,提高并行性、或减少并行性能的损失,*开发并行技术:操作级流水操作级并行指令级并行;(流水线)(SSE)(超标量流水)*采用数据流技术:按序执行乱序执行;(程序顺序)(指令就绪顺序)*使用转移预测技术:按预测方向先执行,猜错时再回头执行,49,1.4 计算机系统发展历程,一、计算机硬件的发展历史,1、计算机的产生与发展,*发展趋势:向大型机、微型机两个方向发展,*研究重点:器件技术、并行化结构,50,2、微型计算机的产生与发展,*微处理器发展趋势:提高复杂度(增加功能),开发指令级/线程级/内核级并行性,集成存储器,发展嵌入式处理器,51,二、计算机软件的发展历史,1、计算机语言的发展 机器语言汇编语言高级语言应用语言*高级语言例:FORTRAN、PASCAL、C/C+、Java,2、系统软件的发展*语言处理程序:汇编程序、编译程序、解释程序;*操作系统:DOS、UNIX、Windows;(多道程序、分时/实时、网络、分布式、面向对象)*服务性程序:装配、调试、诊断、排错;*数据库:数据库(网状、层次、关系型)、数据库管理软件;*网络:协议(NetNIOS、TCP/IP等)及实现库,52,三、计算机系统分类,1、按规模及功能分类 超级计算机科学计算等;大型计算机多用户使用等;小型计算机办公应用等;工作站图形处理及分布式计算等;微型计算机应用广泛;单片机/嵌入式系统工业控制等,53,2、按信息处理特征分类-Flynn分类法 有SISD、SIMD、MISD、MIMD四种。,SISD计算机是本课程的讨论重点,