嵌入式处理器体系结构.ppt
《嵌入式处理器体系结构.ppt》由会员分享,可在线阅读,更多相关《嵌入式处理器体系结构.ppt(263页珍藏版)》请在三一办公上搜索。
1、,UESTC,UESTC,UESTC,UESTC,UESTC,电子科技大学,电子科技大学,电子科技大学,电子科技大学,自动化工程学院,第2章嵌入式处理器体系结构,嵌 入 式 系 统 设 计,(1)处理器设计的两种结构形式 CISC与RISC(2)从计算机系统角度,强调访问存储器的设计原则 冯诺依曼结构与哈佛结构,处理器体系结构概述,CISC和RISC,CISC:复杂指令集(Complex Instruction Set Computer)具有大量的指令和寻址方式,指令长度可变8/2原则:80%的程序只使用20%的指令大多数程序只使用少量的指令就能够运行,RISC:精简指令集(Reduced I
2、nstruction Set Computer)只包含最有用的指令,指令长度固定确保数据通道快速执行每一条指令使CPU硬件结构设计变得更为简单,处理器体系结构概述,CISC与RISC的对比,处理器体系结构概述,嵌入式微处理器,传统的微处理器采用的冯诺依曼结构将指令和数据存放在同一存储空间中,统一编址,指令和数据通过同一总线访问。哈佛结构则是不同于冯诺依曼结构的一种并行体系结构,其主要特点是程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编制、独立访问。与之相对应的是系统中设置的两条总线(程序总线和数据总线),从而使数据的吞吐率提高了一倍。,处理器
3、体系结构概述,冯诺依曼体系结构,指令寄存器,控制器,数据通道,输入,输出,中央处理器,存储器,程序,指令0,指令1,指令2,指令3,指令4,数据,数据0,数据1,数据2,处理器体系结构概述,哈佛体系结构,指令寄存器,控制器,数据通道,输入,输出,CPU,程序存储器,指令0,指令1,指令2,数据存储器,数据0,数据1,数据2,地址,指令,地址,数据,处理器体系结构概述,ARM微处理器的特点,采用RISC指令集,1.低功耗、低成本、高性能,使用大量的寄存器,ARM/THUMB指令支持,流水线,ARM处理器的特点,ARM微处理器的特点,固定长度的指令格式,指令归整、简单、基 本寻址 方式有23种;,
4、2.采用RISC体系结构,使用单周期指令,便于流水线操作执行;,大量使用寄存器,数据处理指令只对寄存器进行操作,只有加载/存储指令可以访问存储器,以提高指令的执行效率。,ARM处理器的特点,ARM微处理器的特点,31个通用寄存器,包括程序计数器(PC 指针),均为32位的寄存器;,3.大量使用寄存器,6个状态寄存器,用以标识CPU的工作状态及程序的运行状态,均为32位。,ARM处理器的特点,ARM微处理器的特点,ARM微处理器支持两种指令集:ARM指令集和Thumb指令集。,4.高效的指令系统,ARM指令为32位的长度,Thumb指令为16位长度。Thumb指令集为ARM指令集的功能子集,但与
5、等价的ARM代码相比较,可节省3040以上的存储空间,同时具备32位代码的所有优点。,ARM处理器的特点,ARM体系结构版本V1,该版本的ARM体系结构,只有26位的寻址空间,没有商业化,其特点为:基本的数据处理指令(不包括乘法);字节、字和半字加载/存储指令;具有分支指令,包括在子程序调用中使用的分支和链接指令;在操作系统调用中使用的软件中断指令。,ARM体系结构的发展,同样为26位寻址空间,现在已经废弃不再使用,它相对V1版本有以下改进:具有乘法和乘加指令;支持协处理器;快速中断模式中的两个以上的分组寄存器;具有原子性加载/存储指令SWP和SWPB。,ARM体系结构的发展,ARM体系结构版
6、本V2,寻址范围扩展到32位(目前已废弃),具有独立的程序:具有乘法和乘加指令;支持协处理器;快速中断模式中具有的两个以上的分组寄存器;具有原子性加载/存储指令SWP和SWPB。,ARM体系结构版本V3,ARM体系结构的发展,不在为了与以前的版本兼容而支持26位体系结构,并明确了哪些指令会引起未定义指令异常发生,它相对V3版本作了以下的改进:半字加载/存储指令;字节和半字的加载和符号扩展指令;具有可以转换到Thumb状态的指令(BX);增加了用户模式寄存器的新的特权处理器模式。,ARM体系结构的发展,ARM体系结构版本V4,在V4版本的基础上,对现在指令的定义进行了必要的修正,对V4版本的体系
7、结构进行了扩展并增加了指令,具体如下:改进了ARM/Thumb状态之间的切换效率;E-增强型DSP指令集,包括全部算法操作和16位乘法操作;J-支持新的JAVA,提供字节代码执行的硬件和优化软件加速功能。,ARM体系结构版本V5,ARM体系结构的发展,2001年推出ARMv6,它在许多方面做了改进如内存系统、异常处理和较好地支持多处理器。SIMD扩展使得广大的软件应用如Video和Audio codec的性能提高了4倍。Thumb-2和TrustZone 技术也用于ARMv6中。ARMv6第一个实现是2002年春推出的ARM1136J(F)-STM处理器,2003年又推出了ARM1156T2(
8、F)-S和ARM1176JZ(F)-S处理器。,ARM体系结构的发展,ARM体系结构版本V6,ARMv7定义了3种不同的处理器配置(processor profiles):Profile A是面向复杂、基于虚拟内存的OS和应用的Profile R是针对实时系统的Profile M是针对低成本应用的优化的微控制器的所有ARMv7 profiles实现Thumb-2技术,同时还包括了NEON技术的扩展提高DSP和多媒体处理吞吐量400,并提供浮点支持以满足下一代3D图形和游戏以及传统嵌入式控制应用的需要。,ARM体系结构版本V7,ARM体系结构的发展,ARM Family,ARM7 Family,
9、ARM9 Family,ARM10 Family,ARM11 Family,150DMIPS,300 DMIPS,500 DMIPS,1000 DMIPS,ARM Cortex Family,ARM Architecture,ARM体系结构的发展,ARM7微处理器系列,ARM7系列是为低功耗的32位RISC处理器,最适合用于对价位和功耗要求较高的消费类应用。ARM7系列有如下特点:,具有嵌入式ICERT逻辑,调试开发方便;,极低的功耗,适合对功耗要求较高的应用,如便携式产品;,能够提供0.9MIPS/MHz的三级流水线结构;,代码密度高,并兼容16位的Thumb指令集;,对操作系统的支持广泛,
10、如Windows CE、Linux、Palm OS等;,指令系统与ARM9系列、ARM9E系列和ARM10E系列兼容,便于用户的产品升级换代;,主频最高可达130M,高速的运算处理能力能胜任绝大多数的复杂应用。,ARM处理器系列,ARM7微处理器系列,主要应用领域:工业控制、Internet设备、网络和调制解调器设备、移动电话等多种多媒体和嵌入式应用。,ARM7系列微处理器包括如下几种类型的核:ARM7TDMI、ARM7TDMI-S、ARM720T、ARM7EJ。其中,ARM7TMDI是目前使用最广泛的32位嵌入式RISC处理器,属低端ARM处理器核。TDMI的基本含义为:T:支持16为压缩指
11、令集Thumb;D:支持片上Debug;M:内嵌硬件乘法器(Multiplier)I:嵌入式ICE,支持片上断点和调试点;,ARM处理器系列,ARM9微处理器系列,ARM9系列微处理器在高性能和低功耗特性方面提供最佳的表现。具有以下特点:,5级整数流水线,指令执行效率更高。,提供1.1MIPS/MHz的哈佛结构。,支持32位ARM指令集和16位Thumb指令集。,支持32位的高速AMBA总线接口。,全性能的MMU,支持Windows CE、Linux、Palm OS等多种主流嵌入式操作系统。,MPU支持实时操作系统。,支持数据Cache和指令Cache,具有更高的指令和数据处理能力。,ARM处
12、理器系列,ARM9微处理器系列,ARM9系列微处理器主要应用于无线设备、仪器仪表、安全系统、机顶盒、高端打印机、数字照相机和数字摄像机等。,ARM处理器系列,ARM9E微处理器系列,ARM9E系列微处理器的主要特点如下:,支持DSP指令集,适合于需要高速数字信号处理的场合。,5级整数流水线,指令执行效率更高。,支持32位ARM指令集和16位Thumb指令集。,支持32位的高速AMBA总线接口。,支持VFP9浮点处理协处理器。,全性能的MMU,支持众多主流嵌入式操作系统。,支持数据Cache和指令Cache,具有更高的处理能力。,主频最高可达300M。,ARM处理器系列,ARM9E微处理器系列,
13、ARM9E系列微处理器主要应用于下一代无线设备、数字消费品、成像设备、工业控制、存储设备和网络设备等领域。,ARM9E系列微处理器包含ARM926EJ-S、ARM946E-S和ARM966E-S三种类型,以适用于不同的应用场合。,ARM处理器系列,ARM10E微处理器系列,ARM10E系列微处理器的主要特点如下:,支持DSP指令集,适合于需要高速数字信号处理的场合。,6级整数流水线,指令执行效率更高。,支持32位ARM指令集和16位Thumb指令集。,支持32位的高速AMBA总线接口。,支持VFP10浮点处理协处理器。,全性能的MMU,支持众多主流嵌入式操作系统。,支持数据Cache和指令Ca
14、che,具有更高的处理能力,主频最高可达400M。,内嵌并行读/写操作部件。,ARM处理器系列,ARM10E微处理器系列,ARM10E系列微处理器主要应用于下一代无线设备、数字消费品、成像设备、工业控制、通信和信息系统等领域。,ARM10E系列微处理器包含ARM1020E、ARM1022E和ARM1026EJ-S三种类型,以适用于不同的应用场合。,ARM处理器系列,SecurCore微处理器系列,SecurCore系列微处理器除了具有ARM体系结构各种主要特点外,还在系统安全方面具有如下的特点:,带有灵活的保护单元,确保操作系统和应用数据的安全。,采用软内核技术,防止外部对其进行扫描探测。,可
15、集成用户自己的安全特性和其他协处理器。,ARM处理器系列,SecurCore微处理器系列,SecurCore系列微处理器主要应用于一些对安全性要求较高的应用产品及应用系统,如电子商务、电子政务、电子银行业务、网络和认证系统等领域。,SecurCore系列微处理器包含SecurCore SC100、SecurCore SC110、SecurCore SC200和SecurCore SC210四种类型,以适用于不同的应用场合。,ARM处理器系列,ARM处理器(核)命名规则,ARMxyzTDMIEJF-Sx系列号 y存储管理/保护单元zCacheTThumb指令集DJTAG调试器M快速乘法器I嵌入式
16、跟踪宏单元E增强DSP指令JJazelle技术F向量浮点单元S可综合的内核,2:带MMU4:带MPU6:无MMU和MPU,0:标准cache2:小cache 6:可变cache,ARM7TDMIARM926EJ-SARM966ESARM1022E,ARM处理器系列,ARM处理器的先进技术,(1)流水线技术,流水线(Pipeline)技术:几个指令可以并行执行 提高了CPU的运行效率 内部信息流要求通畅流动,译码,取指,执行add,译码,取指,执行sub,译码,取指,执行cmp,时间,Add,Sub,Cmp,最简单的3级流水线,低功耗嵌入式领域的经典产品ARM7就是采用这种3级流水线结构。,AR
17、M处理器的先进技术,史上最经典的5级流水线,早期的MIPS、ARM9等处理器使用这种流水线,以后的处理器也都能看到它的影子,包括x86处理器等。,ARM处理器的先进技术,ARM处理器的先进技术,(2)超标量执行,超标量(Superscalar)执行:超标量CPU采用多条流水线结构,执行1,取指,指令,译码2,译码1,执行2,执行1,取指,译码2,译码1,执行2,流水线1,流水线2,数据回写,ARM处理器的先进技术,ARM处理器的先进技术,超标量处理器,指令并行,Superscalar超标量,VLIW超长指令字,ARM处理器的先进技术,处理器的并行设计,ARM处理器的先进技术,并行总结,ARM处
18、理器的先进技术,ARM处理器的先进技术,(3)高速缓存(CACHE),ARM处理器的先进技术,Cache的工作原理,ARM处理器的先进技术,ARM处理器的先进技术,四级存储结构寄存器 Cache 主存 辅存,其中:cache-主存结构解决高速度与低成本的矛盾;主存-辅存结构利用虚拟存储器解决大容量与低成本的矛盾;,ARM处理器的先进技术,ARM处理器的先进技术,(4)总线和总线桥,总线是CPU与存储器和设备通信的机制,是计算机各部件之间传送数据、地址和控制信息的公共通道。,片内总线或内部总线:连接CPU内部各主要功能部件,片外总线:CPU与存储器(RAM和ROM)和I/O接口之间进行信息交换的
19、通道,数据总线Dbus,地址总线Abus,控制总线Cbus,按相对于CPU位置划分,按功能和信号类型,总线分类,总线宽度,总线频率,总线带宽,总线带宽(单位:MB/s)=(总线宽度/8)总线频率,如:总线宽度32位,频率66MHZ,则总线带宽=(32/8)*66MHz=264MB/s,总线的主要参数,又称总线位宽,指的是总线能同时传送数据的位数。如16位总线就是具有16位数据传送能力。,总线工作速度的一个重要参数,工作频率越高,速度越快。通常用MHz表示。,又称总线的数据传送率,是指在一定时间内总线上可传送的数据总量,用每秒最大传送数据量来衡量。总线带宽越宽,传输率越高。,ARM处理器的先进技
20、术,总线和总线桥,ARM处理器的先进技术,ARM处理器的先进技术,ARM处理器的先进技术,ARM处理器的先进技术,总线和总线桥,原因:数据宽度:高速总线通常提供较宽的数据连接。成本:高速总线通常采用更昂贵的电路和连接器。桥允许总线独立操作,这样在I/O操作中可提供某些并行性。,一个微处理器系统可能含有多条总线,高速总线,低速总线,高速设备,低速设备,桥,总线互联的电路,ARM处理器的先进技术,总线和总线桥,存储器,高速设备,CPU,低速设备,低速设备,桥,高速总线,低速总线,多总线系统,ARM处理器的先进技术,北桥,南桥,前端总线Front Side Bus,ARM处理器的先进技术,ARM处理
21、器的先进技术,ARM处理器的先进技术,AMBA总线,AMBA(Advanced Microcontroller Bus Architecture)是ARM 公司研发的一种总线规范,目前主要版本为2.0 版本。AHB(Advanced High-performance Bus):用于高性能系统模块的连接,支持突发模式数据传输和事务分割;可以有效地连接处理器、片上和片外存储器,支持流水线操作。APB(Advanced Peripheral Bus):用于较低性能外设的简单连接,一般是接在AHB系统总线上的第二级总线。,ARM处理器的先进技术,测试接口,ARMCPU,SDRAMControl,SRA
22、M,LCDControl,桥,并行接口,串行接口,Timer,UART,基于AMBA总线的典型系统,AMBA总线,ARM微处理器的工作状态,从编程的角度看,ARM微处理器的工作状态一般有两种,并可在两种状态之间切换:,ARM状态 此时处理器执行32位的字对齐的ARM指令,Thumb状态 此时处理器执行16位的、半字对齐的Thumb指令,ARM处理器的工作状态,ARM与THUMB,THUMB指令是ARM指令的子集,可以相互调用,只要遵循一定的调用规则,Thumb指令与ARM指令的时间效率和空间效率关系为:,存储空间约为ARM代码的6070,指令数比ARM代码多约3040,存储器为32位时ARM代
23、码比Thumb代码快约40,存储器为16位时Thumb比ARM代码快约4050,使用Thumb代码,存储器的功耗会降低约30,ARM处理器的工作状态,ARM处理器的工作状态,Thumb指令集具有灵活、小巧的特点,ARM指令集支持ARM核所有的特性,具有高效、快速的特点,状态切换方法,ARM指令集和Thumb指令集均有切换处理器状态的指令,并可在两种工作状态之间切换,,在开始执行代码时,应该处于ARM状态。,ARM处理器的工作状态,注意:两个状态之间的切换并不影响处理器模式或寄存器内容。,切换到Thumb状态,当操作数寄存器的状态位(位0)为1时,可以采用执行BX指令的方法,使微处理器从ARM状
24、态切换到Thumb状态。,当处理器处于Thumb状态时发生异常(如IRQ、FIQ、Undef、Abort、SWI等),则异常处理返回时,自动切换到Thumb状态。,ARM处理器的工作状态,;从Arm状态切换到Thumb状态 LDR R0,=Lable+1 BX R0,地址最低位为1,表示切换到Thumb状态,跳转地址标号,切换到ARM状态,当操作数寄存器的状态位为0时,执行BX指令时可以使微处理器从Thumb状态切换到ARM状态。,在处理器进行异常处理时,把PC指针放入异常模式链接寄存器中,并从异常向量地址开始执行程序,也可以使处理器切换到ARM状态。,ARM处理器的工作状态,;从Thumb状
25、态切换到ARM状态 LDR R0,=Lable BX R0,地址最低位为0,表示切换到ARM状态,跳转地址标号,ARM体系结构直接支持的数据类型,字节 8位半字 16位(必须分配为占用两个字节)字 32位(必须分配为占用4个字节),ARM直接支持的数据类型,ARM微处理器的存储器格式,ARM体系结构所支持的最大寻址空间为4GB(232字节),ARM体系结构将存储器看作是从0地址开始的字节的线性组合。从0字节到3字节放置第一个存储的字数据,从第4个字节到第7个字节放置第二个存储的字数据,依次排列。,ARM体系结构可以用两种方法存储字数据,称之为大端格式和小端格式。可以通过硬件的方式设置(没有提供
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 嵌入式 处理器 体系结构
链接地址:https://www.31ppt.com/p-6414928.html