第4章ARM体系结构ppt课件.pptx
《第4章ARM体系结构ppt课件.pptx》由会员分享,可在线阅读,更多相关《第4章ARM体系结构ppt课件.pptx(136页珍藏版)》请在三一办公上搜索。
1、第4章ARM体系结构,本章主要介绍以下内容:ARM体系结构版本ARM处理器系列ARM流水线ARM工作模式和工作状态ARM寄存器组织ARM存储器组织ARM的异常中断AMBA,2022/11/13,武汉工程大学计算机学院,ARM处理器基本特征,ARM处理器在设计上沿用了RISC技术的基本特征,但是也放弃了一些RISC设计特征。沿用的有:通用寄存器堆,32位定长指令,Load/Store访问存储器指令和3地址数据运算指令。没有沿用的有:重叠寄存器窗口,延迟转移和单周期指令执行。2001年以后, ARMv6体系结构中增加了60多条SIMD指令集。,2022/11/13,武汉工程大学计算机学院,4.1
2、ARM体系结构版本,迄今为止主要出现过7个指令集体系结构版本,分别命名为V1-V7。此外还有基于这些体系结构版本的变种版本。目前主要在用的ARM处理器的体系结构是V4、V5、V6和V7。每一个版本都继承了前一个版本的基本设计,指令集向下兼容。,2022/11/13,武汉工程大学计算机学院,当前在用的ARM核概况,目前实际使用的ARM处理器核有二十多种每一种处理器核依据一个体系结构版本设计这些ARM核的共同特点是:字长32位、RISC结构、低功耗、附加16位高密度指令集Thumb获得广泛的嵌入式操作系统支持包括:Windows CE、Palm OS、Symbian OS、Linux以及其他的主流
3、RTOS含有嵌入式跟踪宏单元ETM(Embedded Trace Macro),2022/11/13,武汉工程大学计算机学院,体系结构版本V1,这种版本在原型机ARM1上实现过,从未用于商用产品。它包含:基本的数据处理指令(不包括乘法);字节、字和多字的加载/存储(load/store)指令;分支(branch)指令,包括设计用于子程序调用的分支与链接指令;软件中断指令SWI。版本V1只有26位寻址空间,现在已废弃不用。,2022/11/13,武汉工程大学计算机学院,体系结构版本V2,增加了这几种指令:乘法和乘加指令;支持协处理器的指令;快速中断模式(FIQ)中额外的2个备份寄存器;SWP指令
4、和SWPB指令。版本V2和它之后的版本V2a仍然只有26位寻址空间,现在已废弃不用。,2022/11/13,武汉工程大学计算机学院,体系结构版本V3,这个体系结构版本将寻址范围扩展到了32位。当前程序状态信息由过去存于R15中移到一个新的当前程序状态寄存器CPSR(Current Program Status Register)中。增加了程序状态保存寄存器SPSR(Saved Program Status Registers),以便当异常出现时保留CPSR的内容。增加了2个指令(MRS和MSR),以访问新的CPSR和SPSR寄存器。,2022/11/13,武汉工程大学计算机学院,体系结构版本V
5、4,对体系结构版本V3进行了扩展,即:半字读取和存储指令;读取带符号的字节和半字数据的指令;增加了高密度指令集Thumb,这样V4体系结构有了T变量;有了在ARM/Thumb状态之间切换的指令;增加了处理器管理模式(SVC模式)。,2022/11/13,武汉工程大学计算机学院,体系结构版本V5,提高了T变量中ARMThumb之间切换的效率;增加了一个前导零计数(count leading zeros)指令,该指令允许更有效的整数除法和中断优先程序;增加了软件断点指令;为协处理器设计者增加了更多可选择指令;对由乘法指令如何设置标志进行了定义。,2022/11/13,武汉工程大学计算机学院,体系结
6、构版本V6,平均取指令和取数据延时减少,因Cache未命中造成的等待时间减少,总的内存管理性能提高达到30%左右;适应多处理器核的需要;增加了SIMD指令集。支持混合端序,能够处理大端序和小端序混合的数据;异常处理和中断处理得以改进,实时任务处理能力增强。,2022/11/13,武汉工程大学计算机学院,体系结构版本V7,扩展了的130条指令的Thumb-2指令集; NEON媒体引擎,该引擎具有分离的单指令多数据(SIMD)执行流水线和寄存器堆,可共享访问L1和L2高速缓存,因此提供了灵活的媒体加速功能并且简化了系统带宽设计;TrustZone技术,可以对电子支付和数字版权管理之类的应用业务提供
7、可靠的安全措施。,2022/11/13,武汉工程大学计算机学院,ARM处理器的3种指令集,ARM指令集32位,低密度指令集Thumb指令集16位,高密度指令集Jazelle指令集8位,Java字节码指令集,2022/11/13,武汉工程大学计算机学院,ARM指令集和Thumb指令集,ARM体系结构版本中带有T变量的ARM处理器核可以工作在2种状态。ARM状态,运行32位的ARM指令集Thumb状态,运行16位的Thumb指令集在任何一种工作状态可以通过转移指令切换到另一种工作状态。ARM和Thumb之间的状态切换不影响处理器工作模式和寄存器中的内容。加电起动时处理器工作在ARM状态。,2022
8、/11/13,武汉工程大学计算机学院,指令集压缩,对于传统的微处理器体系结构,指令和数据具有同样的宽度。与16位体系结构相比,32位体系结构在操纵32位数据时呈显了更高的性能,并可更有效地寻址更大的空间。一般来讲,16位体系结构比32位体系结构具有更高的代码密度,但只有近似一半的性能。Thumb在32位体系结构上实现了16位指令集,以提供:比16位体系结构更高的性能;比32位体系结构更高的代码密度。更加符合工业控制的需要,2022/11/13,武汉工程大学计算机学院,Thumb指令集,Thumb指令集是通常使用的32位ARM指令集的子集。每条Thumb指令是16位长,有相应的对于处理器模型有相
9、同效果的32位ARM指令。Thumb指令在标准的ARM寄存器配置下进行操作,在ARM和Thumb状态之间具有出色的互操作性。执行时,16位Thumb指令透明地实时解压缩成32位ARM指令,且没有性能损失。Thumb具有32位核的所有优点:32位寻址空间;32位寄存器;32位移位器和算术逻辑单元ALU(Arithmetic Logic Unit);32位存储器传送。,2022/11/13,武汉工程大学计算机学院,Thumb指令集(续),Thumb因而可提供长的转移范围、强大的算术运算能力和大的寻址空间。Thumb代码的长度是ARM代码长度的65,当从16位存储系统运行时,提供ARM代码160的性
10、能。Thumb使ARM7TDMI核非常适用于有存储器宽度限制且代码密度为重要的嵌入式应用场合。由于ARM7TDMI具有16位Thumb指令集和32位ARM指令集,这使设计者能根据他们的应用要求在子程序级灵活地强调性能或代码长度。,2022/11/13,武汉工程大学计算机学院,Jazelle技术,Jazelle的特点在于可以直接执行Java Byte Cord。它通过在ARM微处理器上增加Jazelle工作模式,使ARM指令和Java Byte Cord指令在同一个微处理器上执行。ARM的Jazelle技术使Java加速得到比基于软件的Java虚拟机(JVM)高得多的性能,和同等的非Java加速
11、核相比功耗降低80。首颗具备Jazelle技术的处理器是ARM926EJ-S,2022/11/13,武汉工程大学计算机学院,第3种指令集 Jazelle,执行8位指令一个软件与硬件的混合体能够加速Java字节码的执行Java Bytecodes为了执行Java字节码,需要Jazelle技术外加一个Java虚拟机的特殊修订版。Jazelle的硬件部分只负责Java字节码的部分内容,其余由软件仿真。,2022/11/13,武汉工程大学计算机学院,Jazelle指令集特征,CPSR寄存器T=0,J=1硬件完成超过60%的Java字节代码其余由软件完成,2022/11/13,武汉工程大学计算机学院,A
12、RM体系结构版本变量列表(第1种形式),2022/11/13,武汉工程大学计算机学院,ARM体系结构变量列表(第2种形式),2022/11/13,武汉工程大学计算机学院,ARM核版本命名规则,命名规则的字符串表达式如下:ARMxyzTDMIEJF-S其中花括号的内容表示可有可无。前三个参数含义在下面说明:x表示系列号,例如:ARM7,ARM9,ARM10y表示内部存储管理和保护单元,例如:ARM72,ARM92z表示含有高速缓存(Cache),例如:ARM720,ARM940其余体系结构版本变量已经在前面幻灯片给出。,2022/11/13,武汉工程大学计算机学院,ARM核版本命名规则(续),说
13、明:在ARM7TDMI之后出产的所有ARM内核名称,即使“ARM”字串后面没有包含“TDMI”字符串,也都默认包含了该字串。对于2005年以后ARM公司投入市场的ARMv7体系结构的处理器核,使用字符串“ARM Cortex”打头,随后附加一个字母后缀“-A”,“-R”或者“-M”,表示该处理器核适合应用的领域;其中:后缀A表示应用(Application)、 R表示实时控制(Real time)、M表示微控制器(Micro Controller)。,2022/11/13,武汉工程大学计算机学院,ARM核与体系结构版本间的关系,2022/11/13,武汉工程大学计算机学院,ARM体系结构版本详
14、解,2022/11/13,武汉工程大学计算机学院,ARM处理器核的3种应用类型,2022/11/13,武汉工程大学计算机学院,当前主流ARM处理器核一览表,2022/11/13,武汉工程大学计算机学院,4.2 ARM处理器系列,目前在用的ARM处理器系列主要有6个ARM7ARM9ARM10EARM11SecurCore Cortex,2022/11/13,武汉工程大学计算机学院,ARM7系列处理器特点,ARM7系列为低功耗32位核,适用于对价位和功耗敏感的消费类应用。ARM7系列处理器具有以下特点:含有嵌入式ICERT逻辑;非常低的功耗;冯诺依曼结构;MIPS/MHz的三级流水线。,2022/
15、11/13,武汉工程大学计算机学院,ARM7系列处理器特点,2022/11/13,武汉工程大学计算机学院,其它ARM7处理器核,ARM7TDMI-SARM7TDMI的可综合(synthesizable)版本(软核);最适用于可移植性和灵活性为关键的现代设计。ARM720T全性能的MMU;最适用于低功耗和体积为关键的应用。ARM7EJARM7EJ是Jazelle和DSP指令集的最小及最低功耗的实现。,2022/11/13,武汉工程大学计算机学院,ARM7TDMI内核产品举例,ARM7TDMI是一个经典的ARM内核体系结构版本是ARMv4T列出4个基于ARM7TDMI核制造的嵌入式处理器S3C44
16、B0X,三星公司生产SEP3203,东南大学集成电路研究所AT91SAM7,Atmel公司LPC2114,飞利浦公司,2022/11/13,武汉工程大学计算机学院,ARM9系列处理器,ARM9系列是高性能和低功耗特性方面最佳的硬宏单元。它具有:5级流水线提供1.1MIPSMHz的哈佛结构处理能力ARM9主要应用领域先进的引擎管理# 网络电脑仪器仪表# 智能电话安全系统# 机顶盒高端打印机# PDA,2022/11/13,武汉工程大学计算机学院,ARM9系列处理器的组成,2022/11/13,武汉工程大学计算机学院,ARM9系列处理器特点,ARM920T和ARM922T全性能的MMU;指令和数据
17、Cache;高速AMBA基于总线的接口:AMBA片上总线是一个已建立的、用于SOC设计框架的开放标准。ARM940T保护单元;指令和数据Cache;高速AMBA基于总线的接口,2022/11/13,武汉工程大学计算机学院,ARM9E系列,ARM9E系列为可综合处理器具有以下特点:DSP扩充;嵌入式ICERT调试逻辑;提供1.1 MIPSMHz的5级流水线和哈佛结构;紧耦合存储器(TCM)接口,可使存储器以最高的处理器速度运转,可直接连接到内核上,非常适用于必须有确定性能和快速访问时间的代码。,2022/11/13,武汉工程大学计算机学院,ARM9E的组成,2022/11/13,武汉工程大学计算
18、机学院,ARM9E系列处理器特点,ARM966E-S最适用于硅片面积为关键而对Cache无要求的实时嵌入式应用;可配置的TCM大小:0KB、4KB、8KB、16KB,可高达64MB。ARM946E-S集成的保护单元,提供实时嵌入式操作系统的Cache核方案。每个配置的Cache大小为:0KB、4KB、8KB、16KB,高达1MB。,2022/11/13,TCM是紧密耦合存储器的缩略语多处理器阵列上使用,武汉工程大学计算机学院,紧耦合存储器在ARM V6处理器存储系统模型中的位置,2022/11/13,武汉工程大学计算机学院,ARM9E系列处理器的特点,ARM926EJ-SJazelle扩充;每
19、个可配置的Cache大小:4KB、8KB、16KB,高达128KB;分立的指令和数据高速AHB接口;全性能的MMU主要智能手机,3G手机和媒体播放器使用的处理器均采用ARM926EJ-S核。,2022/11/13,武汉工程大学计算机学院,ARM10系列处理器,ARM10系列为硬宏单元,具有如下特点:DSP扩展;嵌入式ICE-RT;全性能MMU;Cache;对于指令和数据,64位AHB接口;6级流水线;内部64位数据通路;1.25 MIPSMHz;在实际应用中,与同等ARM9器件相比,在同样的时钟速度下,性能提高了50。,2022/11/13,武汉工程大学计算机学院,ARM10系列处理器的组成,
20、2022/11/13,武汉工程大学计算机学院,SecurCore SC100系列,SecurCore SC100系列专为安全需要而设计具有特定的抗窜改(resist tampering)和反工程(reverse engineering)特性;带有灵活的保护单元,以确保操作系统和应用数据的安全。,2022/11/13,武汉工程大学计算机学院,ARM11系列处理器,ARM11核是2001年10月公布的V6体系结构版本的第1个实现,具有以下特点:主频:350-500MHz工艺:0.13微米功耗:0.4mW/Mhz电压:1.2V8级标量流水线64位数据通路,2022/11/13,武汉工程大学计算机学院
21、,掌握ARM处理器的注意点,初学者要弄清楚三个基本概念ARM体系结构版本ARM公司规定,长期使用ARM处理器核型号ARM公司规定,中期使用ARM处理器型号多个公司生产,各个公司自行规定,2022/11/13,武汉工程大学计算机学院,ARM Cortex核系列处理器,目前已经有了四个ARM Cortex内核Cortex-A8、Cortex-M4、Cortex-R4和Cortex-R4F 特点:先进3级流水线、哈佛结构、ARMv7指令集、灵活的可配置功能(可以在整合阶段对Cache、TCM和MPU进行配置)、分支预测、单周期乘法、硬件除法器、峰值运算速度达到1.25DMPIS/MHZ(Dhryst
22、one测试基准)、新的Thumb-2指令集。A系列针对高端的复杂操作系统以及用户应用设计的应用处理器;R系列针对系统专用嵌入式处理器;M系列针对微控制器和低成本应用专门优化的深嵌入式处理器,2022/11/13,武汉工程大学计算机学院,ARM Cortex处理器举例,ARM Cortex-A8ARM Cortex-M3ARM Cortex-R4,2022/11/13,武汉工程大学计算机学院,ARM Cortex系列处理器,The ARM Cortex family comprises three series, all implement the Thumb-2 instruction set
23、.ARM Cortex-A Seriesapplications processors for complex OS and user applications.Supports the ARM, Thumb and Thumb-2 instruction setsARM Cortex-R Seriesembedded processors for real-time systems.Supports the ARM, Thumb, and Thumb-2 instruction setsARM Cortex-M Seriesdeeply embedded processors optimiz
24、ed for cost sensitive applications.Supports the Thumb-2 instruction set only,2022/11/13,武汉工程大学计算机学院,ARM Cortex-A8简介,The ARM Cortex-A8 processor is the first applications processor based on the ARMv7 architecture and is the highest performance, most power-efficient processor ever developed by ARM. Wi
25、th the ability to scale in speed from 600MHz to greater than 1GHz, the Cortex-A8 processor can meet the requirements for power-optimized mobile devices needing operation in less than 300mW; and performance-optimized consumer applications requiring 2000 Dhrystone MIPS.,2022/11/13,武汉工程大学计算机学院,ARM Cort
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ARM 体系结构 ppt 课件
链接地址:https://www.31ppt.com/p-1354276.html