嵌入式系统第二讲arm体系结构与编程模型.ppt
《嵌入式系统第二讲arm体系结构与编程模型.ppt》由会员分享,可在线阅读,更多相关《嵌入式系统第二讲arm体系结构与编程模型.ppt(77页珍藏版)》请在三一办公上搜索。
1、第二讲 ARM体系结构与编程模型,电信学院崔寅鸣,本讲主要内容,ARM体系结构体系结构的版本ARM体系的变种 ARM系列处理器介绍ARM处理器架构流水线结构 MMU,I/O,DMA,AMBA,JTAG核与内核ARM编程模型,ARM体系结构,ARM体系结构的发展,ARM 版本性能结构概览,ARM处理器命名规则,ARM7TDMI核命名规则7 体系结构 T Thumb 代码支持(16 bit 指令)D Debug 硬件调试模块支持M 加强的乘法支持I EmbeddedICE LogicS 可综合的软核E DSPJ Jazeller,允许直接执行Java字节码,ARM体系的变种(一),Thumb指令集
2、(T变种)Thumb指令集是ARM指令集的子集,16位长,与ARM指令集相比:完成同样任务,Thumb代码通常使用更多的指令Thumb指令集不包括异常处理所需的指令目前Thumb指令集有2个版本V1用于ARMV4V2用于ARMV5,与V1比切换ARM/Thumb更高效,增加SWI,更严格定义了乘法指令对条件标志位的影响,ARM体系的变种(二,略),长乘法指令(M变种)增加了两条用于长乘法操作的ARM指令32326432323264在V3体系中引入,ARM体系的变种(三,略),增强型DSP指令(E变种)几个新的16位乘法运算和乘加指令;完成饱和带符号加减运算;可对双字数据操作的加载寄存器(LDR
3、D)、存储寄存器STRD和协处理器寄存器传输指令MCRR、MRRC;Cache预加载指令PLD;,ARM体系的变种(四,略),另外,一些早期体系结构的E变量未实现指令LDRD、STRD、MCRR、MRRC,为了表示这种结构,通常用xP表示;在非T或非M变量的体系结构中,E变量无效。例如:ARMv5TExP表示:ARM指令集版本v5,支持Thumb指令集,支持长乘法,支持除LDRD、STRD、MCRR、MRRC外的所有增强型DSP指令。,ARM体系的变种(五,略),Java加速器Jazelle(J变种)提供Java加速功能,比普通虚拟机(VM)相比,Jazelle使Java代码运行速度提高8倍,
4、功耗降低80使得同时运行Java应用程序,操作系统,中间件可以在单独的处理器上实现在ARM v4TEJ中首先使用,ARM体系的变种(六,略),媒体功能扩展(SIMD变种)音频/视频处理性能提高24倍可以同时进行两个16位操作数或四个8位操作数的运算提供小数算术运算用户可定义饱和运算模式(溢出后使用最大的整数或最小的负数来表示)两套16位操作数的乘加/乘减运算3232位的小数MAC同时8位/16位选择操作低功耗,ARM微处理器分类,ARM7系列:如ARM7TDMI(TDMI=Thumb,Debugger,Multiplier,ICE)、ARM720T等ARM9系列:MX1采用ARM920T核AR
5、M9E系列ARM10系列ARM11系列StrongARM系列Xscale,ARM7系列处理器特点(一),ARM7系列:如ARM7TDMI、ARM720T等采用ARMV4T结构常见芯片主频为20133MHzARM720T以下没有MMU适合对价位和功耗要求较高的产品。3级流水线和冯.诺依曼结构支持Window CE、Linux Palm OS等,ARM7系列处理器特点(二),指令和数据Cache(ARM710,720,740)平均功耗0.6mW/MHz每条指令平均需要1.9时钟周期处理速度0.9MIPS/MHz小型、快速、低能耗、集成式RISC内核广泛应用于手持式计算机、数据通信和消费类多媒体,A
6、RM9系列处理器特点(一),ARM9系列:MX1采用ARM920T核采用ARMV4T结构常见的芯片主频为100233MHz5级流水线和哈佛结构支持32位的高速AMBA总线接口MMU支持实时操作系统,ARM9系列处理器特点(二),指令数据分离的Cache(ARM920,940,9E)平均功耗0.7mW/MHz132MIPS(120MHz时钟,3.3V供电)或220MIPS(200MHz时钟)配写缓冲低价、低能耗、高性能应用于高级引擎管理、保安系统、机顶盒、便携计算机和高档打印机,ARM9E处理器特点(略),ARM9E系列采用ARMV5TE结构5级流水线和哈佛结构紧耦合的存储器接口支持32位的高速
7、AMBA总线接口MMU支持DSP指令集,适合高速数字信号处理支持实时操作系统具有指令Cache和数据Cache支持VFP9浮点处理协处理器,ARM10系列处理器特点(一),ARM10系列采用ARMV5TE结构6级流水线和哈佛结构支持64位的高速AHB总线接口MMU支持DSP指令集,适合高速数字信号处理支持实时操作系统具有指令Cache和数据Cache支持VFP9浮点处理协处理器,ARM10系列处理器特点(二),时钟速度300MHz每条指令平均需要1.2个时钟周期适用于高性能手持式因特网设备,数字式消费类产品,ARM11系列处理器特点,ARM11采用ARMV6结构8级流水时钟达到550MHz0.
8、13um工艺支持IEM(Intelligent Energy Manager),节约高达75的处理器功耗ARM1156T2-S,ARM1156T2F-S首批含有Thumb-2内核技术,其他系列ARM处理器(一),SecureCore系列专为安全需要而设计灵活的保护单元Strong ARM融合了Intel技术的具有ARM体系结构的32位处理器采用ARMV4T结构5级流水Intel以SA110命名包括SA1100 PDA系统芯片和SA1500 多媒体处理器芯片,其他系列ARM处理器(二),XscaleIntel新一代的性能全、性价比高、低功耗的微处理器 ARMV5TE7级超流水线32k数据缓存、3
9、2k指令缓存,ARM处理器架构简述,ARM处理器架构(三级流水),ARM处理器包括:32位ALU 31个32位通用寄存器及6个状态寄存器 32x8位乘法器 32x32位桶形移位寄存器 指令译码及控制逻辑 数据/地址寄存器组成,ARM处理器流程示意,ARM的流水线结构(一),流水线结构一条指令典型执行过程可能包括:取指:从存储器中取出指令(fetch);译码(dec);取操作数,从寄存器组中读操作数(reg);执行运算(ALU);存储器访问(mem);结果写回寄存器(res);,ARM的流水线结构(二),指令流水线,ARM7的三级流水,ARM7 采用3级流水线,即分为取指、译码和执行。,ARM9
10、的五级流水,ARM9 5级流水线,即分为取指、译码、执行、数据缓存和写回。3级流水线阻塞主要发生在存储器访问和数据通路的占用上,ARM9则采用5级流水线,把存储器存取和数据存取分开,且增加I-Cache和D-Cache,同时增加了数据写回的专用通道,I-Cache和D-Cache,快存(Cache)结构 新型ARM处理器采用I-Cache和D-Cache独立的结构,存储器管理单元MMU,存储器管理单元MMU(Memory Management Unit)MMU可以通过CP15协处理器的R1的设置,选择打开或关闭。MMU的主要功能将虚拟地址转换为物理地址;控制存储器访问权限。MMU支持基于段或页
11、的存储器访问,其中有段(1MB)、大页面(64kB)、小页面(4 kB)、微小页面(1 kB),MMU的控制,ARM存储器管理单元的控制,通过协处理器CP15的寄存器R1、R2、R3、R4、R5、R6、R8、和R10来实现,其中R2为转换表基址寄存器,详细内容参见ARM Architecture Reference Manual。,地址变换后备缓冲器TLB,类似Cache,只存放最近使用过的页表项,也称为快表是虚拟地址和物理地址之间的高速缓存,包含了64项虚页号和实页号的对应关系,同时还为访问控制提供信息。若TLB包含虚拟地址的变换项,则存储控制逻辑决定是否允许访问;若允许访问,则MMU输出与
12、虚拟地址对应的物理地址;若不允许访问,则MMU向CPU发出中止信号若请求的虚拟地址不在TLB中时,则引发地址变换过程,直接存储器访问DMA,DMA直接存储器访问I/O的数据块直接传送到存储器的缓冲区而不需要处理器的介入在I/O的数据流量比较大,中断处理频繁的场合可以提高系统性能,ARM的I/O结构形式,ARM采用存储器映像I/O的方式,即把I/O端口当作特殊的存储器地址来访问。一般有若干个寄存器:发送数据寄存器(只写)接收数据寄存器(只读)控制寄存器状态寄存器(只读)中断控制寄存器中断IRQ和快速中断FIQ对于FIQ的请求响应时长最多28个周期,ARM JTAG调试接口(一),JTAG测试标准
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 嵌入式 系统 第二 arm 体系结构 编程 模型

链接地址:https://www.31ppt.com/p-6415015.html