PCAppt课件 第二章 Intel PCA开发系统.ppt
《PCAppt课件 第二章 Intel PCA开发系统.ppt》由会员分享,可在线阅读,更多相关《PCAppt课件 第二章 Intel PCA开发系统.ppt(67页珍藏版)》请在三一办公上搜索。
1、第二章 Intel PCA开发系统,XScale 系统结构 PXA255 处理器结构与特性 基于XScale的PXA255 开发系统,2.1、XScale 系统结构,2.1.1 采用改进型哈佛结构,其结构特点为:使用两个独立的存储器模块,分别存储指令和数据,每个存储模块都不允许指令和数据并存,以便实现并行处理;具有一条独立的地址总线和一条独立的数据总线,利用公用地址总线访问两个存储模块(程序存储模块和数据存储模块),公用数据总线则被用来完成程序存储模块或数据存储模块与CPU之间的数据传输;两条总线由程序存储器和数据存储器分时共用。,2.1.2 采用7级超级流水线,PXA255拥有7级超级流水线
2、,主要由主流水线、MAC流水线和内存访问流水线组成。,五级流水线,流水线技术,流水线技术,流水线是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。统水线要求所有的流水级部件必须在相同的时间内完成各自的子过程,在流水线中指令流动一步是一个机器周期。机器周期的长度必须由最慢的流水级部件处理子过程所需的时间决定。指令流水线是将指令执行分成几个子过程,每一个子过程对应一个工位,我们称为流水级或流水节拍。,指令流水执行特点:,1、一条指令分成几个子过程,每个子过程为一个流水级。2、每个子过程由专门的硬件功能部件来完成。3、每个流水功能部件的工作时间是不相同的,流水节拍时间由最长的流水功能部件
3、处理时间决定。4、流水线工作一般有三个阶段,即建立、稳态和排空阶段。5、理想情况下,在流水线处于稳态时,每一流水节拍时间都得到一条指令执行的结果,流水加速比就等于流水线的级数,即流水深度。,F1/F2指令读取 ID指令译码 RF寄存器文件/移位级 X1执行级 X2执行级 XWB写回级,PXA255主流水线,MAC 流水线,执行所有的乘/累加指令,它执行40位累加寄存器acc0同时也能将指令值转化成普通的ARM寄存器值。MAC不是真正的一条流水线,指令的类型和资源均定它所需的周期数。不会同时两条指令出现在MAC 流水线上。当MAC 在处理一条指令的时候其它指令不允许进出到M1 中,除非原来的指令
4、在下一个周期中处理完成。MAC单元执行开始于 M1,接受2个32位操作数,N个周期后完成并返回寄存器文件。,内存访问流水线,内存流水线有D1、D2和DWB3级构成,独立完成指令的装载和存储。在执行完X1后开始执行D1 级,计算有效的存/取地址。在D2 级数据Cache和小型数据cache返回目的数据,在DWB级进行填入缓冲器和写入缓冲器操作。,2.1.3 XScale 乘/累加MAC,MAC只需一个周期即完成乘/累加操作;,MAC由32位乘法和一个CSA(Carry Save Adder)华莱士加法树(WT结构)构成,最后产生40位累加器,CSA(Carry Save Adder)将本级进位传
5、至下级,求和速度快,且速度与字长无关。在阵列乘法器中,CSA把PP阵列(被乘数与乘数中的某一位相乘,产生一组PP)缩减至Sum和Carry两项,再用高速加法器求和得积。,CSA加法器构成的乘法器,(a)普通串行结构;(b)华莱士压缩树,2.1.4 内存管理(MMU),提供内存访问保护和虚拟地址到物理地址的映射,支持指令TLB和数据TLBTLB-Translation Lookaside Buffers,地址变换后备缓冲器),使用CP15协处理器来完成MMU,一般从虚拟地址到物理地址需2次主存,为减少主存接入代价,就在虚拟地址和物理地址之间插入一个TLB。一般每个存储器有一个TLB,所以Xsca
6、le中有D TLB 和I TLB。为了减少TLB的开销,TLB中只存放最近使用过的页表项,其淘汰替代算法采用循环法。TLB增加了相应的锁操作。,TLB-地址变换后备缓冲器,2.1.5 Cache结构,XScale 的Cache有32KB I Cache和 D Cache、2 KB微小型I Cache 和D Cache有128入口的直接映像Cache结构的分支目标缓冲器BTB Xscale支持写回和写直通操作。写回:命中Cache的存储操作不产生一个到外部存储器的写操作。它缓解了外部存储器压力。写直通:所有的存储操作 都要写到外部存储器,它保持了外部存储器和Cache的一致性,分支目标缓冲器(B
7、TB),2.1.6 Xscale性能检测(使用CP14协处理器),XScale的性能监测模块可以通过CP14的寄存器03进行控制,2个32位性能计数器,它可以分别对2个独立的事件同时进行计数;1个时钟计数器,记录内核时钟数,用来表示时间延迟。,2.1.7 Xscale调试,Xscale的JTAG调试方式,接收/发送控制寄存器(TXRXCTRL),RR位,为1时RX准备好,为0时无数据或不可用。OV位,为1时RX溢出,为0时无溢出。D位,该位为高速下载标志位。TR位,为1时TX准备好,为0时无数据或不可用。,通用RX应答协议,XScale 系统结构 PXA255 处理器结构与特性 基于XScal
8、e的PXA255 开发系统,Intel PXA255结构,PXA255结构特点,时钟和电源控制器存储器控制器:支持100MHz SDRAM DMA控制器:具有16个优先级通道 LCD控制器:支持被动和主动LCD显示 系统集成模块:包括GPIO、中断控制器、实时时钟、PWM。支持各种接口:I2S,I2C,2路UART,IrDa,USB Client,MMC,NSSP等,2.2.1、时钟管理,2.2.2 电源管理,Turbo Mode:在短时间内高速运行.快速方式的加速倍率有CCCR寄存器N值决定.Run Mode:正常工作方式.Idle Mode:停止CPU内核时钟,但仍继续监视片内外中断服务请
9、求当发生允许中断时可唤醒CPU,重新启动CPU时钟.Sleep Mode:CPU内核无电源,仅RTC核电源管理器继续工作。SDRAM置为自我刷新方式。功耗最低,2.2.3、DMA控制器,共有16各通道,每个通道有4各32位寄存器控制 外设与存储器及存储器与存储器之间的传送 提供了两种操作模式:非描述子接入方式:主要用于轮询模式 描述子接入方式:主要用于中断模式(更有效)16个信道被分为四组,其优先级各不相同 每个外设都有一个或多个专用DMA请求线,2.2.4、存储器控制器,SDRAM 最大100MHz存储器总线接口可与DRAM、SDRAM、ROM、SMROM、SRAM以及其它潜在的I/O器件共
10、享数据信号 SDRAM支持4个块,每块最大可为64MB。4个块又可分两对,每对中两个块大小和管理必须一样,不同对可以不一样。静态存储器接口和潜在的可变速率I/O接口支持6个片选(CS5.0),每个片选可独立管理.支持16位PC卡/Compact Flash接口,2.2.5、LCD控制器,最大支持10241024,16bits 颜色的LCD Sitsang开发板使用的LCD是640480 支持被动(DSTN)和主动(TFT)显示模式 DSTN:扫描屏幕被分为上下两部分,CPU同时并行对这两部分进行刷新(双扫描),DSTN显示屏上每个像素点的亮度和对比度因不能独立控制,显示效果不佳。每个像素点不能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PCAppt课件 第二章 Intel PCA开发系统 PCAppt 课件 第二 PCA 开发 系统
链接地址:https://www.31ppt.com/p-3909502.html