FPGA与H.264 AVC视频编码标准.ppt
《FPGA与H.264 AVC视频编码标准.ppt》由会员分享,可在线阅读,更多相关《FPGA与H.264 AVC视频编码标准.ppt(4页珍藏版)》请在三一办公上搜索。
1、90,通信与计算机公司在FPGA上实现H.264/AVC视频编码标准,尽管 承诺将比已有视频编码标准具有更高的编码效率,它仍为系统架构师、工程师和硬件设计人员带来了巨大的工程设计挑战。标准引入了自年推出之后视频编码标准演进过程中出现的大部分重,开发成本。复杂度分析为了实现实时标准清晰度()或高清晰度()分辩率编码解决方案,系统架构师常常需要使用多个和可编程。,码器的复杂度的典型情况。请注意,在表中,运动估计、宏块块处理(包括模式决策),以及运动补偿模块是基本候选硬件加速单元。然而,单凭计算复杂度并不能决定一个功能模块是否应映射为硬件或是使其保持为软件。为了评估,大改变和算法间断(,为了说明所需
2、计算的巨大复杂度,在由、可编程或通用主,)。实现编码标准所需的算法计算复杂度、数据局部性,以及算法和数据并行性,常常会直,先探讨一下编码器的典型运行时的周期要求。编码器基于由联合视频工作组()提供的软件模型,该工作组由,处理器混合组成的平台上实现编码标准时,软件和硬件分割的可行性,需要分析将会影响整体设计决策的大量架构问题。,接影响系统级别的整体架构决策。来自 的视频编码专家组,数据局部性。在同步设计中,,这种影响又会决定在广播、视频编辑、电话会议以及消费电子领域开发解决方案所需的最终,()和的运动图像专家组()的专家组成。采用 的 软件,在,按照特定的顺序和粒度访问内存,同时根据延迟、总线竞
3、争、对准、传输率以及所用内存的类型(如 内存、和,表按文件排列的编码器复杂度情况,通 用,等)使时钟周期数降至最小的能力,功能块,占运行时总周期数的百分比,、内存的平台上运行,按照主要配置编码解决方案实现,需要约,(每秒十亿次运算)。表显示了基于通用处理器架构的编,至关重要。数据局部性问题主要是由数据单元和算术单元(或处理引擎)之间的物理接口体现的。数据并行性。大多数信号处理算法都是对高度并行的数据进行操作(如滤波)。单指令多数据()和向量处理器对可被并行化或做成向量格式(或长数据宽度)的数据具有较高的处理效率。可通过提供大量块支持大量极高总计带宽要求来实现这一点。在新的,2005.8 电子设
4、计应用,评估。,引擎。,二,放。,91,通信与计算机器件中,块的数量与 的逻辑片数紧密匹配(例如,具有 个块,个 逻辑片;具有 个块,个 逻辑片;具有 个块,个 逻辑片)。信号处理算法并行机制。在典型的可编程或通用处理器中,信号处理算法并行机制通常是指指令级并行()。超 长 指 令 字()处理器是此类采用的机,器中的一个例子,它将多条指令(、及)组合起来,在一个周期内执行。处理器中高度,图包括功能块和数据流的宏块编码器,流水线化的执行单元也是实现并行机制的典型硬件示例。现在已经有可编程 采用这种架构(如 的)。但是,并非所有算法都能使用这种并行机制。递归算法,如滤波、中的变长编码()、上下文自
5、适应变长编码(),以及中的上下文自适应二进制算术编码(),当映射到这些可编程时,均无法达到最优且效率不高。这是因为数据递归阻碍了的有效利用。作为取代方案,可在结构中有效地构建专用硬件计算复杂度。可编程受计,外,结构还可以具有多时钟域,从而允许选择性硬件模块根据各自的计算要求使用独立的时钟速度。理论上质量的最优性。当且仅当对复杂度没有限制时,任何基于速率失真曲线的理论最优解决方案均可实现。在可编程或通用处理器中,计算复杂度常受可用时钟周期的限制。而则相反,通过对硬件引擎的多重实例化,或提高结构中块和寄存器组的利用率,实行数据和算法并行机制,从而提供更高的灵活性。可编程或通用处理器通常受每个周期发
6、出的指令数、执行单元中的流水线级数以及完全馈给执,流的整个宏块级编码器。标准的主要优势在于能够通过以不同的方式和方向分析像素冗余,预测要编码的图像内容的值,而这种分析以前从未在其他标准中进行过。但与以前的标准相比,其复杂度和内存访问带宽增加了 倍。改进预测方法下面重点分析一下在视频编码设计中实现其增强编码效率的主要特点,根据前文讨论过的设计准则对这些功能模块进行四分之一像素精度()运动补偿。以前的标,算复杂度的限制,可通过处理器的,行单元所需最大数据宽度的限制。准采用二分之一像素运动向量精,时钟速率来度量。在 中实现的信号处理算法通常为计算密集型算法。其中的例子有运动估计中的绝对差值和()引擎
7、以及视频缩,在可编程中,受每个任务可用周期数的限制,视频质量常常大受影响。而在结构中,硬件资源则可得到完全分配(三步和完全,度。新设计通过采用四分之一像素运动向量精度对此进行了改善。分之一像素位置的预测值是通过沿横向和纵向采用一个一维 抽头,通过将这些模块映射到,搜索运动估计对比)。,滤波器,计算得到的。,中,主处理器或可编程 就可有额外的周期来处理其他算法。此,使用实现功能模块图为定义了主功能块和数据,四分之一像素位置的预测值是通过将全像素和二分之一像素位置,Electronic Design&Application World-Nikkei Electronics China,92,这,通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FPGA与H.264 AVC视频编码标准 FPGA 264 AVC 视频 编码 标准
链接地址:https://www.31ppt.com/p-2220316.html