稀疏表示算法在 GPU 的优化.doc
《稀疏表示算法在 GPU 的优化.doc》由会员分享,可在线阅读,更多相关《稀疏表示算法在 GPU 的优化.doc(6页珍藏版)》请在三一办公上搜索。
1、精品论文稀疏表示算法在 GPU 的优化赵广銮,张洪刚北京邮电大学信息与通信工程学院,北京 100876摘要: 介绍稀疏表示的背景、应用范围和 GPU 并行计算的发展。结合对当前稀疏表示的主流 算法分析,以及对 GPGPU 平台 CUDA 编程模型的理解,实现稀疏表示算法在并行性上的优 化处理,并通过实验与 CPU 上的稀疏表示算法进行对比探讨。 关键词:稀疏表示;图形处理器;统一计算设备架构中图分类号: TP391Optimization of Sparse RepresentationAlgorithm on GPUZHAO GuangLuan, ZHANG HongGangInformat
2、ion an Communication Engineering School, Beijing University of Posts andTelecommunications, Beijing 100876Abstract:Introduce the background of sparse representation, eld of application and the development of General-purpose computing on GPU. With the analysis to popular sparse representation algorit
3、hms and the comprehension of Compute Unied Device Architecture, an optimization of Sparse Representation is proposed. Furthermore, an experiment between a GPU implement and a CPU one will be held to nd out the performances of two platform. Key words: Sparse Representation;GPU;CUDA0 引言稀疏表示,又称为压缩感知1 ,
4、是近年来关于图像识别、计算机视觉、数值计算等领域的 研究热点。由于稀疏表示应用广泛,较难计算,因此不断有学者针对求解稀疏问题提出特定的 算法。尽管如此,现有算法没有充分考虑算法并行性问题,在并行环境中不能合理利用多计算 核心的资源。另一方面,在 CPU 多核化、服务器集群化的背景之下,并行计算领域越来越受到重视。 简单的单线程任务已经无法充分利用多核 CPU 带来的优势。如何尽可能利用多核 CPU、服 务器集群的性能,已成为软件工程师必须考虑的问题。多台机器协作运行,到一台多 CPU 机 器的运作,再到近年的多核 CPU,并行计算的应用已从军事、大型科学计算等领域逐渐走到 大众生活,大型科技公
5、司纷纷提出自己的并行框架,并行计算受到更多人的关注。作者简介: 赵广銮(1987-),男,硕士研究生,主要研究方向:图像识别、数值计算。E-mail: zhaoguangluan 通信作者:张洪刚(1974-),男,副教授,博士生导师,主要研究方向:图像处理与图像识别、视频检索与过滤以及计算机视觉。 E-mail: zhhg- 6 -1 稀疏表示稀疏表示 (Sparse Representation),又称为压缩感知 (Compressive Sensing),它意欲用尽 可能少的非 0 系数表示信号的主要信息,从而简化信号处理问题的求解过程。在信号处理方 面,稀疏表示的一个重要应用是压缩采样
6、。与传统的基于频域采样模型不同,稀疏表示的核心 思想是将共享各信号间的共性,然后用极少量信息(稀疏向量)表示他们的差异,理论上不再 受奈奎斯特准则限制。稀疏表示吸收了传统压缩理论的优点,然后克服其不足,现在逐渐成为 一个重要的基础研究领域。由于稀疏表示的本质是凸优化问题2 ,因此可以直接使用解决一般凸工具如内点法来解 决。但事实表明,由于稀疏问题的特殊性,普通的算法并不能高效地进行对其求解。因此,人 们针对和利用稀疏问题的特殊性,提出了许多特定的算法3 。这些算法能较有效率地解决稀疏 问题,也推动了稀疏表示在实际问题中的应用。1.1 稀疏表示求解形式稀疏表示的原始模型为:xmin |x|0 s
7、.t. Ax = b(1)其中 b Rn 为待处理信号,A Rnm 为基函数字典,x Rm 为稀疏表示求解结果,|x|0 0 为拉格朗日乘子。增广拉格朗日乘子法每次迭代都会减少 L (x, ),从而使得原问 题的目标值下降,得到的新的 xk 后可以更新乘子 k ,然后迭代求解 xk+1 和 k+1 ,最终 xk+1 将会收敛到原问题的最优解,迭代步数越多,则收敛精度越高。另外,ALM 问题还能求解稀疏表示的对偶问题:2 2min bT y xT (z AT y) +y,x,zz AT y2 s.t. z B1 (4)对于上述问题,可以使用下面的三步算法进行求解:1 k+1A kkz = P (
8、AT y + x /)yk+1 = (AAT )1 (Azk+1 (Axk b)/)xk+1 = xk (zk+1 AT yk+1 )(5)该算法又称为 DALM5 。对于 A Rnm ,DALM 在 n m 的情况比原 ALM 算法更有效率。2 GPU 并行计算图形处理器 (Graphics Processing Unit, GPU) 的起源来自于对分担计算机图形学任务的 要求。在大型 3D 渲染任务中,CPU 需要对计算机图形建模作大量相似性运算,这部分工作 会占用了 CPU 大量时间,而耽误了其他逻辑处理。GPU 的核心技术和硬件设计能迅速处理 图形方面的任务,如光线处理、纹理渲染和 3
9、D 建模等。有了 GPU 的出现,CPU 就能专心在 任务调度、逻辑处理等方面,而把图形处理与渲染任务交给了 GPU 实现。在现代三维技术迅 速发展的背景下,图形显卡和 GPU 也被日益重视,GPU 的发展速度在近几年甚至超越了半 导体的黄金定理摩尔定律。2.1 GPU 通用计算与 CPU 相比,GPU 有其独特的优点:核心数非常多,并行性高,基于流处理。而这些优 点也就是现代并行计算科学所需要的,因此使用 GPU 在并行计算是未来的一大发展方向。近 年来,随着 GPU 的发展和并行计算的普及,GPU 通用计算 (General-purpose computing on GPU, GPGPU)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 稀疏表示算法在 GPU 的优化 稀疏 表示 算法 优化

链接地址:https://www.31ppt.com/p-5197444.html