实对称矩阵特征值分解高速并行算法的fpga实现37904.pdf
《实对称矩阵特征值分解高速并行算法的fpga实现37904.pdf》由会员分享,可在线阅读,更多相关《实对称矩阵特征值分解高速并行算法的fpga实现37904.pdf(1页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实对称矩阵特征值分解高速并行算法的 fpga 实现 高速并行算法在计算机视觉中有着重要作用,不仅可提高运算速度,而且可以节省计算资源。随着硬件技术的发展,fpga 的优势在数值运算领域也越来越明显。本文研究fpga 实现对称矩阵特征值分解高速并行算法。本文根据传统的特征值分解算法构造特征值分解算法流水线,利用 fpga 模块化结构实现模块的单周期执行,实现对称矩阵特征值分解高速并行算法。首先,给出算法原理和流程:(1)特征值分解算法以矩阵 A 的 n 阶为输入,求解矩阵 A 的 n 个主特征值和对应的特征向量。(2)算法在单指令多数据模式下并行执行,把工作分解入多个分组,在每个分组内并行计算,
2、每次迭代依次更新下阶段分组所需要的数据,从而充分利用多核计算资源。(3)算法利用 fpga 的优势,针对每一阶分组构造一个模块,实现模块的单周期执行,以实现高速并行的特征值分解算法。其次,算法的逻辑设计和实现,主要有以下几步:(1)设计特征值分解模块的框架,完成模块的调用连接方式。(2)根据特征值分解算法构造特征值分解算法流水线,根据不同的阶数应用相应的指令,实现特征值分解模块,形成模块化结构。(3)将计算模块输出的结果和输入线、控制线以及控制信号联系起来,以实现算法流水线控制。(4)实现计算结果存储方式,支持特征值和特征向量的对称矩阵特征值置换保存。(5)根据需要的高性能运算,设计适当的特性模块,针对特征值分解算法构造 fpga实现模块。最后,将特征值分解算法集成于定制的 fpga 硬件设备中,最终实现 fpga 实现对称矩阵特征值分解算法,提高算法的计算速度,节省能源。以上就是 fpga 实现对称矩阵特征值分解高速并行算法,结合 fpga 最大限度发挥多核计算资源,通过模块化结构实现单周期执行,从而达到高速并行算法、节省能源的目的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对称 矩阵 特征值 分解 高速 并行 算法 fpga 实现 37904
限制150内