DSPFPGA折反射全景视频处理系统中双核高速数据通信H.pdf
《DSPFPGA折反射全景视频处理系统中双核高速数据通信H.pdf》由会员分享,可在线阅读,更多相关《DSPFPGA折反射全景视频处理系统中双核高速数据通信H.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 32 卷第 3 期 电 子 与 信 息 学 报 Vol.32No.3 2010 年 3 月 Journal of Electronics&Information Technology Mar.2010 DSP+FPGA 折反射全景视频处理系统中双核高速数据通信 李 乐 熊志辉 王 斌 张茂军 陈立栋(国防科学技术大学信息系统与管理学院 长沙 410073)摘 要:对于嵌入式折反射全景视频处理系统,由于计算量大,一般采用多处理器协同的结构,但在该结构下多个处理器之间需要进行高速的数据通信。该文提出一种基于 DSP+FPGA 架构的双核高速数据通信方法,该方法通过基于地址总线的控制指令编码解析
2、方法协同双核工作,通过逆向波形分析和基于乒乓缓存的间接 DMA 通信方式,实现 DSP 与 FPGA 之间的双核 DMA 数据通信。实验结果表明,使用上述方法实现的 DSP 与 FPGA 之间数据通信速度高达 585 MBps。关键词:数据通信;双核;全景;DMA;FPGA;DSP 中图分类号:TP274;TN919 文献标识码:A 文章编号:1009-5896(2010)03-0649-06 DOI:10.3724/SP.J.1146.2009.00329 High-Speed Data Communication Between DSP and FPGA in Embedded Panor
3、amic Video Processing System Li Le Xiong Zhi-hui Wang Bin Zhang Mao-jun Chen Li-dong(College of Information Systems and Management,National University of Defense Technology,Changsha 410073,China)Abstract:As the huge computational loads of panoramic video processing,most of the embedded panoramic vid
4、eo processing system are based on multi-cores.The problem of high-speed data communication between multi-cores must be solved.A high-speed data communication method between DSP and FPGA is proposed.In order to realize high-speed data communication,the address-bus is used to transport commands,the wa
5、ve of data communication between dual-cores in DMA mode is analyzed and simulated.The experiments show that the data transmission speed is up to 588 MBps between DSP and FPGA by using those methods.Key words:Data communication;Dual-cores;Panoramic;DMA;FPGA;DSP 1 引言 全景视频技术可以在任意时刻同时获取周围360观察方向上的场景,使得观
6、察者能够更快更准确地感知周围场景的变化,该技术可广泛应用于战场环境侦察、视频监控、机器人导航等领域1 4。在嵌入式系统上实现折反射全景成像处理获取全景视频,需要对折反射全向视频图像进行实时采集、预处理及柱面全景展开等,整个过程算法复杂、计算量大,一般的单核嵌入式视频处理系统难以达到实时处理的要求5,因此在实际应用中常采用多个嵌入式处理器协同的方法(例如 DSP+FPGA 协同)完成折反射全景成像处理。文献6采用 FPGA 和多个 DSP 互连的并行处理结构,实现了一个高速数据传输带宽、低延迟且计算性能强大的实时图像处理系统。文献7采用双 FPGA 加双 DSP 的结构,使 2009-03-13
7、 收到,2009-07-27 改回 国家自然科学基金项目(60773023,60705013),国家 863 计划项目(2009AA01Z328),中国博士后科学基金项目(20070410977)和湖南省自然科学基金项目(08JJ4018)资助课题 通信作者:李乐 用流水线的技术,设计了每秒可处理 50 帧分辨率为240320 的视频图像的嵌入式系统。但是,在这种多核协同的结构中,各个处理器芯片之间需要进行大数据量高速传输。以每秒采集处理 25 帧 400 万像素的折反射全向图为例,假设图像中每像素2个字节的YCbCr 4:2:2格式为例计算,则多核之间的数据传输速率约为 1.6 Gbps(即
8、 200 MBps)。若进一步要求每个芯片至多只能用 50%的时间用于数据传输,另外 50%的时间用于其他运算处理,这样,实际设计中要求多核之间的数据传输速度至少在 3.2 Gbps(即 400 MBps)以上。为了解决上述问题,本文提出一种 DSP+FPGA 协同处理结构中的双核间高速数据通信方法。在硬件上将 DSP 的 EMIF 接口与 FPGA 相连建立了双核高速数据传输通道;使用基于地址总线的控制指令编码解析的方法实现了双核之间控制指令的快速交互,有效协同了 FPGA 和 DSP 的工作;通过逆向波形分析的方法8分析研究 DSP 执行DMA 操作的时序,在 FPGA 上模拟 DMA 传
9、输模块,使用基于乒乓缓存机制的间接 DMA 通信方法9实现 DSP 和 FPGA 之间高速数据通信。实验结果650 电 子 与 信 息 学 报 第 32 卷 表明,DSP 与 FPGA 之间的双核数据传输速度最高可达 4.683 Gbps(即 585 MBps)。2 DSP+FPGA 双核全景视频处理系统结构 基于 DSP+FPGA 双核折反射全景视频处理系统的结构如图 1 所示,系统核心为 DSP 和 FPGA,并集成了感光 CMOS 图像采集设备、大容量的存储器(FLASH 和 SDRAM)、多个标准的外部接口(视频、网络和 ATA 接口)。其中,DSP 作为系统的主控芯片,控制整个系统的
10、运行。并根据 DSP 和FPGA 的特点,对系统任务进行了划分,平衡二者的任务负载。FPGA 负责折反射环状全向图像采集、预处理及展开运算,DSP 则负责柱面全景图的后期处理(视频压缩、目标检测等)、视频输出和存储等工作。该系统具体的工作流程如下:图 1 DSP+FPGA 双核全景视频处理系统(1)系统起始运行时,首先由 DSP 发起指令,通知 FPGA 控制 CMOS 图像采集设备采集一帧折反射环状全向视频;(2)FPGA 采集一帧原始的折反射环状全向视频并对其进行颜色空间转换等预处理操作,最后将结果存入外部 SDRAM;(3)FPGA 对该帧全向视频执行柱面展开运算,得到柱面全景图像;(4
11、)DSP 从 FPGA 读取展开的柱面全景图像,然后对其进行运动目标检测、图像压缩等后期处理;(5)通过外部的 ATA、网络和视频输出等接口对处理完的柱面全景视频数据进行存储和输出。3 DSP 与 FPGA 硬件互连 基于 FPGA+DSP 双核架构的折反射全景视频处理系统在运行过程中,DSP 和 FPGA 之间存在大量的高分辨率柱面全景视频数据需要传输。在双核之间建立一条高速、可靠的数据传输通道,实现对海量视频数据的实时传输,就成为影响整个系统性能的关键因素。通过研究 DSP 和 FPGA 芯片实现外部数据存储、传输常用的方法和特点,在设计基于 DSP+FPGA 的双核视频处理系统时,使用了
12、 DSP 的EMIF 接口与 FPGA 互连。EMIF 接口是 DSP 的外部存储器接口,通过对该接口寄存器进行设置,可以将其灵活配置成同步、异步等各种类型的高速数据接口,使用该接口,DSP 可以与外部据存储器实现每秒数百兆字节的数据传输速率;相应地,FPGA只需要根据 DSP EMIF 接口的工作时序,灵活地配置芯片内部资源和外部通用 IO,即可实现与 DSP EMIF 接口的无缝对接,在双核间建立高速数据传输通道。如图 2 所示,将 FPGA 的 IO 引脚分别与 DSP EMIF 接口的数据、地址、读/写控制、GPIO 等信号线相连,在双核之间构建了 64 位宽的数据总线、25 位宽的地
13、址总线、以及读/写、时钟、命令使能等信号用于双核数据通信。其中,通过数据总线、地址总线、命令使能信号实现了 DSP 和 FPGA 之间控制指令的交互,协同双核工作。使用 FPGA 内部的Block RAM模拟了2个数据缓存和1个状态寄存器,状态寄存器用于标识数据缓存和 SDRAM 存储器的状态,而数据缓存则作为视频数据从SDRAM 到 DSP 传输过程的中间缓存,它们采用乒乓机制轮流将全景视频数据从 SDRAM 送到 DSP,实现双核之间无缝的高速数据通信。并且,在 FPGA内部构建了一个主控逻辑,用于接收和解析 DSP 发送的地址、数据和控制指令,并根据接收的控制指令,控制数据缓存和 SDR
14、AM 等模块的工作,保证了 DSP 与 FPGA 高效协同工作,实现双核之间的高速数据通信。图 2 DSP 与 FPGA 互连结构图 4 DSP 与 FPGA 高速数据通信 根据上述的硬件电路设计方案,建立 DSP 与FPGA 数据通道,通过基于地址总线的控制指令编码解析方法实现双核之间控制指令交互,协调双核工作;通过 DMA 逆向波形分析在 DSP 与 FPGA之间模拟 DMA 传输,使用基于乒乓缓存机制的间接 DMA 通信等方法完成全景视频数据在 DSP 和FPGA 之间的高速传输。第 3 期 李 乐等:DSP+FPGA 折反射全景视频处理系统中双核高速数据通信 651 4.1 基于地址总
15、线的控制指令编码解析机制 基于 DSP 与 FPGA 架构的全景视频处理系统中,双核之间不仅要进行视频数据传输;同时,DSP作为主控芯片,还要控制和协调双核的工作,双核之间需要进行控制指令的交互,以保证整个视频处理系统正常、高效的运行。常用的控制指令传输方法是主控芯片通过一次写操作将控制指令写入外部芯片的指令寄存器,然后外部芯片读取指令寄存器并执行相关操作,最后再由主控芯片通过一次读操作读取返回结果或应答信息。使用该方法在 DSP 与FPGA 之间进行控制指令交互,每次都需要一读一写共两个周期。对于一些简单的控制指令,还可以进一步简化该过程,以减少控制指令传输时占用的双核通信时间,提高双核通信
16、效率。文中提出了基于 EMIF 接口异步通信模式下的使用地址总线进行控制指令交互的方法,将控制指令进行编码后通过地址总线进行传输,接收方 FPGA 根据地址总线的信号解析并执行控制指令,最后通过数据总线返回执行结果,这样每次只需要一个读周期就可以在DSP 与 FPGA 之间完成指令传输和结果返回整个过程。使用基于地址总线的控制指令编码解析的方法传输控制指令,通过 DSP EMIF 接口的信号,在DSP 和 FPGA 之间构建命令使能、地址总线和数据总线用于实现双核之间的控制指令交互。命令使能信号线为双核通信提供指令收发的使能信号,通过地址总线的不同编码组合表示 DSP 向 FPGA 发送的不同
17、指令,而数据总线则用于返回执行结果。为了完成 DSP 与 FPGA 之间控制指令交互,实现双核高效协同工作,控制指令交互过程如图 3所示。DSP 首先进行通信命令使能表示即将传输控制指令,通过地址总线向FPGA发出控制指令编码,FPGA 解析地址总线上的控制指令后立即执行相关操作,并将相关执行情况或结果通过数据总线返回给 DSP。具体过程如下:(1)指令使能:DSP 进行通信指令使能,通知 图 3 DSP 与 FPGA 控制指令交互过程执行序列图 FPGA 接收控制指令。(2)指令发送:DSP 通过 EMIF 接口向 FPGA发起一次“读”操作周期,并根据控制指令的内容进行编码给地址总线赋值。
18、(3)指令解析:FPGA 接收地址总线上的地址数据,并将其解析成相关的控制指令。(4)执行指令:FPGA 按照解析的控制指令执行相关操作。(5)结果返回:FPGA 将指令执行状态或者返回结果“赋值”给数据总线,DSP 采集数据总线的数据,得到 FPGA 对该控制指令的执行情况。对于简单的控制指令使用上述的方法在双核之间进行控制指令交互,而对于复杂的控制指令仍采用传统的写指令寄存器的方法传输控制指令,综合使用这两种指令交互方式,提高双核之间控制指令的传输效率,高效协同 DSP 和 FPGA 的工作。4.2 DSP 与 FPGA 高速 DMA 通信 4.2.1 DSP 与 FPGA 双核 DMA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DSPFPGA 反射 全景 视频 处理 系统 中双核 高速 数据通信
限制150内