基于PCI―E和GPU的一种高效SAR实时成像处理器

时间:2022-06-06 10:05:52

摘 要 基于PCI-E总线具有高带宽数据流传输能力、GPU具有高浮点计算性能和大存储器带宽等优势,本文设计了一种基于PCI-E和GPU的高效SAR实时成像处理器,并利用该成像器对CS成像算法进行了实时实现流程的简单分析概述。

【关键词】GPU 合成孔径 实时 PCI-E

1 引言

随着合成孔径雷达(SAR)应用的不断扩展,成像分辨率的进一步提高,其所需要处理的实时数据量和数据吞吐量成指数增长,传统SAR实时成像器的处理性能、数据传输能力均在不同程度上成为其应用扩展的瓶颈。为应对这些挑战,需要一种高效的SAR实时成像器来加快计算速度、提高传输带宽,以便满足其不断扩展应用的实时处理需求。

PCI-E(PCI Express)总线作为一种全新的串行技术,采用点对点技术、双通道串行传输模式、克服了PCI总线在系统带宽和传输速度相互制约的固有缺陷,可为系统内的所有设备分配独立的通道资源,充分保障设备的带宽资源,提高数据传输率,可以同时实现多个设备并行工作。

近年来GPU(Graphic Processing Unit)即图形处理器得到了快速的发展,其应用范围不在局限于计算机图形学本身,因其显示出强大的超多线程、并行计算能力,在通用计算领域得到了广泛的应用;通常GPU在处理能力和存储器带宽上相对中央处理器(CPU)或数字信号处理器(DSP)有明显优势,一般单精度浮点处理能力是同时期CPU或DSP的10倍左右,而其外部存储器带宽则是CPU或DSP的5倍左右,在达到相同浮点计算性能和存储器带宽的情况下,GPU比CPU或DSP耗费更少的资金和功耗。

基于PCI-E总线具有高带宽数据流传输能力、GPU具有高浮点计算性能和大存储器带宽等优势,下面设计了一种基于PCI-E和GPU的高效SAR实时成像处理器,并利用该成像器对CS成像算法进行了实时实现流程的简单分析概述。

2 SAR实时成像器的设计

基于PCI-E和GPU的一种高效SAR实时成像处理器,主要包括XMC接口板、数据采集缓存及分发控制板、实时成像GPU设备处理板、实时成像CPU主机处理板、VPX总线背板等。硬件设备主要连接及组成如图1所示,其中XMC接口板负责接收高速串行码流形式的原始数据、转换为低速并行码流、缓存并行码流数据、在通过PCI-E总线上传至数据采集缓存及分发控制板;数据采集缓存及分发控制板以响应中断、DMA方式获取数据,并缓存成像数据块,再利用PCI-E通道上传数据块给实时成像CPU主机处理板;实时成像CPU主机处理板和GPU设备处理板协同完成成像算法的实时实现,主要由CPU主机负责接收成像数据块、计算算法所需的有关参数、主存到显存的数据传输、成像结果的网络送出等,GPU负责主要完成算法实现的主要处理任务。

图2示意出了SAR实时成像器的相关功能模块和数据流走向过程。其中主要包括两大部分:

(1)雷达原始数据输入接口、缓存及转发部分。

(2)成像算法实时处理部分。

第一部分主要由XMC数据接口板、数据缓存及转发控制板来完成。其中XMC数据接口板以光纤为物理载体,通过光电收发器接回收雷达回波数据,接收到的光纤信号经过光电转换、电平转换后送给FPGA中的吉比特(RocketIO GTP)模块进行串转并,FPGA将收到的数据首先存入第一缓存,当第一缓存存储满数据后以中断的方式告诉CPU,CPU收到中断信号后,即刻以DMA(直接存储器存取)的方式将第一缓存中的数据搬入内存,与此同时,FPGA将收到的数据写入第二缓存,当第二缓存存满数据后再以中断的方式通知CPU,CPU收到中断信号,即刻以DMA方式将第二缓存中的数据搬入内存,与此同时,FPGA将收到的数据写入第一缓存;如此一直循环下去,即可以乒乓的方式使得FPGA在写入缓存的同时,CPU可以读缓存,实现了FPGA与CPU的并行工作。数据采集与转发控制板在成像相关命令的控制下,通过响应FPGA发送的中断,以DMA方式通过PCI-E交换模块交替搬取XMC数据接口板中第一缓存、第二缓存数据存入内存中;然后当主机内存数据达到一定要求的成像数据后,再通过PCI-E交换模块、VPX总线向相关实时处理板转发雷达原始成像数据。

第二部分主要由实时成像CPU主机处理板和实时成像GPU设备处理板来完成。其中首先实时成像CPU主机处理板通过PCI-E交换模块接收VPX总线上的雷达原始成像数据、实时估算成像算法所需的相关参数、将主存中有关需要计算的数据通过PCI-E传输数据给GPU设备处理板的显存;然后由实时成像GPU设备处理板完成相关成像算法的大部分并行处理任务;最后CPU主机处理板在等待GPU完成大量并行处理任务后,将成像结果数据从GPU显存中通过PCI-E取回到CPU内存中,并借助网络将成像结果上报。

3 CS成像算法的实时实现

CS成像算法的实时实现主要包括两大部分:(1)SAR原始数据的采集与缓存;(2)CS成像算法的实时实现。具体实时实现流程图如图3所示。

根据图3可知,SAR原始数据的采集与缓存过程大致为:首先数据接口子板在接收逻辑的控制下,利用光纤接口接收高速串行信号流数据、转为低速并行码流,并利用第一、二缓存交替缓存存储数据,满后在发送逻辑的控制下以中断方式通知数据采集缓存母板;然后数据采集缓存母板在收到中断信号后,即刻以DMA(直接存储器存取)的方式获取第一、二缓存中的数据,并在数据接收控制下交替存入内存1、内存2中,达到设定存储大小后,在数据发送控制下将数据通过PCI-E总线送出。

CS成像算法的实时实现是采用实时成像CPU主机处理板和GPU设备处理板相互协调共同进行的。具体实时实现流程根据图3可知大致可分为:第一步,CPU主机处理板以响应中断DMA方式获取原始成像数据;第二步,CPU主机处理板对其进行计算得到多普勒中心频率和调频率参数;第三步CPU主机处理板将原始成像数据和计算得到的参数通过PCI-E总线从主机内存搬入GPU设备显存中;第四步,利用GPU设备处理板支持的多线程处理技术对输入的原始数据进行CS算法实时成像处理,依次包括对相关成像数据块进行数据转置、方位向FFT、Chirp Scaling相位处理、数据转置、距离向FFT、距离压缩与相位补偿、距离向IFFT、方位压缩与剩余相位校正、数据转置、方位向IFFT、数据转置等处理;第五步,CPU主机处理板将成像结果数据通过PCI-E总线从GPU设备显存搬入CPU主机内存;第六步,CPU主机处理板通过网络将成像结果送出。

4 结束语

利用第三代具有高速串行点对点数据传输能力的PCI-E总线、面向通用计算具有高浮点运算性能的GPU处理器,设计了一种基于PCI-E和GPU的高效SAR实时成像处理器。通过利用该种新型SAR成像器评估常用成像算法对相关仿真及实测数据的成像处理结果,表明其非常适合用于大部分常用算法具有大数据块、高度并行化等特点的成像处理;通常其处理速度与传统SAR成像器相比,具有两位数以上倍数的提升。另外,与目前传统的SAR处理器相比,在提供同等的运算能力情况下,搭配的硬件板卡更少,进而成本更低,设计更简单、开发周期更短;这些都将为其在今后产品中的广泛应用将带来巨大的经济效益。

参考文献

[1]张舒,褚艳利,李开勇等.GPU高性能运算之CUDA[M].北京:中国水利水电出版社,2009:8-13.

[2]吴勇,宋红军,彭靳.基于时域去走动的SAR大斜视CS成像算法[J].电子与信息学报 2010 Vol.32(3):593-598.

[3]张天林,张思敏.CPCI-E与VPX总线标准的比较分析[J].工业控制计算机,2009,22(07):1-5.

作者简介

何锡君(1982-),男,硕士学位。现为南京电子技术研究所工程师。研究方向为雷达总体技术、实时信号处理研究。

徐学伟(1982-),男,硕士学位。现为南京电子技术研究所工程师。研究方向为高速信号采集及处理。

作者单位

南京电子技术研究所 江苏省南京市 210013

上一篇:PLC在立体车库控制系统中的应用 下一篇:电气自动化控制中的人工智能应用分析