智能终端中热IP核的通信方法

时间:2022-08-25 02:48:07

智能终端中热IP核的通信方法

中图分类号:TN929.5 文献标志码:A 文章编号:1009-6868 (2014) 01-0059-04

Communication Method of Hot IP Cores in Smart Device

摘要:片上网络通信架构的改进,使热IP核连接多个路由器,并且原本与热IP核相连的一个路由器的通信量被分配到多个路由器上。基于改进的片上网络通信架构,又设计出新的路由器选择算法。在该算法中,可以根据热IP连接的路由器的当前状态选择数据通信的路由,这样使得热IP能够更加均匀地分配通信量,从而有效地提高了数据传输效率,降低数据传输延时。实验表明,新的算法能够有效减少传输延迟。

关键词: 热IP核;片上网络;路由选择

Abstract: In this paper, we describe improvements to the communication architecture of network-on-chip. Our proposed method involves connecting the hot IP core to more than one router. Traffic is distributed to routers that connect to the hot IP core. We also design a router-selection algorithm based on this improved communication architecture. A router is selected for communication according to the statuses of routers connecting to the hot IP core. This allows traffic be evenly distributed to routers. Our experimental results show that this method reduces transmission delay.

Key words: hot IP cores; network-on-chip; router selection

随着智能终端的不断发展,终端芯片上集成的IP核越来越多。大量的IP核集成到一个芯片上,导致其IP核所需要的通信带宽也越来越大。传统的设计方案中的片上系统(SoC)总线结构受到了严峻的挑战。文献[1]-[3]中介绍了一种新的片上通信结构——片上网络(NoC),它是将互联网的技术移植到片上系统中,数以百计的片上资源(IP核)则通过互连结构将它们连接起来,并同时将通信与计算分离。由于其较先进的通信模式,NoC互连结构已成为SoC中优选的片上通信结构。

NoC由控制数据传输的路由器和进行数据传输的管道构成。对于2D-Mesh NoC(如图1所示),可能会存在某个或者某几个路由器在通信的过程中承担了很重的任务,形成过热点。该问题会引起网络增加延时,甚至产生拥塞;并且造成片上的通信资源分布不平衡。所以在设计NoC的时候,需要尽可能地减少该问题的出现。

NoC中有两种情况可能产生过热点,第一种情况是数据在路由器之间通信时,可能会频繁使用某些路由器,导致这些路由器成为NoC中的过热点(如图1中H1),可以通过自适应路由算法减小这种情况出现[4-6]的频率;而另一种情况是,在终端芯片中会包含一些通信量比较大的IP核(热IP核),例如动态随机存取存储器(DRAM)控制器、浮点数运算单元等。由于其他的IP核对这些单元的需求较高,在通信过程中容易造成所连接的路由器传输数据过多,容易导致拥塞,从而降低NoC的通信性能[5],这些热IP核所连的路由器有可能形成过热点(如图1中的H2)。若在NoC中出现了过热点,不仅会造成NoC的网络延时急剧增大,还会导致系统资源的分配不均衡。为了解决该问题,文献[7]中阐述了一种方法,就是对通信量较大的、核的通信进行延迟,使得通信相对分散,从而减少对应的路由器某段时刻的工作任务,减少网络的拥塞。但是该方法没有减少路由器的通信量,同时造成通信延时增大。文献[8]中提出了一个新的NoC热IP核的通信架构方案,该方案能够有效地避免热IP核所连接路由器的通信流量过大的情况。但是该方案在热IP核的传输路由选择过程中,使用的是静态路由器选择。随着源IP核和目的IP核之间的通信量的增大,所选择的路由器仍然会出现拥塞,从而造成数据延时增大。

文章针对热IP核提出了一种新的路由选择方法。该方法在文献[8]的拓扑结构的基础上,利用动态的热IP核通信路由选择方案,进一步降低了热IP核通信所导致的路由延时。

1 NoC热IP核架构

在终端芯片中,所有任务之间的通信不可能是平均的。核与核之间通信时,热IP核所连接的路由器可能会成为NoC中的过热点。为了避免过热点的发生,可以在热IP核上添加多个路由器,让该核与其他核之间的通信分散在这些路由器上,以减少路由器的通信量,从而减少过热点形成的可能性,如图2所示。

在设计NoC时,可以为热IP核添加上多个路由器。由于IP核所连接的路由器数量可能是多个,因此在通信时必须确定源IP核和目的IP核通信时所用的路由器,即IP核发出数据之前必须判断出源路由器以及目的路由器[8]。

文章所提架构采用的是2D拓扑结构(如图2所示),因此使用二维坐标对网络中的路由器进行统一的编址(左上角为坐标原点,水平向右为X轴正向,垂直向下为Y轴正向)。

2 传输路由器的确定方法

为了能够尽可能地减小NoC中的通信延时,源IP核必须确定与目的IP核通信相对的一对路由器,因此在IP核发出数据之前必须选择通信的源路由器和目的路由器。传输时的路由器由源IP核所连接的路由器在传输时的实际状况决定。为了能使动态的热IP核所连接的路由器通信量相对平均,我们采用动态的调控机制对这些路由器进行控制。如果某个路由器的通信率大于某个定值x(该值是由设计者根据网络的传输要求设定的经验值,文中所提方法中设定为0.7),则转发的数据包不经过该路由器,否则将按照最短路径原则进行路由器选择。路由器通信率是指某个IP核通过该路由器转发和接收的包数和该IP核转发和接收的总包数的比值,即:

通信率=该路由器转发和接收的数据包数目/该IP核上转发和接收的数据包总数目

在通信过程中,如果源IP核是通信量大的核,那么发包时IP核就要选择从与之相连的路由器上发出数据包。首先我们需要比较这些相连路由器的通信率,选出通信率小于x的路由器;然后通过比较这些路由器与目的节点的曼哈顿距离,得出距离最短的路由器既是所需要选择的路由器。如果IP核不是通信量大的核,数据包则会直接从相连接的路由器发出。如果发送的数据包是发往连有多个路由器的IP核,那么则需要比较源IP核所对应的路由器与连接目的核的路由器的曼哈顿距离,距离最小的路由器就是所要选择的路由器;如果数据包发送给连有一个路由器的核,就直接发送数据包给连接目的核的路由器。算法描述如下:

(1)初始化addr_s,addr_d为Null;初始化distance为n+m -1。(addr_s存放的是源路由器地址,addr_d存放的是目的路由器地址,distance存放的是最小曼哈顿距离,n和m分别为mesh网络的行数和列数);

(2)将目的IP核所对应的所有路由器地址放入link_d中;

(3)如果源节点不是通信量大的IP核,就直接将所连接的路由器的地址放入link_s;否则,检查每个路由器的通信率确认是否大于x,如果不是,将该路由器的地址放入link_s中;

(4)如果link_d为空,则转为(7);否则,就从link_d中选择一个地址,并将该地址从link_d中删除;

(5)使用选择的地址和link_s中的每个地址分别计算出曼哈顿距离,比较这些距离,选择出最小的曼哈顿距离;

(6)比较所选择的曼哈顿距离与distance的大小,如果所选择的曼哈顿距离小于distance,将该距离赋值给distance,并从link_d中选择的地址赋值给addr_d,并将计算曼哈顿距离所对应的link_s中的地址赋值给addr_s,后转到(4);如果所选择的曼哈顿距离大于或等于distance,则直接转到(4);

(7)将addr_s中的路由器地址设置为源路由器地址,addr_d中的地址设置为目的路由器地址,结束程序。

通过该方法选择出的源路由器和目的路由器在通信时可以更好地平衡网络的通信流量,在通信量较大的IP核之间通信时能够获得更小的通信延时。

3 仿真实验

3.1 实验模型

本实验使用OPNET编制的NoC仿真平台[9-10],并基于4x4 2-D Mesh结构进行仿真实验。在实验中,我们通过评估上述的算法和传统结构下XY路由算法的时延和路由的最大交换数,比较算法的优劣。为了能够模拟出通信规模大的IP核,其他IP核会增大与这些IP核通信的概率。在本实验中,我们设置了两个通信规模较大的IP核,以此实现过热点,并且分别做了其他IP核和这两个IP核的通信概率分别为5%、10%、15%、20%、30%、40%的实验,因此实验时包含了16个路由器和13个IP核,实验时所采用的拓扑结构如图2中改造后的架构。

除了这个特殊的通信之外,我们采用的是转置模式的通信,也就是(i,j)节点的数据发送给(4-i-1,4-j-1)[4]。该实验所选用的路由算法为XY路由算法。

其中,数据包的延时指的是数据包进入网络,直到数据包尾部离开网络的这段时间差。网络中数据包的延时主要由3部分组成:

Pdelay = Tdelay + Bdelay + Ldelay

其中,Tdelay表示数据包的传输延时;Bdelay表示路由内部队列的缓冲延时;Ldelay表示链路的传播延时。由于相对于传输延时和缓冲延时,链路传播延时要小的多,所以在仿真中我们忽略链路传播延时,即设Ldelay = 0。

平均延时指的是将所得到的各个数据包的延时累加并取平均值:

Latency = pk_num ∑ i =1 Pdelay/ pk_num

其中pk_num定义为接收到的数据包个数。

3.2 实验结果

文中所提出的两种NoC结构和传统的2D-Mesh Noc结构的数据传输延时比较如图3-7所示。图3-7中的概率为热IP核与其他IP核的通信概率,传统Mesh结构表示的是传统Mesh结构下的XY路由方法,静态选择方法为文献[8]中的方案,动态选择方法为本文提出的方案。

由图3-7可以看出,在热IP核与其他IP核的通信概率为5%时,3种方案的延时近似相等。当此概率超过5%时,传统的Mesh结构NoC的通信延时要大于剩余两种方案的延时,并且随着概率的增大,通信延时也增大。这是因为在IP核通信时,热IP核的路由器所承担的通信量随着概率的增大而增多。文章所提出的通信选择方案与静态路由选择方案在概率为5%、10%及15%时延时基本上相同。因此热IP核采用这两种方法时,弱化效果基本上相同。但随着热IP核通信量的增多,通信路由器的动态选择方法比静态选择方法更具优势。这是因为与静态选择方法相比,动态选择方法能够更好地调节通信流量,并且使得网络的流量分布更加均衡。

因此,文章所提出的热IP核通信方法具有更低的传输延时,能够提高NoC的通信性能。

4 结束语

智能终端的飞速发展,导致终端的功能越来越复杂,其芯片集成的IP核越来越多。基于总线架构的SoC设计在IP核间的通信延时较大,此时新兴的NoC架构体现出了其IP核之间通信的优越性。文章提出了一种NoC中热IP核的路由器传输选择方法,通过这种方法可以使得数据在网络中的传输延时减小,并且还能防止拥塞的出现。

参考文献

[1] L. Benini and G. D. Micheli. Networks on chips: a new soc paradigm [J]. IEEE Computer. 2002, 35(1): 70-78.

[2] W. J. Daly and B. Towles. Route Packets, Not Wires: On-Chip Interconnection Networks [C]// Proceeding of Design Automation Conference, 18-22 June, 2001, Las Vegas, NV. USA: IEEE, 2001:684-689.

[3] M. Daneshtalab, A. Sobhani, A. Afzali-Kusha, et al. NoC Hot Spot minimization Using AntNet Dynamic Routing Algorithm [C]// Proceedings of 17th ASAP, 11-13 September, 2006, Steamboat Springs, Colorado, USA. USE: IEEE Press, 2006:33-38.

[4] G. Chiu. The Odd-Even Turn Model for Adaptive Routing. [J]. IEEE Transaction on Parallel and Distributed System, 11(7), 2000: 729-738.

[5] A. Sobhani, M. Daneshtalab, A. Afzali-Kusha, et al. Dynamic Routing Algorithm for Avoiding HotSpots in On-chip Networks [C]// Proceedings of DTIS, 2007,Tunis,USA.USA: IEEE Press, 2006:179-183.

[6] P. Lotfi-Kamran, M. Daneshtalab, Z. Navabi, et al. BARP- A Dynamic Routing Protocol for Balanced Distribution of Traffic in NoCs to Avoid Congestion [C]// Proceedings of 11th DATE Mar 2008, Germany.USA: IEEE, 2008:1408-1413.

[7] Isask'har Walter, Israel Cidon, Ran Ginosar, et al. Access Regulation to Hot-Modules in Wormhole NoCs [C]// First International Symposium on Networks-on-Chip(NOCS 2007), Washington DC, USA, 7-9 May, 2007. USA: IEEE, 2007:137-148.

[8] 欧阳一鸣,郭凯,梁华国.片上网络通信中过热点的弱化方法[J].电子测量与仪器学报,23(8),2009:99-104.

[9] OPNET Modeler[EB/OL].[2012-03-18].http:///products-solutions/products/application-performance-management/

[10] N.Wu, F.Ge, Q.Wang. Simulation and performance analysis of network on chip architectures using OPNET [C]//ASIC, 2007. ASICON '07,GuiLin, China, Oct. 2007. USA: IEEE,2007: 1285-1288.

作者简介

周本文,中国科技大学硕士毕业;现就职于中国移动通信集团安徽有限公司任高级开发工程师;从事移动互联网应用研究与开发,负责移动互联网客户端应用研究工作;获国家发明专利2项。

郭凯,合肥工业大学硕士毕业;现就职于中国移动通信集团安徽有限公司任开发工程师;从事移动互联网应用的研发,负责移动客户端的研发工作;已4篇。

上一篇:智能无线电技术(1) 下一篇:70岁的婆婆学炒股