基于流量特征的P2P流媒体流量识别的方法

时间:2022-09-03 05:13:22

基于流量特征的P2P流媒体流量识别的方法

摘 要 P2P网络的出现,给人们带来了很大的便利,它可以让用户直接通过计算机链接另一个用户的计算机,让文件的共享的交换变得更加方便。但是,P2P流量的剧增给运营商带来了很大的压力,因此必须要对P2P流量有所控制。而P2P流量识别技术在PSP流量控制中扮演了非常重要的角色,本文结合了P2P的概述介绍了基于流量特征的P2P流媒体流量识别的方法。

关键词 流量特征;点对点;流量识别

中图分类号 G2 文献标识码 A 文章编号 1674-6708(2015)133-0096-02

0 引言

在P2P网络出现之后,人们对网络有了一个新的认识:它可以让用户和另一个用户的计算机直接链接,让文件的共享以及交换变得更加的方便快捷,改变了传统浏览和下载文件的方式。不过,这种方式也导致了文件的下载量剧增,让网络的带宽被大量占用,占据了超过60%的网络流量,严重影响了其它网络应用的正常使用。虽然增加带宽可以在短时间内解决这个问题,但只是治标不治本,由于P2P网络的特性使得带宽的大量占用只是时间的问题。因此,仅仅通过增加带宽很难完全让网络的拥塞状况得到解决。这样,对于P2P流媒体流量的识别和控制方法就非常有必要了。

1 P2P概述

在国内,P2P技术也成为点对点技术,是一种分布式网络,网络参与者可以共享他们拥有的一部分硬件资源,如处理能力、网络连接能力以及存储能力等等,可以不通过中间实体,被其他对等节点直接进行访问,二这些共享资源的服务和内容则有网络来提供。在网络中,P2P服务并不依赖专用集中服务器,而是由网络中的参与者提供,他们既是资源的获取者,同时也是资源的提供者。在大多数情况下,这些服务资源主要有信息的交换、计算资源的共享以及存储资源的使用等等,让使用者可以更加方便的访问其他用户的资源。

P2P技术的文件共享拥有非常多的优点,例如快速高效、成本较低、网路连通性强大、存储资源共享以及信息沟通能力灵活等特点。同时,P2P数据流量的任意性也非常大,目前,在网络的总流量当中,P2P占据了超过60%,让运营商的压力剧增,同时也会导致网络资源的滥用以及带宽不合理等问题。对于互联网来说,最宝贵的资源就是带宽,而带宽是有限的,在这个前提下如何能够让带宽能够充分利用是最重要的。在P2P网络当中,并没有C/S模式下的服务器,不需要任何等待和中间的各种缓解,也不会因为服务器出现故障而导致整个P2P网络不可用的情况。因此也不会出现C/S模式下服务器造成的“效率瓶颈”,导致效率下降。

对于P2P流量来说,它的分布呈现出明显的不均衡性,也表现出上下行流量的对称性,这两个特点对于P2P流量的识别技术来说非常重要,能够有效区分P2P流量跟其他网络流量。

2 基于流量特征的P2P流媒体流量识别的

方法

在P2P技术带给人们方便的同时,也对一些企业的相关部门造成了很大影响,如运营商等。因此,适度对P2P流量进行控制是必要的,而要想有效地控制P2P流量,就必须要对P2P流量进行识别,只有正确识别出感兴趣的或者异常的P2P流量,才能够有效的监控并控制它们。由于P2P流量识别的重要性,让其成为了网络测量领域的研究热点。下面主要介绍了基于流量特征的P2P流媒体流量识别的方法。

每个节点既能够充当服务器,又可以用作客户端,是P2P系统的最大特点,这就让P2P应用跟其他网络应用如email、HTTP以及FTP等等在传输层的流量特征有很大的差别。在P2P流量识别技术当中,最重要的方法就是给予流量特征的P2P流量识别技术,它的主要原理就是对传输层的数据包进行分析,并结合了P2P系统的各种流量特征来对某个流进行全面的判断,二给予流量特征的P2P流量识别方法主要有以下几种,下面将会一一对其介绍。

1)节点角色分析技术。

角色分析技术的主要原理就是判断某一节点是否既能够充当服务器又能够用作客户端,如果统计得出的结果符合P2P系统的特点的话,则可以认为某个流是P2P流量。但这种方法也存在缺点,因为使用这种方法需要记录整个网络的连接状态,这样的话不仅浪费的时间多,存储和计算的开销也比较大。

2)网络直径分析技术。

除了节点角色分析技术之外,还可以使用网络直径分析技术来对P2P流量进行识别,主要原理是判断一个网络系统的直径是否大于了某个设定好的值,如果大于的话就可以认为该流量属于P2P流量。

3)TCP/UDP法。

TCP/UDP法的原理不同于节点角色分析技术以及网络直径分析技术,主要原理是利用P2P系统在多数情况下同时使用了TCP和UDP协议。在通常情况下,P2P系统在发送控制信息的时候采用了UDP协议,在对数据进行传输操作时则采用TCP协议,而其他的网络应用如Email和HTTP等很少同时使用这两种协议。通过这个方法,可以快速的判断是否有P2P网络流量存在,并进行进一步的操作。

这种方法的原来相比之前两种方法来说非常简单,在实时性方面也有很大的优势,但这种方法的缺点是需要一一记录所有流的信息,从而增加了系统的存储开销;仍然存在少量的非P2P同时使用了两种协议(如DNS),造成了这种方法存在着一定的误差;有些P2P应用直接使用TCP而不是UDP来发送控制信息,如果出现上述情况的话,这个方法就会失效。因此,TCP/UDP法最好结合其它方法来一起使用,提高准确率。

4)(IP,port)法。

在P2P系统当中,通常每个通信主机的端口号是各不相同的,因为每个节点为了能够有效和网络中的其他节点进行通信,需要采用广播自己的IP地址和端口号,而广播端口号的时候使用了随机端口技术。因此,端口号和主机IP地址两只之间的数目差就会变得很小,在大多数情况下可以认为两者是一样的。因此,只要对某个(IP,port)对所连接到的端口个数以及IP地址个数进行统计的话,如果两者相等就认为是P2P网络。

5)其他基于流量特征的P2P流媒体流量识别技术。

上面介绍了四种基于流量特征的P2P流媒体流量识别技术,分别在不同角度的流量特征对P2P流量进行了识别,但如果只通过一个特征去识别的话,其实P2P流量的特征并不是那么明显,同时阀值确定的人为因素和随机因素也比较大。因此,只使用一种方法来对P2P流量进行识别的准确率并不是很高,应该让多种方法科学地结合起来,利用多种流量特征来识别P2P流量,现在也有越来越多人开始研究这种综合性的方法。

3 结论

综上所述,由于P2P数据流量的任意性非常大,给运营商带来了很大的压力,因此对P2P流量进行必要的控制时必须的。而基于流量特征的P2P流媒体流量识别的方法主要有节点角色分析技术、网络直径分析技术、TCP/UDP法、(IP,port)法以及综合了不同角度流量特征的识别方法等,只有有效的识别P2P流量,才能够做好P2P流量的监控工作,并适当地对P2P流量进行

控制。

参考文献

[1]陆庆,周世杰,秦志光,等.对等网络流量检测技术[J].电子科技大学学报,2007(6).

[2]沈富可,常潘,任肖丽.基于BP神经网络的P2P流量识别研究[J].计算机应用,2007(S2).

上一篇:数字电视安全播出技术维护与管理 下一篇:电子书的全球化与本土化冲突