P2P应用研究与展望

时间:2022-10-08 09:09:47

P2P应用研究与展望

P2P广阔的应用前景吸引了很多公司前来“淘金”,但标准和安全的滞后影响到了其发展。 而P2P发展的最终方向是要实现网间资源的整合,资源互通,搜索共享。

标准与应用研究现状

近年来,随着Napster、KaZaa、BT、eMule这样的基于P2P技术的文件共享软件在Internet上迅速传播,P2P技术在国际国内都引发了研究的新热潮。国外开展P2P研究的学术团体主要包括P2P工作组(P2PWG) 、全球网格论坛(GGF)以及各高校的研究小组。P2P工作组成立的主要目的是希望加速P2P计算基础设施的建立和相应的标准化工作。P2PWG成立之后,对P2P计算中的术语进行了统一,也形成了相关的草案,但是在标准化方面工作进展缓慢。目前P2PWG已经和GGF合并,由该论坛管理P2P计算相关的工作。GGF负责网格计算和P2P计算等相关的标准化工作。

从国外公司对P2P计算的支持力度来看,Microsoft公司、Sun公司和Intel公司投入较大。Microsoft公司成立了Pastry项目组,主要负责P2P计算技术的研究工作,目前开发了基于Pastry的多种应用,包括SCRIBE、PAST、SQUIRREL等。在新一代的Windows Vista操作系统中,也增加了最新的P2P研究成果来支持协同工作。2000年8月,Intel公司宣布成立P2P工作组,正式开展P2P的研究。工作组成立以后,积极与应用开发商合作,开发P2P应用平台。2002年Intel了. Net基础架构之上的Accelerator Kit (P2P加速工具包) 和P2P安全API软件包,从而使得微软. Net开发人员能够迅速地建立P2P安全Web应用程序。IBM公司也开展了基于P2P技术的研究,提出了Smart Networking,另外IBM公司大力支持的网格计算(Grid Computing)与P2P计算在许多方面的研究类似。

Sun公司以Java技术为背景,开展了JXTA项目。JXTA是基于Java的开源P2P平台,任何个人和组织均可以加入该项目。因此,该项目不仅吸引了大批P2P研究人员和开发人员,而且已经了基于JXTA的即时聊天软件包和搜索引擎。JXTA定义了一组核心业务,包括认证、资源发现和管理。在安全方面,JXTA加入了加密软件包,允许使用该加密包进行数据加密,从而保证消息的隐私、可认证性和完整性。在JXTA核心之上,还定义了包括内容管理、信息搜索以及服务管理在内的各种其他可选JXTA服务。在核心服务和可选服务基础上,用户可以开发各种JXTA平台上的P2P应用。

主要应用领域

从目前情况看,P2P实际的应用研究主要体现在以下几个方面。

P2P分布式存储系统

P2P分布式存储系统(文件共享与下载)是一个用于对等网络的数据存储系统,它可以提供高效率的、鲁棒的和负载平衡的文件存取功能。对于存储系统,用户关心数据的定位、搜索以及路由的效率,安全性也是重要的因素。集中方式在很多情况下不再适用这种大规模数据存储的要求,这就需要一个新的体系来管理系统中的数据。P2P分布式存储系统就是解决这样的问题。这些研究包括全分布式存储系统: 如Oceanstore、Past和FreeHaven等。其中,基于超级结点结构的半分布式P2P应用如KaZaa、Edonkey、Morpheus、Bit Torrent等也属于P2P共享存储的范畴,并且用户数量急剧增加。Oceanstore和Past都提供了一种有效的广域网存储模型。它们的底层都建立了一个代价上限为logN的路由策略。 Past则是面向一个相对简单而紧凑的概念,它采用Pastry提供的路由机制,试图利用网络中闲置的存储节点建立一个更为完善的存储语义。FreeHaven则建立了一个详细的匿名体系,用来防止潜在的恶意攻击。

图1 单源的P2P流媒体传输

P2P计算能力的共享

加入对等网络的结点除了可以共享存储能力之外,还可以共享CPU处理能力。目前已经有了一些基于对等网络的计算能力共享系统,比如SETI@home。SETI@home是由加州伯克利大学开展的寻找外星生命的研究计划。它使用P2P技术串联所有参与研究计划的闲置计算机来执行复杂的运算,用来分析行星的无线电信号,寻找宇宙可能存在其他外星文明的证据,这些电脑每天平均发挥的效能超过了全球造价最高,运算最快的超级电脑。这种计算能力共享系统还可以用于进行基因数据库检索和密码破解等需要大规模计算能力的应用。

P2P协同工作环境

协同工作是指多用户之间利用网络中的协同计算平台互相协同来共同完成计算任务,共享信息资源等。通过采用P2P技术,个人和组织可以随时采用多种方式建立在线、非在线的协同应用环境。协同应用一般包括: 实时通信、聊天室、文件共享、语音通信等基本功能,除了这些基本功能,用户之间还可以共享白板、协同写作、视频会议等。另外,协同有时候还包括工程人员的协作开发软件。例如,JBuilder2006 Java集成开发环境就增加了P2P协同开发的属性。采用P2P技术使协同工作不再需要中心服务器,参与协同工作的计算机可以点对点建立连接。Groove就是基于P2P的协同软件平台,已经被微软公司收购。

图2 多源的P2P流媒体传输

P2P应用层组播

组播技术(Multicast)是一种针对多点传输和多方协作应用的组通信模型,有高效的数据传输效率,是下一代Internet应用的重要支撑技术。早期的组播技术研究试图在IP层提供组播通信功能,但IP组播的实施涉及到对现有网络基础设施的调整,因此大规模应用受到限制。随着P2P研究的兴起,基于应用层的组播技术逐渐受到广泛关注。应用层组播协议将组成员节点自组织成重叠网络(Overlay network),在主机节点实现组播功能,为数据多点并发传输提供服务。应用层组播是在应用层实现组播功能而不需要网络层的支持,这样就可以避免出现由于网络层迟迟不能部署对组播的支持而使组播应用难以进行的情况。当然,应用层组播也有许多局限: 一是端系统对IP网络的了解有限,节点参与组网时,只能通过探测获得一些网络性能参数,选取的逻辑链路难以优化; 二是主机不了解IP网络的拓扑结构,只能通过带宽和时延等外在的特性参数,以启发式的方式建立重叠网络,逻辑链路不能较好地利用质量较好的底层网络资源,重叠网络的多条链路可能经过同一条物理链路。

Internet间接访问基础结构

为了使Internet更好地支持组播、单播和移动等特性,Internet间接访问基础结构提出了基于汇聚点的通信抽象。在这一结构中,并不把分组直接发向目的结点,而是给每个分组分配一个标识符,而目的结点则根据标识符接收相应的分组。标识符实际上表示的是信息的汇聚点。目的结点把自己想接收的分组标识符预先通过一个触发器告诉汇聚点,当汇聚点收到分组时,将会根据触发器把分组转发该相应的目的结点。Internet间接访问基础结构实际上在Internet上构成了一个重叠网络,它需要对等网络的路由系统对它提供相应的支持。

P2P流媒体技术

传统的分布式多媒体系统一般是基于客户/服务器模式,服务器以单播的方式和每个用户建立连接,由于流媒体服务具有高宽带、持续时间长等特点,随着用户数量的增加,服务器的带宽很快被消耗完,所以以前的网络电视经常出现断断续续,需要不断地进行数据缓冲。为了解决系统的可扩展性,许多研究提出了相应的解决办法,例如IP组播技术来实现Internet上高效的一对多的通信,提高了系统的可扩展性。然而由于IP组播存在种种限制,如很难实现可靠性组播和拥塞控制等,IP组播技术并没有得到广泛的应用。由于P2P网络本身的可扩展性,基于P2P方式的流媒体技术很好地解决了传统流媒体带宽不足的问题。单源的P2P流媒体系统建立在应用层组播技术的基础之上(如图1所示),由一个发送者向多个接收者发送数据,接收者有且只有一个数据源。服务器和所有客户节点组织成组播树,组播树的中间节点接受来自父节点组播的媒体数据,同时将数据以组播的方式传送给子节点。而多源的P2P流媒体传输系统(如图2所示),则是由多个发送者以单播的方式同时向一个接收者发送媒体数据。

P2P搜索技术

P2P搜索技术使用户能够深度搜索文档。而且这种搜索无需通过Web服务器,也可以不受信息文档格式和宿主设备的限制,可达到传统目录式搜索引擎无可比拟的深度。目前,集中式搜索引擎Google、雅虎、百度是人们在网络中检索信息资源的主要工具,但这种集中式的搜索引擎远远无法涵盖所有互联网内的共享内容,而P2P搜索技术正好是这种集中式检索的一种良性互补。

简单描述一下这个过程: 每个节点在加入网络的时候,会对存储在本节点上的内容进行索引,以满足本地内容检索的目的。然后按某种预定的规则选择一些节点作为自己的邻居,加入到P2P网络当中去。发起者P提出检索请求Q,并将Q发送给自己的邻居,P的邻居收到Q后,检查本身是否存在查询的信息,如果不存在,转发查询,直到返回结果(如图3所示)。

图3 P2P搜索流程

面临的问题

知识产权保护

在P2P共享网络中普遍存在着知识产权保护问题。尽管目前Gnutella、KaZaa等P2P共享软件宣传其骨干服务器上并没有存储任何涉及产权保护内容的备份,而仅仅是保存了各个内容在互联网上的存储索引。但毫无疑问的是,P2P共享软件的繁荣加速了盗版媒体的分发,提高了知识产权保护的难点。美国唱片工业协会RIAA与这些共享软件公司展开了漫长的官司拉锯战,著名的Napster便是这场战争的第一个牺牲者。另一个涉及面很广的战场则是RIAA和使用P2P来交换正版音乐的平民。从2004年1月至今RIAA已提交了1000份有关方面的诉讼。尽管如此,至今每个月仍然有超过1.5亿首歌曲在网络上被自由下载。后Napster时代的P2P共享软件较Napster更具有分散性,也更加难以控制。即使P2P共享软件的运营公司被判违法而关闭,整个网络仍然会存活,至少会正常工作一段时间。

另一方面,Napster以后的P2P共享软件也在迫切寻找一个和媒体厂商的共生互利之道。如何更加合法合理地应用这些共享软件是一个崭新的命题。毕竟P2P除了共享盗版软件,还可以共享相当多有益的信息。

网络社会与自然社会一样,其自身具有一种自发地在无序和有序之间寻找平衡的趋势。P2P技术为网络信息共享带来了革命性的改进,而这种改进如果想要持续长期地为广大用户带来好处,必须以不损害内容提供商的基本利益为前提。这就要求在不影响现有P2P共享软件性能的前提下,一定程度上实现知识产权保护机制。目前,已经有些P2P厂商和其他公司一起在研究这样的问题。这也许将是下一代P2P共享软件面临的挑战性技术问题之一。

网络病毒传播

随着计算机网络应用的深入发展,计算机病毒对信息安全的威胁日益增加。特别是在P2P环境下,方便的共享和快速的选路机制,为某些网络病毒提供了更好的入侵机会。

由于P2P网络中逻辑相邻的节点地理位置可能相隔很远,而参与P2P网络的节点数量又非常大,因此通过P2P系统传播的病毒,波及范围大,覆盖面广,从而造成的损失会很大。

在P2P网络中,每个节点防御病毒的能力是不同的。只要有一个节点感染病毒,就可以通过内部共享和通信机制将病毒扩散到附近的邻居节点。在短时间内可以造成网络拥塞甚至瘫痪,共享信息丢失,机密信息失窃,甚至通过网络病毒可以完全控制整个网络。

一个突出的例子就是2003年通过即时通信软件传播病毒的案例显著增多。包括Symantec公司和McAfee公司的高层技术主管都预测即时通信软件将会成为网络病毒传播和黑客攻击的主要载体之一。

随着P2P技术的发展,将来会出现各种专门针对P2P系统的网络病毒。利用系统漏洞,达到迅速破坏、瓦解、控制系统的目的。因此,网络病毒的潜在危机对P2P系统安全性和健壮性提出了更高的要求,迫切需要建立一套完整、高效、安全的防毒体系。

网络带宽问题

P2P文件共享和下载给用户带来了很大便利。然而,随着它的大面积流行,P2P下载流量占用带宽接入的大量资源,被许多ISP视为洪水猛兽。据统计,在一些地方,Internet超过70%以上的流量被P2P相关应用占据,很多公司和学校不得不封杀P2P端口来阻止这种视频、音频文件传输。这样的下载流量在有时会影响某些用户正常使用Web、Email以及视频点播等业务。

安全问题

P2P网络系统的开发,除了涉及传统的安全性领域,如身份识别认证、授权、数据完整性、保密性和不可否认性,还有一系列安全管理问题比较突出:

1. P2P网络没有中心服务器,信息完全共享,这给了使用者很大的自由,但是这也使其陷入“无政府主义”的困境。、暴力影片在这些系统中随处可见,获取完全免费,这样对青少年成长会造成负面影响。

2. 由于P2P系统的复制传播迅速,一些机密文件一旦丢失,在P2P系统只要有一份拷贝,就有可能迅速扩张,造成大面积的影响。

3. 间谍软件已经成为P2P软件的硬伤。例如,P2P软件KaZaa在大面积流行的时候,里面出现了大量的间谍软件,CA公司称: KaZaa 是互联网最具威胁的间谍件。许多使用P2P网络下载的用户被植入间谍软件。

发展展望

在P2P文件共享领域,技术已经比较成熟,一些软件如eMule、BT、KaZaa、POCO分别培养了自己的用户群。但是,由于基于不同协议的P2P系统资源并不共享,相互隔绝,而且目前这一类型软件正处在自由竞争阶段,进入市场的企业无论是规模还是实力都不相上下。要想在竞争中取胜,下面这些内容必须考虑: 怎么样激励用户提供资源?怎么样保障网络里资源高速稳定的下载速度?怎么样去除间谍软件和病毒在系统中的传播?除了这些,还有人气的较量,服务质量的较量,收费与免费的较量。最终的方向是实现P2P网间资源的整合,资源互通,搜索共享。

在P2P协同计算方面,国内企业起步较晚。相关产品还不是很多,而国外诸如Groove在这方面已经作了大量的工作,开发了相对成熟的产品。随着协同计算概念的兴起,这方面软件的需求呈现急剧增长的趋势,应该是一片广阔的蓝海。而且,这类软件往往是面向企业和政府用户,所以相对于免费的P2P文件共享软件来说,有更好的盈利空间。

在P2P流媒体技术方面,由于目前流媒体传输的研究才刚起步不久,还有许多问题需要解决。由于P2P流媒体系统中节点的行为具有Ad-Hoc性质,如何在动态的系统环境下保证流媒体的服务质量,需要结合流媒体对QoS的要求和网络流量分析等方面的知识,研究高效率、低代价的QoS保障机制。可研究的方向包括: 服务节点的选择、节点失效时如何保证流媒体服务的连续以及对多个发送端的传输调度等。

基于P2P技术的VoIP产品Skype的巨大成功给P2P开辟了又一个新的领域。相关专家认为,VoIP的发展目前应该有两条路,一种是传统电信运营商的路线,即在可管理的IP网上建立IMS平台发展 VoIP话音业务。这种网络是封闭的,可管理的。另外一种是基于现有互联网公众公共P2P VoIP网络。它的特点是开放的,任何人可以自由加入和离开网络,具有分布管理和增长能力,任何设备只要支持标准协议都可以使用。传统电信运营商的利益需求和广大用户的需求成为一个矛盾,但是市场的需求和VoIP 的发展趋势是不可改变的。将来具体采用哪条路还不确定,还要看发展和竞争情况。或许会有很多的企业大客户、政府机构对稳定性、安全性等有特殊的要求,会采用电信运营商建立的VoIP业务,但对广大普通用户来说,基于公共互联网的P2P VoIP网络将是大势所趋。

P2P技术正处在发展的春天,基于这项技术的杀手级应用将不断涌现,这些技术将极大地改善整个IT世界的面貌,可以说是互联网技术又一次新的革命。

链接一:国内学术机构研发的产品

Maze

Maze 是北京大学网络实验室开发的一个中心控制与对等连接相融合的对等计算文件共享系统,在结构上类似Napster,对等计算搜索方法类似于Gnutella。每个节点可以将自己的一个或多个目录下的文件共享给系统的其他成员,也可以分享其他成员的资源。Maze支持基于关键字的资源检索,也可以通过好友关系直接获得(maze.省略/)

Granary

Granary是清华大学自主开发的P2P存储服务系统。所谓P2P存储服务系统是指存储服务的提供者在Internet中部署一定数量的存储服务器,为用户提供数据存储服务,确保数据的可靠性、可用性、安全性和访问效率; 存储服务的使用者按照所存储数据的容量和质量付费。它以“对象”格式存储数据并且支持属性级的数据查询(hpc.cs.tsinghua.省略/granary/)。

AnySee

AnySee是华中科大设计研发的视频直播系统。它采用了一对多的服务模式,支持部分NAT和防火墙的穿越,提高了视频直播系统的可扩展性; 同时,它利用近播原则、分域调度的思想,使用Landmark路标算法直接建树的方式构建应用层上的组播树,克服了ESM等一对多模式系统由联接图的构造和维护带来的负载影响。

WonGoo

WonGoo是中科院计算所研制的一套P2P技术平台,该平台主要为信息安全、网格计算提供支撑技术和试验环境,同时WonGoo的基础部件将在开发完善之后以开放源代码的方式向社会公开。

WonGoo主要包括两个方面的特色功能: 具有强匿名性的P2P通讯(WonGoo-Link),基于内容查找的P2P资源共享(WonGoo-Search)。可以在这两个功能的基础上搭建各种特色化的P2P应用,目前相关的应用还没有具体实现。WonGoo-Link与WonGoo-Search可以分别独立构造并搭建各自的应用。同时,WonGoo-Search底层通信也可以采用WonGoo-Link协议来实现更安全的应用。

基于IPV6的P2P内容存取应用系统

这是北京大学、清华大学、上海交通大学、浙江大学、华中科技大学、华南理工大学、北京世纪鼎点软件有限公司共同承担的国家CNGI项目的一部分。它主要研究基于智能节点弹性重叠网络技术的内容存取应用中间件系统,在 CNGI 上建设可管理、可控制和可运营的智能节点弹性重叠网络,开发内容存取类应用(p2p.省略/)

链接二:国内企业研发的产品

国内企业在P2P的应用领域研究一直与世界同步,开发了众多使用广泛的P2P产品。这些产品主要集中在文件共享与下载、网络流媒体电视等方面。

POCO

POCO 是中国领先的免费电影、音乐、动漫等多媒体分享平台,同时在线人数突破七十万人, 是中国最大的电影音乐动漫分享平台,是有流量控制力的,无中心服务器的第三代 P2P 资源交换平台。POCO提供多点传输、断点续传等技术,来保障传输过程的高效和稳定。

PPLive

PPLive是一款用于互联网上大规模视频直播的共享软件。它使用网状模型,有效解决了当前网络视频点播服务的带宽和负载有限问题,实现用户越多,播放越流畅的特性,整体服务质量大大提高。

其他优秀的商业软件还包括PP点点通、eMule、BT客户端软件等。

上一篇:固定WiMAX的两大应用领域 下一篇:P2P:互联网时代的计算革命