关于P2P网络搜索算法介绍及应用

时间:2022-02-04 01:29:57

关于P2P网络搜索算法介绍及应用

摘要: 近年来随着计算机技术和网络信息技术的进步发展,P2P(Peer-to-Peer)技术是目前网络技术研究的热点之一。基于分布式散列表的P2P模型具有广播效率高,非中心化,良好的扩展性,隐私保护以及负载均衡等特点。本文重点介绍了P2P搜索算法及常见应用。

Abstract: In recent years, with the development of computer technology and progress of information network, P2P (Peer to Peer) technology is one of the hot spot in network technology at present. Based on distributed hash table, P2P model is of high efficiency, the decentralization, good expansibility, privacy protection and load balance, etc. This paper introduces the P2P search algorithm and common application.

关键词: P2P技术;网络信息;搜索算法

Key words: P2P technology;information network;search algorithm

中图分类号:TP39 文献标识码:A 文章编号:1006-4311(2011)28-0137-01

0 引言

近年来随着计算机技术和网络信息技术的进步发展,P2P技术成为目前网络技术研究的热点。它具有点对点的特点,可避免客户/服务器模型的服务瓶颈问题。它是一种网络新技术,依赖网络中参与者的计算能力和带宽,而不是把依赖都聚集在较少的几台服务器上。P2P是互联网整体架构的基础。互联网最基本的协议TCP/IP并没有客户机和服务器的概念,所有的设备都是通讯的平等的一端。

1 P2P技术定义

P2P是Peer-to-Peer(对等计算)的意思。“Peer”在英语里有“对等者”的意思。因此,在字面上P2P可以理解为对等互联网。P2P可定义为:网络的参与者共享他们的一部分硬件资源,这种硬件资源包括:存储能力,运算能力,网络连接能力,打印机等。其在加强网络上人的交流、文件交换、分布计算等方面有很大的潜能。这些共享资源通过网络提供服务,其它的对等节点可以直接访问而无需经过中间环节,在P2P网络中的参与者既是资源的提供者也是资源的获取者。

2 P2P技术特点

2.1 分散化 为了避免可能的瓶颈,网络中的资源和服务分散在所有节点上,在节点之间实现信息的传输和服务,无需其它服务器和中间环节的介入。这样即使是在混合P2P中,定位服务、查找资源或安全检验等环节,虽然需要集中式服务器进行参与,但主要的信息交换最终在节点中间直接完成。这样就大幅降低了对服务器的资源和性能要求,分散化是P2P的基本特点。

2.2 可扩展性 传统C/S架构中,服务器的资源主要限制了系统能够容纳的用户数量和提供服务的能力。因而集中式服务器之间的同步、协同处理等产生大量开销,限制了系统规模的扩展。而随着更多用户不断地加入到P2P网络中,需求的增加使得系统整体的资源和服务能力也在同步地扩展,这样不会出现瓶颈问题最终能够满足客户的需求。所以P2P在理论上可以说是具有无限扩展性的。

2.3 健壮性 在互联网上随时可出现各种异常情况如:网络中断、网络拥塞、节点失效等各种异常事件都会给系统的稳定性和服务持续性带来影响。P2P架构由于服务是分散在各个节点之间进行的,部分网络或节点遭到破坏,对其它部分的影响都不大。而且P2P模型一般在部分节点失效时还能够自动调整整体拓扑,保持其它节点的连通性。

2.4 隐私性 随着互联网快速增长,大家越来越关注隐私的保护。在P2P网络中,由于信息的传输分散在各节点之间进行不需要经过某个集中环节,故而用户的隐私信息被窃听和泄漏的可能性缩小。与此同时,所有参与者都可以提供中继转发的功能,因而大大提高了匿名通讯的灵活性和可靠性,能够为用户提供更好的隐私保护。

2.5 高性价比 随着硬件技术的发展,个人计算机的计算和存储能力以及网络带宽等性能正在高速增长。采用P2P架构可以有效地利用互联网中散布的大量普通用户节点,将计算任务或存储资料分布到各个节点上。利用网络中的大量空闲资源可以用更低的成本提供更高的计算和存储能力,达到高性能计算和海量存储的目的。这与当前高性能计算机中普遍采用的分布式计算的思想是一致的。

3 P2P网络算法及应用

目前P2P网络主要分为以下四种形式:中心拓扑结构,全分布式非结构拓扑,全分布结构化拓扑(Decentralized Structured Topology,也称作DHT网络),半分布式拓扑。目前国内外的研究主要几种在对后三种模型的性能改进。DHT类结构能够自适应节点的动态加入、退出,有着良好的可扩展性、节点ID分配的均匀性和自组织能力。

①中心化拓扑:他由用户节点和一个中心化的目录系统组成。其最大的优点是维护简单,资源发现效率高。最大的问题容易造成单点故障,访问的“热点”现象和版权纠纷等相关问题,这种结构,对小型网络而言,中心化拓扑模型在管理和控制方面占一定优势。但是该模型并不适合大型网络应用。②分布式拓扑:有的文献亦称作混杂模式,英文表达为(Hybrid Structure)吸取了中心化结构和全分布式非结构化拓扑的优点,它的原理是:选择性能较高(处理、存储、带宽等方面性能)的结点作为超级结点(英文表达为SuperNodes或者Hubs),在各个超级结点上存储了系统中其他部分结点的信息,当用户需要搜索某个文件时,请求计算机只把搜索请求发送给超级结点,超级结点再将查询请求转发给适当的叶子结点。半分布式结构也是一个层次式结构,超级结点之间构成一个高速转发层,超级结点和所负责的普通结点构成若干层次。③全分布式结构化拓扑――DHT网络(结构化P2P网络)的搜索技术基于DHT的结构化的资源结点发现算法,如Chord、Pastry、CAN和Tapestry等。在对Chord算法的深入研究下,从三个方面对原Chord系统的资源查询策略做出了改进。首先,根据结点综合性能差异,选出超结点,将系统分为两层,主干网层和子网层。群组超结点组成主干网,主干网是一种自适应的Chord网络,子网层普通结点形成群组,并以该群组超结点作为子网层服务器,同时根据IP地址映射得到超结点标识符,使得物理拓扑与逻辑拓扑相匹配;其次,删除路由表中的冗余信息,添加相同数目的有效路由信息,使得一跳的步幅最大由原先的半环扩展到整个环;最后,为每个超结点增加快表,保存最近搜索的资源,对于一些热门资源的查询,可充分利用之前的查询结果。

4 结论

基于P2P技术的网络应用几乎遍及了互联网的各个领域,P2P技术给当今的网络掀起一波热潮,但同时P2P技术这把双刃剑也给网络带来一系列新问题,随着P2P技术的成熟和网络安全管理策略、网络软硬件技术的不断发展,P2P技术的应用将得到进一步的普及和完善。

参考文献:

[1]Sakaryan G,Wulff M,Unger H.Search methods in P2P networks:a survey[C] 2004(6).

上一篇:心理学视野下高师幸福教育策略研究 下一篇:用“几何画板”软件探讨含参数的函数在区间上...