物联网海量异构数据检索的研究

时间:2022-10-25 04:24:09

物联网海量异构数据检索的研究

摘 要

在物联网环境下,由于传感设备结构和功能的不同,产生了各种各样类型的数据源,需要对海量异构数据进行层次化处理,有效的降低数据类型的复杂度,避免查询形式单一,负载不均。

【关键词】物联网 海量异构数据 EPC网络 chord算法

1 引言

物联网中传感设备采集的数据具有以下几个特点。1)海量性。物联网应用规模的扩大,传感设备涉及任何物品,数据量呈几何级数增长。2)异构性。传感设备结构和功能不同,将产生了各种各样类型的数据源,与互联网和EPC网络相比,更为多样化。3)分散性。传感设备分散在不同的地理位置,是无处不在的,因此采集到的数据具有分散性。

2 基于chord算法的物联网信息检索

在基于chord算法的物联网信息检索中,基于EPC网络对EPC码和IP地址注册入网,当有用户节点发出查询请求时,节点就遵循chord算法,在chord环上进行关键字查询。因此,对物联网异构数据进行分层次处理成为亟待解决的主要问题,对海量异构数据进行智能分类,关键字提取,获取数据采集地址,从而增加了物联网数据的透明度。设计信息服务节点,使其具有EPC网络中ONS和EPCIS两个部分的功能,使其提供信息查找和定位服务。

3 基于信息服务节点的物联网检索算法的改进

3.1 物联网异构数据预处理

海量异构数据是物联网最突出的特点,为提高检索效率,需要对海量异构数据进行分层次预处理。自底向上分为以下三点。

(1)存储层。把各式各样的传感设备获取的海量数据进行统一的存储管理。(2)处理层。通过统一的扩展的信息管理的应用接口,把存储层的数据与上层的数据应用衔接在一起,实现数据统一处理,达到更好的系统性能。(3)服务层。将处理后的数据信息映射到信息服务节点,响应用户访问请求,监测处理层的运行情况。

3.2 异构数据预处理流程

(1)将传感设备采集到的数据存储到存储层的传感节点,向上层处理层上传。(2)处理层,设置H函数,对采集数据端口获取的数据流进行数据类型分类, 针对物联网内异构数据格式进行分类处理,将产生为一个三十二位散列值,如视频,音频以及图像等均产生为不同的散列值。从而产生一个初始的二维 key/value 集合。其中key值为数据类型,value值存储原始数据。(3)系统把所有初始二维key/value集合中具有相同key值的value值聚合在一起后调用M函数。(4)对初始二维key/value集合中的value值提取关键字和采集地址,保存在中间二维keyI/valueI集合中。(5)中间集合值聚合在R函数,产生一个三维的key/keyI/valueI集合值,即。物联网异构数据预处理流程图,如图1所示。

3.3 物联网信息服务节点检索算法

物联网信息服务的需求和应用环境特点,采用chord数据查找算法作为其信息检索技术的组织方式,每个节点只需要维护自身 Finger 表中的小部分节点,无须掌握网络中其他节点的信息,就可以通过节点之间的通信,找到任一节点。因此具体查询步骤如下:

(1)用户预查询信息,首先对信息服务节点发出查询请求。(2)信息服务节点 N 查找 key 所在位置,若 key 在 N 和 Successor(N)之间,则相关的信息存放在节点 N 的后继节点上,于是节点 N向其后继节点发送查询请求。(3)否则若 key 不在 N 和 Successor(N)之间,则节点 N 需要查询其 Finger 表,找到标识符最接近 key 并且小于 key 的节点,直接向此节点发送查询请求,节点接到查询请求后重复此查询步骤,直到搜索到目标节点。

4 实验分析

笔者在OMNET++平台下从路由跳数,对物联网异构数据检索算法进行仿真。如图2所示,实验验证了 Chord 算法的逻辑路由跳数是O( ln N )。随着网络规模的增大,Chord 搜索算法的路由跳数并没有急剧地增加,而是保持在一个相对稳定的数值区间。因此,Chord 适合于异构数据急剧增长的物联网。

5 结语

笔者设计信息服务节点用 Chord 路由算法进行在物联网环境下异构数据的查找,并用 OMNET++进行仿真实验,从路由跳数方面,对物联网异构数据查询进行了性能仿真。实验结果显示,运用 Chord算法进在物联网异构数据环境下进行数据查询与EPC网络相比,查询时路由跳数相差不大,避免了异构数据的瓶颈问题,有效地提高了物联网异构数据的查询效率。但是改进后的信息查找算法仍然存在不足,如 Chord 的算法未能依据用户的个人信息进行个性化推荐,因此,今后的重点工作就是对 Chord算法继续进行改进,降低算法复杂度,从而使 Chord 能够提供更好的查询服务。

参考文献

[1]李建中.物联网与CPS的终极挑战:海量数据计算[R].中国计算机学会,学科前沿讲习班,2010.

作者单位

辽宁大学信息学院 辽宁省沈阳市 110036

上一篇:基于XML消息中间件在一卡通缴费系统中的应用研... 下一篇:基于ITIL理念的虚拟学科群系统运维分析