物联网环境下数据库管理系统的挑战

时间:2022-10-23 05:48:20

物联网环境下数据库管理系统的挑战

摘要:论述了物联网环境下数据库管理面临的挑战。展示了由物联网构成的信息高速公路的面貌,并讨论了作为物联网组成部分的不同类型的数据,其中包括ID标识类型,地理位置数据类型,环境数据类型,历史数据类型和可描述数据类型,以及在异构系统中管理大量数据遇到的挑战和新问题。主要从数据查询、索引、处理模型、事务处理和异构系统整合角度进行论述。最终将就物联网环境下数据库管理进行分析,并比较几种不同的技术方式及其相应的技术优势。

关键词:数据库管理;挑战;物联网;路径图;技术优势;射频识别技术;异构系统

中图分类号:TP311.131文献标识码:A文章编号:16727800(2011)012016003

作者简介:林信川(1981-),男,福建福州人,福建师范大学信息技术学院实训工程部主任,软件设计师,研究方向为计算机软件工程、计算机网络和物联网。1物联网使用的数据类型

1.1射频识别类型(Radio Frequency Identification)

射频识别技术(Radio Frequency Identification,缩写RFID),是20世纪90年代开始兴起的一种自动识别技术,射频识别技术是一项利用射频信号通过空间耦合(交变磁场或电磁场)实现无接触信息传递并通过所传递的信息达到识别目的的技术。

RFID系统在实际应用中,电子标签附着在待识别物体的表面,电子标签中保存有约定格式的电子数据。阅读器可无接触地读取并识别电子标签中所保存的电子数据,从而达到自动识别物体的目的。阅读器通过天线发送出一定频率的射频信号,当标签进入磁场时产生感应电流从而获得能量,发送出自身编码等信息,被读取器读取并解码后送至电脑主机进行有关处理。

1.2地址/唯一标识符(Addresses/Unique Identifiers )

物联网环境下需要通过唯一的IP地址进行对象标识。对象标识资源随着物联网环境下对象的增长而不断消耗,IP v4协议正面临不断枯竭的危机。20世纪80年代为解决IP v4不断枯竭的危机,出现了一种新的Internet协议,也就是IP v6。IP v4虽然相较仅能够标识32bit的地址范围而IP v6能够标识更大的地址空间,但是目前为止IP v4仍然是最为广泛使用的Internet协议。

由于IPv4 网络的庞大规模导致IPv4 向IPv6 过渡存在一个漫长的过程,因此物联网一旦使用IPv6 地址,就必然会存在与IPv4 的兼容性问题。

1.3用于对象、处理过程和系统的可描述性数据

物联网的强大从很大程度上得益于记录于参与对象中的数据或者元数据。元素据是关于数据的数据,通过元数据用户可以定位并访问到准确的数据。

尽管处理过程数据和系统数据的对象属性远比常规对象复杂,但它们都可作为特殊的对象类型进行处理。物联网服务可以让用户监测一个对象参与了哪些进程和系统过程,这样用户就能够更好地调用这个进程的实例。例如生活中的电量使用情况的数据需要通过一段时间收集。可以通过运行一个进程用于计算某个指定时间段内用电量高峰和低谷期的平均值,这个进程或服务很可能是众多物联网提供的服务之一。

1.4定位数据和普适环境数据(Pervasive Environmental Data)定位数据提供了经过特殊标记的对象的位置信息,该信息或通过GPS提供,或通过本地位置定位系统提供。GPS通过向多个卫星上的控制模块发送信号的模式进行工作,控制模块以三角定位测量法的方式确定发送信号物体的位置。本地位置定位系统也使用类似的方式进行工作。本地位置定位系统主要用于建筑内或建筑和人口密集区,定位信息能够通过本地已经配置的感应器和信号传送器进行发送和接收。多个感应器能够将信号发送到一个小型设备上,此设备能够定位发送信号的位置或者其他协作对象的位置。定位信息对于物联网来说极为重要。

1.5传感器数据――多维时间序列数据(Multidimensional Time Series Data)数据可以通过无线传感网络被发送到物联网。先进的电子设备技术使得目前很容易就可以通过安装无线传感网络检测各种环境状态,例如天气、温度和噪音等。在使用传感器数据的过程中必须考虑数据采集频率的问题,例如是持续采集、以固定时间间隔进行采集还是当需要查询的时候才进行采集,即如何通过高效的方式能够采集到有代表性的样本,以及确定采集的数据量。传感器的出现和网络技术的发展使得快速采集海量数据成为可能,但此后的查询和数据挖掘工作存在很大的难度。

1.6历史数据(Historical Data)

在物联网环境下传感器捕获的字节数据和其他大量数据都需要进行存储,久而久之必然出现历史数据,随之而来的问题是存储空间成为瓶颈。面向应用程序的设计方案必须制定如何保存数据和哪些数据需要进行保存的标准,常用数据应保存在活动的数据仓库中以备频繁查询,不常用的数据可能需要进行压缩存储。物联网要做到智能化则必须借助历史数据来提取经验进而转化为知识,最后才能改进、优化。

1.7模拟现实世界的物理模型(Physics Models)

物联网应用程序在进行运算过程中需要访问物理模型。物理模型作为现实世界的模拟实现,可以对现实世界进行表征,如重力、压力、光照强度、声音和磁力等。进行物理模型的呈现必须进行建模和物理场景的模拟。物理模型被广泛地使用在游戏和计算机辅助设计等工程领域,并在物联网运作中发挥着不可替代的作用。

1.8执行器(Actuators )和命令数据的状态

事件和信息是通信机制的抽象元素。事件既可以是传感器表示的“原始数据”,也可以是执行器表示的“操作”。通过控制单元对事件的处理,信息可以抽象地表述物理世界。 物联网环境下需要经常控制远程设备,因此就存在针对当前执行设备状态进行反馈的需求。执行器的作用就是根据来自信息世界的命令,来改变物理实体的设备状态。

在物联网环境下也存在大量进行设备控制的命令数据。在物联网中可能有各种不同的系统通过不同的来源完成各自独立的访问过程,因此必须制定标准化的命令进行数据控制和用户界面控制。

2物联网领域存在的数据库问题

2.1数据大小(Size)、数值范围(Scale)和索引(Indexing)

物联网中存在数据的大小和数值范围将会是极其巨大的,所以数据必须通过本地响应的方式进行管理。本地数据管理者必须决定哪些数据和服务对全局网络运作有用。由此可见,物联网至少能够操纵两个层面的数据:公有数据和私有数据。使用者通过加入特定的权限组以访问某些特定的私有数据,同时也能够通过Internet访问公有数据。

索引问题将会是一个重要的业务难题。由于物联网中包含众多不同类型的数据对象,所以仅对数据库编目进行管理只能解决部分问题,同时通过创建一个能够通用于所有国家和所有语言,并且包含世界上所有物理实体的编录是不现实的。

2.2查询语言

当前主流的数据库管理系统查询语言都基于结构化数据。可扩展标记语言(XML)提供了一种相较于结构化数据更为松散结构的数据表现方式,并且同时还支持自定义进行数据描述的方式。XML语言已经成为技术层面上一种广为接受并具有较好互操作性的语言。作为查询XML的语言XQuery,已经由W3C研发成功,它能够整合文档、Web页面以及关系数据库等数据源进行查询。用于半结构化的查询语言通常采用基础分层数据模型,例如单项曲线图就是采用该种数据模型。但是,分层数据结构存在与生俱来的问题,例如难于表现多对多关系等。

物联网环境下存在各种各样的使用者,例如偶尔访问某个网站获取一些数据或信息的临时用户,或者准确知道如何查找所需数据的专业用户等。事实上相同的使用者在面对不同类型的数据时将成为不同类型的使用者,有鉴于此,需要为不同类型的使用者提供不同的数据访问工具。

2.3过程建模和事务处理

将来在物联网领域中众多的处理过程都将以服务方式开发或者提供。基于架构的服务SOA越来越成为所有基于Web的系统中支持互操作性的重要方式。

ACID属性在Web事务处理方面表现不尽如人意已是业界公认的事实,这种现象就和物联网环境下全局事务处理的需求背道而驰。目前业界已经提供了基于Web的事务处理的新方法和模型,主要通过使用平衡事务和使ACID属性更加松散的事务系统实现。有研究证明ACID属性中的持久性并不是所有应用程序的需求。从某种程度上说,减少事务的数量也许比完整保留ACID属性来的更有用。

2.4多相性(Heterogeneity )和完整性

物联网由众多独立节点组成,每个节点又各自存在着不同的保存数据的方式。如果没有基于一个标准的处理方式,互操作性将无从谈起。

随着数据量的增长和基于Web的不同类型系统的日益增多,异构性和互操作性的问题再次被提上议事日程。XML在一定程度上提供了一种解决以上问题的方案。XML提供了一种专门的、实用的和高效的方式从一个系统将数据传递到另一个系统。但是,XML并不能解决语义问题。OWL是一种用于表现Web实体的语言,它要求社区间使用OWL系统表现Web实体,该过程中OWL系统将为提供语义互操作性提供需要的支持。在不远的将来,在改进物联网的使用体验方面将充当使用语义信息的角色。

2.5时间序列聚集(Time Series Aggregation)

在数据库研究领域,已经有人提出针对流数据使用新的模型并进行流数据捕获。传统的查询语言如SQL,已经不适合进行时间序列数据的查询。另外业界也有人开展针对异常情况下(如断电)丢失数据的评估工作。以上的研究内容对物联网应用领域中的智能数据流捕获系统都有极为重要的意义。

对于物联网来说,最佳的时间采样周期极大地依赖于数据性质和应用领域,因此必须定义适合的查询设备。在此过程中提供连续数据采样服务的数据拥有者必须解决查询设备的问题。

2.6归档(Archiving)

数据库存档是一项长期的工作,主要指的是对数据库生成副本并按照指定的间隔时间对数据进行安全存储。基于Web上下文归档的数据库能够转化为XML进行归档并保证对基本查询功能的支持。处理过程也能够通过使用数据捕获软件,对每个服务的请求和响应以快照的方式进行存档。这些技术在物联网中都是非常有应用价值的。

如果考虑物联网中存在的数据属性和数据量级问题将变得更加复杂,但可以考虑通过在本地数据归档管理中使用更好的索引和数据挖掘设备解决。通过存档的数据,能够对已进行的主要操作进行检索。目前针对该问题的解决方案主要围绕着有效的数据存储方式、查询语法和性能几个方面。通过数据仓库的研究工作和数据挖掘工作的开展,将更有助于解决这些问题。

2.7数据保护(Data Protection)

可以预见到在物联网发展的中、高级阶段将面临如下五大特有的信息安全挑战:①四大类(有线的长、短距离和无线的长、短距离)网路相互连接组成的异构(heterogeneous)、多级(multihop)、分布式网络导致统一的安全体系难以实现“桥接”和过渡;②设备大小不一、存储和处理能力的不一致导致安全信息(如PKI Credentials等)的传递和处理难以统一;③设备可能无人值守、丢失、处于运动状态,连接可能时断时续、可信度差,种种因素增加了信息安全系统设计和实施的复杂度;③在保证一个智能物件要被数量庞大,甚至未知的其他设备识别和接受的同时,又要同时保证其信息传递的安全性和隐私权;⑤多租户单一实例服务器SaaS模式对安全框架的设计提出了更高的要求。

3技术发展优先级路径图

如下是已经被认定的在物联网领域几个重要的研究课题:① 研究远程随即存储和闪存如何作为持久化存储介质;②在数据存储层压缩和加密介质;③设计包含非关系数据模型的系统;④权衡兼容性和可用性,以获得更好的性能;⑤设计具有功耗调节功能的数据库管理系统以减少能耗。

分布式系统已经被广泛认为在以下方面优于主流数据库体系架构:新的模型,新的查询语言,新的事务处理方式,新的分析处理连续数据(如数据流)的方式。这些研究成果在不远的将来会对物联网数据库管理系统的发展起到重要的作用。但是一些现有的处理方式必须经过重新修改或定义才能适应物联网发展带来的挑战。

在物联网的发展过程中,以下技术应进行优先考虑:

(1)过程建模和互操作性

需要重新定义或寻找一种新的互操作性结构。从技术层面上来看,SOA可能成为互操作性未来的发展方向。必须彻底评估物联网的特点,以确定是否通用SOA技术能够应用于物联网以及如何应用于物联网。

(2)索引方法

物联网数据的海量性很可能是前所未见的。我们应考量是否现有的索引方法在物联网环境下是否可用。理想情况下,需要基于一般索引建立一套物件分类法,至少需要对标准的索引和分类方法进行重新评估,以确定是否它们在物联网环境下仍然可用。

(3)归档方法

必须建立标准的归档方法。不同的场景下应使用不同的归档方法。将分类归档方式应用到具体的使用场合将有助于解决此类问题。

(4)驱动器控制

许多的物联网设备都使用驱动器控制方式。提供一种标准化的控制和链接实体与驱动器的命令数据格式是非常有必要的。

(5)事务管理

应用场景的类型和相关事务管理的建议构成了一个新的研究课题。以此为基础,通过系统或服务能够构建出多种不同类型和层次的事务管理。

(6)智能的用户体验

可以通过技术层面上的一些方式,如SOA和XML取得良好的交互效果。在语意层面上需要达到更好的交互效果,例如知识表达等人工智能技术,都是通过自身或者其他方式进行信息传递的,这都有助于让过程和实体更加智能化。

(7)

为了在许多任务中满足无需进行人际交互的需求,需要开发智能系统,此系统将协同特定环境下的实体进行工作。

参考文献:

[1]陈竹西,胡孔法,陈歧,等.现代物流系统中的频繁封闭路径挖掘算法[J].计算机集成制造系统,2009(4).

[2]James Jungbae Roh, Anand Kunnathur, Monideepa Tarafdar,Classification of RFID adoption: an expected benefits approach[J]. Information & Management,2009(46).

[3]无线传感器网络安全研究与分析[EB/OL].2007.http://www.省略/article/61231.htm.

[4]宋合营,赵会群.物联网分布式识读器数据采集方案设计与实现[J].北方工业大学学报,2008 (1).

[5]S HALLER,S KARNOUSKOS,C SCHROTH.The Internet of Things in an Enterprise Context[C].in Future Internet Systems (FIS),LCNS,Springer,2008.

[6]A DELIGIANNAKIS,Y KOTIDIS.Exploiting SpatioTemporal Correlations for Data Processing in Sensor Networks[C].in Geosensor Networks,LNCS,Springer,2008.

[7]K TSHOGANETSO,A JAMES,R IQBAL.Adaptive User Defined Transaction Relaxing Approach for CSCW[C].in 13 th International Conference on Computer Supported Cooperative Work in Design,Santiago Chile,2009.

上一篇:多核平台下声音采集与播放并发互斥技术研究 下一篇:大型数据库系统设计与功效研究