电力信息大数据高速存储及检索关键技术研究

时间：2022-04-28 03:49:28

摘要

伴随着目前科学技术水平的不断提高，信息技术被广泛应用在电力企业中，并获取了良好的成果。本文简要针对电力信息大数据告诉存储及检索技术进行探讨，目的在于进一步提高信息技术水平，推动电力企业更好向前发展。

【关键词】电力信息大数据高速存储检索

目前，电力企业的数据已经转变了以往形式单一、增长缓慢的情况，伴随着智能电网建设进程的深入，信息量越来越多，来源形式及结构越来越复杂，怎样更充分的运用好多元化的数据，成为了需要相关工作人员进行深入探究的内容。以下减压针对其进行探讨，供相关人员参考。

1 大数据的概念、特点及重点技术分析

1.1 大数据的概念

大数据，又可以被称之为巨量资料，是指所含有的信息量较多，巨大到无法利用目前主流软件工具，在规定时间内完成管理、处理的工作。最早提出这一概念的是美国著名科学家阿尔温托夫勒，之后引起了社会各界人士的关注。目前，随着电力企业的不断发展，所关联的数据量越来越大。怎样快速存储并检索大数据就成为了影响企业生存及发展的重要事项。

1.2 大数据的特性

对于大数据来讲，其并不是一种新的技术，也不是一类新的产品，而是一种全新的现象。其特性具体包含以下四方面内容：其一，大数据的体量十分巨大，由以往的TB，提高到PB等级；其二，大数据的类型相对较复杂，同时数据的来源也多种多样，其类别及形式突破了以往界定的结构范围，包含了非结构形式的数据及半结构形式的数据；其三，价值密度相对较低。例如：视频在不间断连续的监控期间，可能有用的信息仅为1s--2s；其四，处理速率相对较快。包括大量在线及实时数据分析需求。

伴随着互联网科技的逐步发展，数据自身成为了企业发展的重要内容，是确保访问途径与场所的基础，怎样灵活应用大数据，创建高速存储及检索技术成为了电力企业相关从业者需要深入探究的事情。

2 对典型电网的业务体系数据存储、检索及计算技术结构进行分析

如今，电力企业所面临的市场竞争越来越激烈，想要更好的寻求发展，就需要深入对电网信息技术进行探究。当前，用电信息的采集体系等每天所形成的信息量十分庞大，面向的用户数量较多，进而十分容易造成业务体系在分析业务方面发生相应迟缓的问题，使使用者等待时间过长。所以，相关工作人员就需要对用电信息采集体系的数据检索、存储、计算等技术结构进行深入探究，分析并总结结构化信息及非结构化信息运用的数据检索与存储性能，保证业务体系满足满足目前电力企业发展的需求，增强企业的市场竞争能力。

3 并行采样技术

对于高速数据采集体系来讲，其是系统内最核心的指标，想要实现高采样频率，可以借助单片高速数据转化器的芯片。然而此种芯片的售价相对较高，同时因为该芯片的分辨率相对较低，所以，如果对数据收集要求较高，可以借助并行采样的方法，同时应用多片低采样率的芯片，从而缩减高采样芯片的成本投入。并行采样技术的工作原理为：通过交叉时间采样的方法，让多片低频芯片并行，从而达到高频数据采集的效果。加设有M路的低频芯片，其采样频率为整个体系采样频率的1/M，经过相关调整，保证各个途径的相位差固定，将多个路径急性合并，则其采样的频率可以提高M倍，从而更好的加快信息的收集及传递速率，为电力企业发展夯实基础。

并行采样技术应用的ADC转换器大致有二类，第一类为闪电形式的ADC转换器。能够将模拟的信号直接同参考电压进行对比，进而获取相关数字信号的大小。该方法仅需较短时间就能够获取结果，效率较高，然而分辨率较差；第二类为逐次逼近形式的ADC转换器。其工作原理为借助比较器将模拟信号与转换标准电压进行对比，控制二者的差距在1LSB之间。表1为两种转换类型的对比。

4 电力信息大数据高速存储方案及技术

4.1 存储方案

在电力企业中，信息的采集具备数据吞吐率较高的特性，那么就需要系统能够在短时间完成传递及存储工作。所以，数据收集及高速存储的能力对工作质量有着至关重要的影响。高速的信息收集速率是确保信息采集精确度的关键指标，然而在处理信息时，却并不需要过快的速度，不然会提高对系统硬件的要求标准，使成本增长。那么，及需要设置一个数据缓存的单元，能够将信息存储在内，然后结合体系的需求进行运用与处理。一般来讲，高速缓存的方法大致可以划分成以下三类：

（1）先进先出形式的缓存。应用的设备为FIFO存储器。其就如同信息管道，资料能够由其中一头流进，然后由另一端流出，先进入的资料先流出。此种缓存方法拥有两套数据线，但是没有地址线，能够在一端进行操作，另一端进行读取，信息在其中进行顺序运用，所以，传递效率较高，并且能够节省布置地址线。但是此种技术的缺点在于仅能进行顺序读写，所以过于死板，同时容量较大、速率较高的FIFO存储器价格相对较高。

（2）双口PAM形式的缓存。该技术拥有两套相对独立的地址、数据、控制总线，所以能够分别由两个端口同时进行读写操作，互相不发生干扰，同时可以将采集的信息由一端输入后在控制器的另一端读出。该缓存方法传递效率较高，同时可以随时进行存取。但是其缺点在于价格十分昂贵。

（3）高速SRAM切换形式的缓存。此技术仅有一套地址、数据、控制总线，能够利用三态缓冲门将其连接在控制器及ADC转换器上。在ADC完成数据采集工作后，由SRAM设备在控制器上进行读写操作。其优点在于能够随时进行读写，缺点在于集成化水平较低，需要占用较大的面积。

4.2 存储设备的类别划分

当前，较为常见的存储设备依据其特性可以被划分成只读存储器及随机存储器。只读存储器按照存储的机构进行分类，包含SRAM及DRAM两类。其中，SRAM存储器的工作稳定性强、效率较快、操作灵活，但是价格相对较高，除了在部分特殊的场所外，很少应用该存储设备。而DRAM存储器较前者价格低很多，伴随着科技的不断发展，该设备的容量相应增大，同时存储速率越来越快，稳定性越来越好，假如应用得当，能够提高信息的存储效率。

5 电力信息大数据高速检索的过程

当用户提出检索需求后，同时将重点词提交给检索，则检索就会把重点词发送到索引的存储器内，然后遵照相关度将结果排列出来，传递到用户界面上，从而能够极大程度提高检索的速率及质量。

5.1 对提交的检索内容进行分析

检索用户在搜索界面上输入关键词语，提交检索申请，按照步骤最后找寻到需要应用的内容。搜索引擎需要对检索的内容进行细致分析。一般来讲，需要对检索内容进行分词，可以采用以下三种形式：其一，以字符串为基础进行匹配。此种方法包含三种形式，即正向最大匹配形式、逆向最大匹配形式及最少切分形式。正向最大匹配形式指的是由左向右把检索的内容分成部分词语。逆向最大匹配形式指的是由右向左把检索的内容分成词语。最少切分形式指的是把词组进行细化，然后逐个进行检索；其二，理解分词后进行匹配。检索模拟人们的思维对语句进行判断、理解，其基本原理为：在分词的过程中把语法中歧义的语句分析并进行处理。一般由三部分构成：即分词体系、语法、语义体系及总控制体系。在总控制体系的配合下，语法、语义体系获取词语、句子的含义，将其模拟人类思维进行理解；其三，统计分词后进行匹配。邻近字出现的频率越高，分词就将其视为一个词进行检索。需要注意的是，在检索期间，类似“的”、“吗”等词语在分词时会被去除。

5.2 对搜索请求进行匹配

就在搜索引擎接受到检索内容以后，进行细致分析，就会对其名称进行匹配，怎样将匹配的内容显示出来呢？就需要遵照匹配程度对其进行排序。通过此种方法，能够方便使用者更快找寻到需要的内容，从而提高工作质量，缩减检索时间，发挥更好的价值。所以，相关工作人员应对检索技术进行深入研究，不断进行创新，大胆尝试，并且引入一些国外先进的技术与方法，更好的推动电力企业发展。

6 总结

总而言之，伴随着目前市场经济的稳步发展，企业所面临的竞争越来越激烈，电力企业想要在竞争激烈的局面下获取生存并不断发展，就需要改进自身的管理方法，同时实现智能化发展，提高大数据的存储及检索速率。相关工作人员应对该内容进行深入研究，从而推动企业稳步发展，为人们提供优质服务。

参考文献

[1]宋亚奇，周国亮，朱永利.智能电网大数据处理技术现状与挑战[J].电网技术，2013（04）.

[2]吴锋.“大数据时代”科技期刊的出版革命及面临挑战[J].出版发行研究，2013（08）.

[3]库俊平.大数据环境中企业文书档案的信息化管理及利用[J].创新科技，2013（09）.

[4]乔向杰.基于大数据的旅游公共管理与服务创新模式研究[A].北京两界联席会议高峰论坛文集[C]，2013.

[5]易柏胜.基于zookeeper的虚拟机动态变更机制的设计与实现[D].华南理工大学，2013.

[6]朱永利，翟学明，姜小磊.绝缘子泄漏电流的自适应SPIHT数据压缩[J].电工技术学报，2011（12）.

作者单位

广东电网公司珠海供电局广东省珠海市 519000

电力信息大数据高速存储及检索关键技术研究

文档上传者

热门标签更多>

热门推荐更多>

精品范文更多>

电力信息大数据高速存储及检索关键技术研究

文档上传者

热门标签 更多>

热门推荐 更多>

精品范文更多>

热门标签更多>

热门推荐更多>