大数据安全防御模型构建研究

时间:2022-10-20 10:24:24

大数据安全防御模型构建研究

传统网络安全管理体系在大数据时代已显现不足,本文通过构建大数据安全架构层次,详细定义大数据安全防御体系,结合粒子群算法思想,提出了大数据安全防御模型,具有较强的理论价值和实践意义。

大数据是指携带巨量信息的高增长率和多样化的信息资产,正处蓬勃发展阶段,怎样保证其安全可靠是一个亟待解决的问题。病毒探测、主动防御等传统安全防护体系,无法适用大数据的可靠性管理[1]。大数据安全防御的重点是构建可行的防御模型。本文基于大数据可靠性需求,提出一种动态安全算法,构建了大数据安全防御模型。

大数据安全防御模型的构建

安全架构层次设计。本文将大数据安全架构划分为以下4个层次:

数据拆分层,主要按照数据拆分策略对大数据进行分布式管理,通过聚类算法对所获取的数据集进行分类和预处理。

数据分析层,主要分析预处理之后的大数据,分析目标包括可疑病毒、非法任务等。发现的风险因素会被立即隔离。

数据包装层,主要实现大数据的有效封装。封装时要充分考虑信息的加密需求,确保封装后数据的隐私性、准确性和安全性。

客户应用层,主要是大数据的使用者和分析报告的上传者。

安全防御体系的定义。本文以粒子群算法为基础,构建大数据安全防御体系。

首先为计算出大数据的信任度,提出以下4个定义:

定义1:如果信任度的起始与个体最好值 相等,则进行迭代操作的时候不再改变;假若信任度的起始值比上一值更优,则根据粒子群算法的规则,以起始值替换上一值: 。

定义2:为提升寻优效果,引入进化度θ: ,当经过多次迭代且θ=1时,表示寻优能力已经符合要求。

定义3:粒子群所有成员的个数以 表示,因此可以把动态因子的耦合度以 表示,耦合度的大小与数据的分散程度有关,当耦合度接近于1的时候,证明局部最优解已经形成。

定义4:结合以上3个定义,能够将动态信任因子表示为:

基于上述研究成果,为描述大数据安全防御行为,提出以下5个定义:

定义5:假若大数据可靠度处在信任因子范围内,则可以视为大数据是强安全的,表示为:

定义6:假若大数据可靠度处在信任因子范围内,但对于其他的访问者处在“开放访问”状态,则被视为弱安全,表示为:

定义7:在合法性方面,假若大数据处在最高合法水平,并且对于其他的访问者处在“不可访问”状态,则大数据被视为强合法状态。表示为:

定义8:假若大数据处在最高合法水平,并且对于其他的访问者处在“验证访问”状态,则大数据被视为弱合法状态。表示为:

定义9:假若大数据处在“开放访问”状态,则大数据被视为不合法状态。表示为:

最后,客户的操作请求与大数据可靠度间的关系表示为:

安全防御体系证据分析。为保证大数据的“强安全”与“合法状态”,假设大数据服务信息系统共拥有m台服务器,在m台服务器中,提取n台作为构建安全防御体系的数据样本。进一步假设,从n台服务器所获取的样本数据α∈泊松分布,则这些样本在服务器输入端以排队的方式等候处理和传输,等候时间为1/α[2]。如果一段数据信息的等候时间超时,则可视为信息已被丢弃。此时会生成一个反馈信息,通知信息的发送者重发信息。结合马尔科夫定律,在这种数据传输环境中,可靠度不足的信息识别是符合遍历准则的[3]。

安全防御模型实现流程。综上所述,完整的大数据可靠性防御模型实现流程为:

安全防御的初始化过程,新任务加入等待队列。如果轮到该任务进行处理,便将其信息从数据存储区提取出来,按照数据预处理策略进行分布式管理和数据集分类。

当判定数据为有效信息之后,将任务提交数据拆分层进行信息拆分处理。在信息拆分之前,系统预置了信息判定单元,这个单元的功能是对所有的信息处理过程引入来自云端的可靠性监控。

如果信息中所含有的任务之和能够进行分解,使之成为n个子任务,则分割函数可以表示为:

将拆分形成的子任务提交数据分析层进行分析处理。如果子任务信息已经在任务数据库中存在,则判断为重复任务,将其删除以保证数据库的低冗余。

分析处理完毕的子任务,提交到数据包装层。依据其独有的索引代码,形成哈希表,将其重新连接为一个整体的任务单元,并进行加密封装,之后传输至客户应用层。

判断是否存在下一个需要处理的任务;如果存在,则转至第一步。

本文提出的大数据安全防御模型,基于动态安全算法,能够克服传统网络安全管理体系不足,在信息安全受到威胁之前定位和清除隐患。该模型成功实现了基于云计算环境下的大数据安全隐私保护,符合大数据可靠性管理要求,具有较高推广价值。大数据时代,现有的数据隐私保护技术还不够完善,需要从科研和技术层面加大对云平台的大数据安全隐私保护的研究。

(作者单位:1.31433部队;2.31438部队)

上一篇:电子设备三维布线工艺技术应用 下一篇:园林工程施工质量存在的问题及控制策略