多维数据挖掘处理对层次分析法构建挖掘模型的应用

时间:2022-10-30 12:51:26

多维数据挖掘处理对层次分析法构建挖掘模型的应用

摘 要:层次分析法构建挖掘模型(ACMC)策略让整个数据挖掘流程更加的直观,它升华了原来的层次分析概念,在复杂的数据环境中,实现了高效率、高质量的数据预测分析,并且从方法论、实践方面提供了根据数据挖掘过程的策略分析,实现了ACMC系统的规范设计。提高了挖掘数据的准确性。下面本文就对ACMC在多维数据挖掘处理中的应用探讨。

关键词:ACMC;多维数据挖掘;应用

中图分类号:TP311.13

层次分析方法是对某些复杂的决策问题的各种影响因素以及其中的内在关系进行深入分析,选用较少的定量信息让决策的思维过程变成数学化,进一步为无结构特征、多准则的高难度决策问题提供简单有效的决策方法。而数据挖掘即数据库中的知识发现,从繁杂的数据中选取含有潜在信息量的过程。而ACMC是把层次分析方法和多维数据挖掘方法相结合的方法,它能够提供一个可扩张、插拨、相互支持操作。重构的多维数据挖掘体系。下面本文就多重数据挖掘层次分析方法进行研究分析,以期让数据挖掘过程更加清晰可见,选取的模块更加准确。

1 ACMC和多维数据挖掘的基本认识

1.1 数据挖掘技术简要分析

随着数据库与人工智能技术的发展,数据挖掘技术应运而生,这是一个从数据集中识别有效、新颖,具有潜在利用价值到可理解模式的高级处理环节。一般包括数据清理、数据集成以及数据变换、数据挖掘、知识表示等,其中数据挖掘是中心。数据挖掘的目的主要用于指定数据挖掘任务中要查找的相关模式,通常把数据挖掘任务分成描述与预测两种。其中描述性数据挖掘的任务主要是刻画数据库内数据的一般特征;预测性数据挖掘任务是参照现阶段的数据进一步推理,然后进行预测分析。数据挖掘系统模型如下图1所示。

图1 数据挖掘系统模型

1.2 层次分析法构建挖掘模型策略

在知识数据库的复杂数据环境中,层次分析法构建挖掘模型不仅仅能从训练数据库中获得大量的信息数据,还可以用“Model Refresh”以及“Model Evaluation”对模型进行评估打分,然后选出正确的模型执行。运用层次分析结构把这些模型逐层筛选出来,进一步为整个数据挖掘大模型绘制整体结构。

2 ACMC结构及应用流程

在一个完整体系的ACMC结构中,主要包括知识数据库、数据挖掘处理模式以及处理方法、数据模型学习、评估等。ACMC能够从多个角度、层次对数据挖掘进行整体改造,它能够提供一个相对完整的体系结构与一个很好的框架支持不同模式中数据挖掘模型化的方法,在这个结构体系中包括成功模型组件、并行挖掘模式以及同一个模式下的挖掘方法、评估挖掘方法模型,进一步定义出模型流的方向。ACMC能够从战略高度、多个层面的技术水平、不同抽象层面支持挖掘组件的结合,再重新设计数据挖掘的全部过程,然后提供一个科学合理的挖掘模型结构。

在ACMC流程的开始阶段,为了进一步提高模型的准确性,不一样的挖掘模型方法能和知识数据库通过交互方式让模型进行自我学习,然后,每一个模型能够和“Analytical Base”通过交互凡是对模型进行打分评估[7]。当评估工作完成后,会立刻进入挖掘模式层面,对每个挖掘模型方法进行详细分析比较,再进行分类、聚类、回归处理,按照从优到劣的顺序排列,最后用表格形式展现出来。在ACMC的最顶层是良好的挖掘模型,然后是最佳挖掘模型,最后排列结果由执行引擎处理,把这些优秀的挖掘模型进一步挖掘预测。其中在不同条件下,挖掘模型评估结果的优劣性有很大差异,虽然有一定的差异,但是在模式分支允许的情况下可以进行插播。这样可以提高工作成效、保证准确性。

3 ACMC在多维数据挖掘中的应用

在ACMC中主要包括三个重要概念:模型学习、模型评估以及模型学习和评估之间的影响关系,这三个概念是对模型进化学习的完整诠释。其中模型学习环节出现在M-KPI层面,主要采用新数据更新原有模型,然后建立一个崭新的模型。新旧模型之间主要的不同在于新模型主要来源于新的数据,且算法的类型、模型范式都是相同的。模型评估环节出现在M-KPI、M-CSF这两种不同层面,把样品数据输入以后,利用模型能够评估打分,当出现预测的结果后,可以用实际结果评估模型,然后赋予一定权值,在每个M-KPI取得一定的权值以后,能够用权值筛选模型方法。

其次,模型学习与评估二者之间的关系,利用不同的M-KPI刷新模型,然后产生和新模型对应的新数据,再使用“ Analytics Data”对每一个模型依照不一样的需求数据评估,当输进不同的需求数据以后,就能够出现不一样的线性结构图形。经过综合分析不一样KPI的影响,每个M-CSF就能够产生相对应的影响波动图形。在ACMC中存在着众多的关键因素,其中主要包括“分类-CSF、回归-CSF以及聚类-CSF等”。其中分类是ACMC结构中一个非常重要的关键因素,进行分类的主要目的是学会分类函数或者分类模型,这种模型可以把数据库中的数据系列项反射到规定的类别中,通过分类体悟表述关键性数据类别的模型,然后预测以后的数据趋势。在分类-CSF中包括很多种算法,每一个数据样本采用n维特征向量描述属性数值。

最后,假定一定不明确的数据样本X,分配给各个类别,就会产生P,再依据贝叶斯定理,P(X)相对于全部类别属于常数,在最大化以后检验概率P能够转化成最大化的概率。此时若训练数据集中含有很多属性与元组,计算所得的P(X)数值可能会非常大,故一般情况下,需要先假设各个属性的取值是相互独立的,然后就可以从训练数据中求出来。按照这种方法,对一个未知类别的样本X,必须先计算出X所属类别概率,然后选取概率最大的类别当作类别。

4 结语

总之,为了把多维、多层次复杂数据流的数据挖掘处理流程进行优化处理,在层次分析方法和数据挖掘理论的基础上,提出了层次分析法构建挖掘模型的理念。设计出了以层次分析法构建挖掘模型为基础的结构,提供一个用来支持各种各样挖掘组件的集成平台,为整个数据挖掘流程提供了一个可控策略,以从多个方面、多个层次对整个挖掘框架与不同模块之间的结合方法进行改进。其中CSF与KPI是一整个数据挖掘结构的重要环节,挖掘模型的评估是整个数据挖掘的引擎,直接影响到最终的决策。但是,来源于信息环境的反馈对ACMC而言非常重要,在这方面仍需要深入研究,实现ACMC和实际复杂数据环境的合理衔接,进一步提升ACMC策略的实用性。

参考文献:

[1]高武奇,康凤举,钟联炯.数据挖掘的流程改进和模型应用[J].微电子学与计算机,2011,9(07):885-886.

[2]毛伊敏,杨路明,陈志刚.基于数据流挖掘技术的入侵检测模型与算法[J].中南大学学报(自然科学版),2011,4(09):389-391.

[3]张蕴,李伟华.ACMC策略在多维数据挖掘处理过程中的应用[J].西北工业大学学报,2011,6(03):358-359.

作者简介:郭浩(1980.5-),男,江苏沛县人,信息技术部,本科,研究方向:数据挖掘。

作者单位:北方工业大学信息工程学院,南昌 330009

上一篇:浅析企业信息系统主数据及数据元梳理 下一篇:新形势下计算机技术的发展趋势研究