web挖掘技术对管理系统个性化构建的作用

时间:2022-08-11 01:42:42

web挖掘技术对管理系统个性化构建的作用

【摘 要】web挖掘的对象是海量、异构、分布的web文档,以及web服务器日志,在逻辑上是一个由文档节点和超链接构成的图。web挖掘是一个庞大的信息服务中心,包括丰富的动态的超链接信息,以及web页面的访问和使用信息等。半结构化的web数据模型是研究web挖掘、信息检索、智能引擎及web用户访问模式挖掘的前提和重点。个性化的管理系统可以提供一种崭新的智能管理方式,根据每个用户的信息需求和用户的个性化模式,主动搜寻相关信息,并且利用多种在线智能服务准确地将用户所需的信息传送给用户。web挖掘技术是实现个性化信息服务的关键技术,创建符合用户特性的访问模式、需求模式和爱好模式,最终使个性化管理系统构建成为可能。

【关键词】web挖掘;个性化;管理系统

The Role of Web Mining Technology on the Personalized Construction of Management System

ZHANG Li-li

(Changchun Institute of Technology, Changchun Jilin 130012,China)

【Abstract】The object web mining is massive, heterogeneous, distributed webdocuments, as well as the web server log, it’s a graph that is constituted by adocument node and hyperlink in the logic. Web mining is a huge information service center, including the rich and dynamic hyperlink information, web page access, usage information, and so on. Web data model of half structured is a premise and the key on the study of Web data mining, information retrieval, intelligent search engine and user of web access. Management system of personalized can provide a new way of intelligent management, according to the characteristic pattern and needs of user, it searches related information actively, and transmits the information accurately to the user. Web data mining technology is the key technology to realize the services of thepersonalized information, create user’s access characteristic pattern, demand and hobbies patterns, make it eventually possible to constructpersonalized management system.

【Key words】Web Mining; Individuation; Management system

1 web挖掘的基本概念

web挖掘是从web文档和web活动中抽取感兴趣、潜在有用的和隐藏的信息。web挖掘可以在很多方面发挥作用,如对搜索引擎的结构进行挖掘,确定权威web页面,web文档分类,web日志挖掘,智能查询等。

web挖掘虽然是从数据挖掘发展而来,但与传统的数据挖掘相比有独特之处[1]。首先,web挖掘的对象是海量、异构、分布的web文档,以及web服务器日志。其次,web在逻辑上是一个由文档节点和超链接构成的图,因此web文档本身是半结构或无结构的,且缺乏机器可理解的语义。数据挖掘的对象局限于数据库中结构化的数据,并利用关系表格等存储结构来挖掘知识。web挖掘是一个庞大的信息服务中心,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务。还包括丰富的动态的超链接信息,以及web页面的访问和使用信息等。

2 web挖掘的过程

web的基本结构是:客户端—服务器—web服务器。客户端记录的是单个用户访问多个站点的信息,服务器日志记录的是多用户访问多站点的信息,web服务器日志则记录多用户访问单站点的信息[2]。因此,用户访问模式的挖掘有3种类型:客户端、服务器端和web服务器端。根据挖掘目的和应用方向,挖掘用户访问模式的侧重点也不相同。

客户端、服务器端的用户访问模式挖掘[3],与整个web及半结构化的web数据模型直接相关。半结构化的web数据模型是研究web挖掘、信息检索、智能引擎及web用户访问模式挖掘的前提和重点。web服务器端用户访问模式挖掘的重点是用户的频繁访问路径、用户聚类等。

3 管理系统个性化构建的必要性

随着Internet的迅速发展,各种信息正在快速度的增长,信息的种类也越来越多。面对海量的信息,人们无法选择和消化。Internet上信息资源分布的广泛性使用户在查询的同时增加了难度,无法更方便、快捷、有效的发现资源。个性化的管理系统可以提供一种崭新的智能信息管理方式和应用前景广泛,该系统可根据每个用户的信息需求和用户的个性化模式,主动搜寻相关信息,并且利用多种在线智能服务准确地将用户所需的信息传送到相应的用户。这种个性化的系统将用户,信息源和它们之间的关系联系起来。首先根据用户访问站点的行为以及信息需求等资料建立用户个性化模式。然后将信息分类整理,把同类信息聚集到一起。最后建立用户和信息源的对应关系。其中,用户个性化模式的建立,信息源的分类和聚类是智能个性化服务机制的前提和保证,又以用户个性化模式的建立为关键。因为要想有效的实现智能个性化主动服务,关键是获取高质量的用户个性化模式。

4 web挖掘是实现个性化管理系统构建的关键

个性化管理系统不仅需要针对不同的用户需求,更重要的在于发现用户的潜在需求,对其进行主动性的服务,web挖掘技术为解决此问题开辟了道路。web挖掘技术是实现个性化信息服务的关键技术,通过收集用户的各种信息,分析用户数据,从而创建符合用户特性的访问模式、需求模式和爱好模式。同时通过访问路径分析[4]、关联规则发现、序列模式分析、分类规则发现和聚类分析等技术,实现用户建模,最终使个性化管理系统构建成为可能。

【参考文献】

[1]高岩,胡静涛.web数据挖掘的原理、方法及用途[J].现代图书情报技术,2002(3):15-20.

[2]李春,朱珍民,叶剑,周佳颖.个性化服务研究综述[J].计算机应用研究,2009,26(1).

[3]梅中玲.基于web信息挖掘的网络舆情分析技术田[J].中国人民公安大学学报:自然科学版,2007,54(7).

[4]陈才扣,金远平.挖掘基于Web的访问路径模式[J].小型微型计算机系统,2001,22(1).

上一篇:型钢混凝土L形截面柱应用现状的研究 下一篇:善美保定:孟子性善论及其现代价值