基于粗糙集与模糊集理论的图书馆最优购书算法

时间:2022-10-19 01:34:26

基于粗糙集与模糊集理论的图书馆最优购书算法

摘 要 本文将粗糙集理论与模糊集理论结合起来,给出一种图书馆最优选书算法.该算法首先从已知数据的初始信息系统出发,计算各选书方案之间的相似度,从而构造相似矩阵,然后根据相似矩阵的传递闭包对各方案进行聚类,并根据粗糙集理论求各属性重要性,最后利用加权综合的思想及最小距离方法选择最优买书方案.

关键词 相似矩阵;模糊集;最优方案

中图分类号 O159 文献标识码 A

The Optimal Algorithm of Library to Selection Books

Based on Rough Set and Fuzzy Set

ZHAO Liping1,LIU Wenjun2

(1.Changsha University of Science and Technology Library, Changsha,Hunan 410076,China;2.Department of Mathematics

and Computing Science, Changsha University of Science and Technology, Changsha,Hunan 410076,China)

Abstract Combining rough set and fuzzy set theory, an optimal decision algorithm of library to select books was put forward. During this algorithm, firstly, we constructed the similarity matrix from the original information system; secondly, we classified all the programs according to fuzzy clustering; thirdly, an algorithm to choose the optimal program was put forward according to the minimum distance of weighted relative deviation.

Key words Rough set; fuzzy set; optimal program.

1 引 言

图书馆是社会公众文化领域的主阵地,是社会知识信息的存储、咨询中心,也是弘扬社会主义精神文明主旋律的重要载体.随着科技的发展,图书馆不仅在数量上需要增加,而且图书种类也须向多样化发展,图书馆的价值不再仅仅以其所拥有的馆藏图书的数量来衡量,而是以它为用户提供各种形式的信息的能力和质量来衡量.在这种新形式下,图书馆在选书决策时,如何利用目前有限的人力、经费资源,而又使所做决策符合读者阅读或参考,从而为广大读者提供高质量的服务,是目前图书工作者需要认真研究和解决的一个重要课题.

在实际过程中,由于影响购书决策的因素很多,且大多数具有模糊性与不确定性,所以在处理这类问题时,可以结合不确定性理论.本文就是基于这种想法,结合粗糙集与模糊集这两种不确定性理论,给出一种图书馆最优选书算法.

2 粗糙集相关知识简介

粗糙集理论[1]是由波兰学者Z.Pawlak在1982年提出的一种处理含糊和不确性问题的新型数学工具.经过20多年的发展,该理论已渗透到人工智能的各个分支,在机器学习、决策分析、过程控制、模式识别与数据挖掘等领域取得了成功的应用[2-6].该理论的一个最大优点是它无须提供问题所需处理的数据集合之外的任何先验信息, 能客观有效地分析和处理不精确、不确定与不完全数据,并从中发现隐含的知识,揭示潜在的规律.

为了处理智能数据,粗糙集理论将知识进行符号化,将所要研究的数据用一个信息系统的形式给出,信息系统的基本成分是研究对象的集合,关于这些对象的知识是通过指定对象的基本特征(属性)和它们的特征值(属性值)来描述.信息系统的数据以关系表的形式表示,关系表的行对应要研究的对象,列对应对象的属性,对象的信息是通过指定对象的各属性值来表达.

3 聚类分析

对数据进行模糊聚类分析,一般有数据规格化、建立模糊相似矩阵、聚类三大步.

第一步:数据规格化

在实际应用中,不同的数据可能有不同的量纲和数量级,故在运算过程中可能突出某数量级特别大的特性指标对分类的作用,而降低甚至排除了某些数量级很小的我一指标的作用,致使对各特性指标的分类 缺乏一个统一的尺度,为了清除特性指标单位的差别和特性指标数量级不同的影响,必须对各指标值施行数据规格化的处理,从而使每一个指标值统一于某种共同的数值特性范围.

设U={u1,u2,…,un}为被分类的对象,每个对象有m个指标描述,即对第i个对象有ui={xi1,xi2,…,xim} (i=1,2, …,n), 则对应的数据信息见表1:

6 小 结

随着科学技术的发展,社会对人才的要求最来越高,而图书馆的建设与发展是提高人们素质的一个重要基础.在新形势下,各图书馆如何针对自身的特色,选择适合读者研究需要和阅读参考的图书,是图书馆面临的一项重要任务.本文结合模糊集与粗糙集理论,对拟选图书根据给定的条件进行计算分析,为馆员提供最佳选择方案,从而让馆员在有限精力的条件下选择确定合适图书.节省了馆员的时间,同时也可以使做出的购书决策更全面地符合实际需要.

参考文献

[1] Z PAWLAK. Rough set:theoretical aspects of reasoning about data[M]. Dordrecht:Kluwer Academic Publishers,1991.

[2] Y Y YAO, Y ZHAO. Attribute reduction in decision-theoretic rough set models[J]. Information Sciences, 2008,178(17): 3356-3373.

[3] 胡清华,谢宗霞,于达仁.基于粗糙集加权的文本分类方法研究[J].情报学报,2005,24(1):91-100.

[4] 王国胤,张清化.不同知识粒度下粗糙集的不确定性研究[J].计算机学报,2008,31(9):1588-1598.

[5] 史忠植. 知识发现[M].2版.北京:清华大学出版社, 2011.

[6] 王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J]. 计算机学报,2009,32(7): 1229-1243.

[7] 张振良. 模糊集理论与方法[M].武汉: 武汉大学出版社, 2010.

[8] 梁保松, 曹殿立. 模糊数学及其应用[M]. 北京: 科学出版社, 2007.

上一篇:风险规避和最优套期保值比率 下一篇:小米是怎样炼成的