语义在网络答疑系统中的应用

时间:2022-10-24 02:05:37

语义在网络答疑系统中的应用

【摘 要】无论是基于关键词匹配算法还是基于知识库的答疑系统其智能性和准确率都受到语句相似度计算这一关键技术的影响。通过分析当前的几种语句相似度计算方法的不足,提出一种语义相似度计算方法,该算法可保证语句的一个分句或短语整体发生长距离移动后,仍与原来的语句很相似,智能性和准确性都很高,系统具有实用性。

【关键词】智能;答疑系统;语句相似度计算

1.引言

答疑解惑是教学过程中不可缺少的环节,智能答疑系统成为目前自然语言处理领域的一个研究热点,它既能够让学生使用自然语言语句提问,又能够为学生返回一个简洁准确的答案,丰富了教师与学生之间沟通的交互形式,由于其不受时间和空间限制,能实时回答问题提高了学习的效率。

智能答疑系统的知识库多采用问句-回答集(Frequent Asked Questions, FAQ)的形式,答疑时系统先计算用户问句与FAQ中问句相似度,列出一个或多个相似度最高的问句供用户选择,或直接以相似度最高的问句对应的答案作为回答[1]。在研究中发现其中一个制约智能答疑系统的关键技术是句子相似度计算技术,传统方法是基于浅层的句法分析,没有深入到深层的语义分析,文中试图在语句相似度计算的问题上进行探讨,提出一种新的语句相似度计算方法,该算法可保证语句的一个分句或短语整体发生长距离移动后,仍与原来的语句很相似,智能性和准确性都很高,进而大大的提高了答疑系统的智能性和准确率。

2.相似度计算

语句相似度计算是智能答疑系统的一个关键技术,语句相似度计算方法的好坏直接影响着答疑结果的智能性。本文通过对当前的几种语句相似度算法进行分析,并结合实际情况,指出这几种算法所存在的不足,提出了新的语句相似度计算方法,该算法克服了其他算法的不足,可保证语句的一个分句或短语整体发生长距离移动后,仍与原来的语句很相似。

2.1 语义的定义

该计算方法需要一定的知识资源作为基础,建立知识资源树需要花费大量的时间和精力,而且并没有考虑词语在句子中的权重,同时对一个语句的分句或短语发生整体的移动后的相似度计算也存在的一定的不足,没有充分利用问句文本与FAQ中的其他相关信息,为此本文提出新的语句相似度计算方法,该算法从语句的词形、语句长度、词序三方面来考虑语句的相似度,应用于答疑系统中能够极大地提高系统的智能性和准确性。

2.2语义相似度计算

语句相似度是指两个语句相似的程度达到某个设定阀值,就认为这两个语句相似。下面分别从词形相似度、词序相似度[4]和语句长度相似度来进行新的语句相似度计算。

(1)词序相似度

(2)词形相似度

3.语句长度表

5.结束语

文中在分析了基于语义和基于向量空间的语句相似度计算不足的基础上,主要提出一种新的语句相似度计算的方法以,并详细介绍了该方法可保证语句的一个分句或短语整体发生长距离移动后,仍与原来的语句很相似。最后将该方法运用到智能答疑系统中,从而使得系统的准确率得到进一步的提高,也使得智能答疑系统的智能性得到进一步的体现,语句相似度计算是关键技术之一,相似度计算的改进和完善可以使用户得到的答案的准确率得到提升。

致谢:

内蒙古自然科学基金项目支持(资助号:2011MS0916)

内蒙古科技大学教改项目支持(资助号:JY2010024)

参考文献:

[1]Guo Xiaoyan, Zhang Bofeng, Fang Ai-guo. Research on question similarity algorithm for intelligent question answering system and its implementation[J], Computer Applications, 2005, 25(2): 449-452.

[2]郭晓燕,张博锋,方爱国.智能答疑中问题相关度算法研系统实现[J].计算机应用, 2005, 25(2): 449-452.

[3]Wang Yang,Qing Bing,Zheng Shifu,Sentence similarity calculation in FAQ application .http://.Cn

[4]Dong Zhendong,Dong Qing. hownet.http://

[5]The Protégé Ontology Editorand Knowledge Acquisition System [EB/OL]. [2009-08-16].http: // protégé. standford. edu/.

[6]Roussionv D,Robles J.Self-learning Web question answering system[C]//World Wide Web conference(WWW2004).New York,US:ACM,2004:400-401.

[7]Wang Rong-bo; Chi Zhe-ru.A Similarity Measure Method of Chinese Sentence Structures[J]. Journal of Chinese Information Processing,2005,19(1):21-29.

[8]王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29.

[9]Boris Katz,Gregory Marton,Gary Borchardt,et al.External knowledge sources for question answering[R].Proceedings of the 14 th Annual Text RetrievalConference(TREC2005)[C]. Gaither sburg,US:MD,2005.45-53.

上一篇:电视广告中的情感诉求运用方式 下一篇:汽车电路故障诊断与教学研究