句子情感分析及其关键问题

时间:2022-06-18 07:50:21

句子情感分析及其关键问题

[摘要]情感分析关注具有情感倾向的评价性信息,具有广泛的应用。情感分析按照粒度的不同分为三种:词汇情感分析、句子情感分析和文档情感分析。文中对句子情感分析及其关键问题进行介绍,首先简要描述句子情感分析的任务,然后介绍句子情感分析中主客观句分类方法及两种主观句情感分类方法――基于情感词的方法和机器学习方法,最后对情感分析中的三个关键问题――词汇上下文极性判定、评价主题识别、意见持有者识别进行总结。

[关键词]句子情感分析 词汇上下文极性 评价主题 意见持有者

[分类号]TP391

1、引 言

随着网络的发展与普及,由普通用户发表的包含个人情感倾向的评价性信息越来越多。评价性信息包含四个部分:评价主题、意见持有者、评价和情感倾向,情感分析通过分析和挖掘评价性信息,识别其情感倾向。情感分析根据粒度的不同分为三种:词汇情感分析、句子情感分析和文档情感分析,三者相比较,句子情感分析能够得到评价主题及各个方面特征的情感关系,具有更广泛的应用范围。

本文将句子情感分析作为研究重点,首先简要描述句子情感分析的主要任务,然后介绍了主客观句分类方法以及两种主观句情感分类方法――基于情感词的方法和机器学习方法,最后对句子情感分析中的关键问题进行总结。

2、句子情感分析的任务

句子情感分析的任务是按照句子所表达的情感倾向对其进行识别,包含以下两个子任务:①主观句识别,提取文本中包含的主观句;②主观句的情感分类,识别主观句的情感倾向,通常是褒/贬二元分类。

2.1 主观句识别

主观句识别是对文本进行分析,过滤掉其中的客观句,得到更能反映文本情感倾向的主观句集合。根据词性的不同,Hu Minqing和IAu BingTM将形容词作为主客观句的分界线,当句子中同时包含形容词和评价主题时,即认为该句为主观句。句子之间的关系同样可以作为判定标准,Pang和Lee采用最小图割的方法获取文档中的句子与已知主观句的关系;Yu将事实性文档看作客观句集合,评价性文档看作主观句集合,通过判断句子与这两种文档之间的相互关系识别句子的主客观性。从句子中筛选出具有情感倾向的情感词和短语作为特征,选择不同的分类算法如贝叶斯、K邻近等,采用机器学习的方法进行主客观分类,同样取得不错的效果。基于规则的方法可以从文档中提取精度高、观点清晰的主观句,但需要人工编写语言规则且覆盖面较窄。

从以上研究可以看出,识别文档中的主观句关键是提取句子中包含的情感词或者直接判断,或者结合其它信息作为特征项送入标准分类器中判断。句子的主客观分类能够有效提高文本情感分析的准确度,在以上方法中,客观句的识别一般在80%左右,而主观句的识别比较低,只有60%左右。

2.2 主观句的情感分类

主观句的情感分类是对主观句所表达的情感倾向进行褒贬识别,主要包括两种分类方法:基于情感词的方法和机器学习方法。

2.2.1 基于情感词的方法基本思路是通过判定句子中包含情感词的语义倾向,加上句法结构等信息,间接得到句子的情感倾向。其流程如图1所示:

通过情感词判断句子情感倾向时,yuTM、Kim和Hovy:J、Hu Minqing和Liu Bing首先构建一个情感词集,并为集合中的每个情感词标记正/负整数值作为情感值。

在得到情感词集后,Hu Minqing和Liu Bing通过统计句子中褒义词和贬义词的数量判断句子的情感倾向;Yu将句子中所有情感词的情感平均值作为句子的情感值;Kim和Hovy则将否定词纳入到句子情感倾向的判定之中,采用乘积方法来判断句子的极性,该方法能够处理否定、双重否定对句子情感倾向的反向影响。

采用基于情感词的方法判定句子情感倾向时,能否得到情感倾向准确、包含全面的情感词集是关键,同时也要考虑一些特殊的句法结构对结果的影响,如否定句、比较句等。

2.2.2 机器学习方法:机器学习方法的基本思想是根据已知训练样本求取对系统输入输出之间依赖关系的估计,使它能够对未知输出作出尽可能准确的预测。使用机器学习方法进行情感分类时,分类算法的选择和特征项的选取是最重要的两个方面。运用机器学习方法进行情感分类的过程(见图2)。

PangBo最早将机器学习方法应用于情感分类领域,他分别利用朴素贝叶斯、最大熵、SVM算法对电影评论进行分类,当以unigram作为特征项时,SVM表现最好,准确率为82.9%,最大熵和朴素贝叶斯的效果相当。

与PangBo不同,DavaLg在对几种产品的评论进行情感分类时,采用bigrarn作为特征项训练分类器的效果最好,这表明分类器效果的好坏与所选取的特征项息息相关。

在特征项的选择上,崔彩霞和王素格提出一个特征项选择函数,用来替代传统的文档频率和互信息选择方法。除此之外,王素格等还研究了停用词对中文文本情感分类的影响,它构造了五种停用词表作为特征项选择的依据,实验表明停用词表的选择对文本情感分类的影响很大。

在采用机器学习方法分类时,同时选取形容词、副词、名词作为特征项比选取单一词性的效果要好,对否定词进行处理能明显提高分类的准确性。

在上述机器学习方法中,选取的特征项是相互独立的,然而句子中词汇之间的语义关系对判断文本的情感倾向也很重要。Matsumoto等从句子提取出频繁子序列和频繁子树,与unigram、bigram共同作为特征项,采用SVM方法分类时准确率达到了92%以上。Whitelaw将评价组作为文本情感倾向识别的最小单位,同样采用SVM方法分类,准确率在78%左右,当其它特征项增大文本的覆盖范围时,准确率上升到90%以上。

3、句子情感分类的关键问题

在许多应用中,不但需要对句子的主客观性和整体情感倾向进行识别,还需要深入句子内部分析评价主题和各个特征的情感倾向以及与意见持有者的从属关系。本文从实际应用的角度出发总结出句子情感分析的三个关键问题,下面分别介绍。

3.1 词汇上下文极性的判定

词汇含有两种极性,原极性和上下文极性。原极性指词汇本身的极性;上下文极性指词汇在文本中的极性。在上下文中,由于受到周围词汇影响,词汇的情感强度可能发生变化,甚至与原极性相反。正确识别词汇的上下文极性能够有效提高情感分类的准确率。

娄德成等和徐琳宏等研究了否定词和强度词对词汇极性的影响。前者构建否定词字典和强度词字典,对文本进行词性标注后,根据词性找到词汇间的依存关系,计算词汇的上下文倾向。后者采用否定规则匹配文档中的否定旬,同时处理强度词附近具有明显语义倾向的词汇,得到经过否定处理和强度处理的特征项,分类效果比处理前提高了5%左右。

Wilson等首先判断句子中短语的主客观性,从

主观性短语中选取词汇特征和极性特征,对短语的上下文极性采用机器学习方法判断。同样可以采用人工编写规则的方法来判断词汇的上下文极性,该方法可以达到非常高的准确率,然而查全率很低,并且只能对部分情感表达进行判断。

词汇上下文极性的识别是句子情感分析的关键,然而由于自然语言的差异以及句法结构的复杂性,使得词汇的上下文极性很难判断;另外,人为因素如书写不规范、人造词语等也增加了这方面的困难。要准确地判断词汇上下文极性,还需要吸收一些语言学方面的研究成果。

3.2 评价主题的识别

评价主题包括显性评价主题和隐性评价主题,前者可以直接从句子中得到,而隐性评价主题只能根据句子中词汇之间的关系来判断。

3.2.1 显性评价主题的识别:Hu Minqing和LiuBingTM认为,虽然在一篇文档中会涉及到对评价主题多个方面的评价,但他们所用的词汇具有收敛关系,可以通过关联挖掘方法从文本中得到经常出现和较少出现的评价主题。

娄德成等提出SBV算法及其补充算法,利用词汇间的语义关系从汉语主观旬中识别评价主题。由于汉语语义关系的复杂性和网络中用户评论结构的不规范性,该方法在实验中的准确率只有40%。

天网知名度系统将名人作为评价主题,能够从网络中自动抽取名人的姓名以及相应的评价,但它只能提供名人的总体评价,缺乏对某一方面的具体评价。

苏祺通过对主观句进行词性标注,将名词和名词短语作为候选主题,在对候选主题过滤后进行聚类。该方法不但能识别显性评价主题,还可以得到具有内在联系的评价主题集合。

3.2.2 隐性评价主题的识别:很多情况下旬子中并没有将评价主题显示出来,而是通过一些词语表达。例如“这辆车很灵活”,就隐性地对汽车的操控性进行评价。隐性评价主题的识别依赖于上下文语义分析,目前只有少数的研究涉及。

在隐性评价主题的识别上,可以将评价词汇与评价主题映射,如图3所示:

它在PMI-IR的基础上提出了用于计算评价性词语与评价主题之间相互关系的FB-PMI-IR方法,可以根据值的大小确定评价性词语与主题的关系。例如“漂亮”与“动力性”FB-PMI-IR值为-12.01,与“外观”的值为-4.79,从而可以得到“漂亮”更有可能修饰“外观”。

评价主题的识别是句子情感分析应用的重要方面。在领域中,评价主题及对应的情感词是一个有限集合,两者之间存在着多对多的关系。在通过机器学习识别这些关系时,需要大量的评价文本做支撑,如何获得高质量的标注评价文本,是提高评价主题识别准确率的关键。

3.3 意见持有者的识别

意见持有者是对评价主题进行评价的主体,包括个人、机构等实体,对意见持有者进行识别能够得到某人对某事的具体态度。

一般来说,可以通过命名实体识别将人或机构名作为意见持有者,但该方法的语言覆盖率较差且领域独立性较弱。Kim和Hovy 、Xu和Wong将个人、机构、国家和群体四种实体作为候选意见持有者,前者通过最大熵评测算法从中选取可能性最大的实体作为意见持有者;而后者通过在句子中找到意见算子进而确定意见持有者,同时考虑到修饰实体的词汇及其附近实体对意见持有者识别的影响,如短语“美国总统布什”作为一个整体被看做意见持有者。

Choi等把意见持有者的识别看做是一个信息抽取任务,考虑到句子表达的情感强度,将基于规则的信息抽取和机器学习方法相结合来识别意见持有者。

总体来说,相对于词汇上下文极性的判定和评价主题的识别,句子中意见持有者识别的难度更高,这主要表现在:①一个句子中可能会包含多个评价,需要为每个评价确定对应的意见持有者;②一个句子可能包含多个意见持有者,需要判断它们之间的关系;③需要考虑句子之间评价与意见持有者的关系。

4、结 语

由于在商业方面巨大的应用价值,情感分析受到许多研究机构的重视。在技术上,产生了多种情感特征抽取方法和分类策略;在应用上,基于情感分析的应用系统层出不穷,如意见挖掘系统、舆情分析系统等。但是由于自然语言情感表达方式的多样性,情感分析仍然面临着许多困难,笔者认为,未来情感分析研究的热点主要集中在:

・文本情感强度判断。情感分析不仅得出好/坏、正面/负面这样的二元分类,还应该对句子的情感强度进行分析。例如可以通过加权,为各个情感词设置不同权重的方法对句子及其中包含的主观性短语进行强度分析。

・更有效的特征抽取方法。通过改进现有的或设计新的特征抽取方法,从文本中提取出更能表达文本情感的主题、情感词特征以及影响文本情感倾向的句法信息、特殊词汇等,提高文本情感分类的效率。

・情感语料库的建设。对非频繁特征来说,数据稀疏一直是基于机器学习方法的瓶颈,作为情感分析的知识来源,需要建设大规模情感语料库,在语料的采集、标注规范的制定及语料库应用等方面提供规则。

・中文特殊句法结构处理。汉语表达方式的多样性、句法结构的复杂性使中文文本情感分析更加复杂,其中否定句、比较句是最常见的两种类型,对中文句子的句法分析需要借助于语言学领域的研究成果。

・更广泛的应用。情感分析需要与其它领域相结合,形成更有价值的应用。如可以将情感词、主题等作为查询条件的情感检索;对产品评论进行情感分析后得到规范的情感摘要;识别不同网站相互转载的重复信息、竞争对手的恶意信息等垃圾信息识别等。

・跨领域研究。在目前的情感分析中,情感词本身所表示的情感极性与主题所属的领域密切相关,在大部分情况下,这种领域依赖是不同主题领域中常用词汇变化的结果。当同一个情感词与不同的主题、不同的特征相关联时,可能表达了截然相反的情感极性,这就需要对情感分析的跨领域问题进行研究。

上一篇:日本大学图书馆管理制度刍议 下一篇:基于本体论的高校图书馆个性化书目推送系统