在线产品评论研究综述

时间:2022-08-04 07:21:33

在线产品评论研究综述

[提要] 本文从在线产品评论的特征、作用和分析技术三个方面对目前该领域的研究现状进行综述。

关键词:在线产品评论;文本评论;文本挖掘技术

基金项目:教育部人文社会科学研究青年基金项目:“网页中产品属性文本信息对消费者购买决策的影响机制研究”(编号:14YJC630204)

中图分类号:F724.6 文献标识码:A

收录日期:2015年5月31日

网络购物用户在网上购物时很多人都会浏览参考其他人对商品的评论信息,并且在购物后进行在线评论。2006年开始对在线产品评论的研究不断增多(李恒,2015)。由于该研究主题涉及信息系统、电子商务、消费者行为、图书与情报科学等多个不同领域的交叉,相关研究文献较难得到系统性的整理。本文拟从在线评论的特征、作用、分析技术这三个方面对这些文献进行梳理。值得注意的是,由于文献涉及范围过于广泛,为了使本文综述主题聚焦,文中关于在线评论的文献仅局限于商家购物网站的购买者评论,也称为在线产品评论。其他在线评论或者在线口碑形式不在讨论之列,比如第三方平台的评论(影评、试乘试驾评论、点评网站评论等)、社交媒体中的产品或企业评论(各类口碑、舆情、内容营销及互动等)。

一、在线产品评论特征

李恒(2015)把消费者的在线评论特征总结为分属于评论星级和文本评论两种形式下的12种维度。其中,评论星级指的是购买者对该次购物的总体评价。这种形式中没有分出更多的维度,因此评论星级就是一个维度。在文本评论这一形式中,有评论标题、评论内容一般特性、评论内容的语义特征、评论内容的时间特性这四类。在这四类中分别包含了评论标题、评论质量、评论数量、评论长度、评论差异性、评论效价、评论类型、评论可读性、评论强度、评论及时性、评论时效性等11个维度。这12个维度具体的隶属关系以及其研究焦点属性本文将其整理至表1中。接下来本文针对表1中的各种在线评论特征维度和其研究焦点属性逐一进行解释。(表1)

评论星级指的是购买者对该次购物的总体评价。这种形式中没有分出更多的维度,因此评论星级就是一个维度。通常的研究焦点在于评论星级的极端性与中立性的作用。以大部分购物网站采用的五星评分制度为例,评论星级的极端性即一星为代表的极端负面评价与五星为代表的极端正面评价,而三星反映中立态度。

接下来的文本评论中包含了网购用户有文字留言内容的评论中的各种特性的研究维度。大略可以分为文本评论标题和文本评论内容两类,文本评论标题是评论者对评论内容的文本概括,在除了在线产品评论以外的在线评论中比较常见。通过评论者自拟的标题使浏览者容易从标题的关键词以及总体情感倾向中搜索以及快速知晓评论整体内容,但是在购物网站的用户评论中设置标题的并不多,比如国内的淘宝、京东等购物网站的用户评论中均没有设置文本评论的标题。因此,本文中不再赘述。文本评论内容就是网购用户用文字留下的购买感受的评价内容,李恒(2015)将其特性分为一般特性、语义特征和时间特性三类。本文在介绍完表1这些特征之后,再对其中未包含的一些特征进行补充。

评论内容的一般特性包括评论的质量、数量、长度和差异性。其中,数量和长度比较好理解,就是该产品下购买者的累计评论的总数和评论的文字字数长度,其研究属性也是总数和字数长度的计量值。评论质量特性借鉴了霍夫兰德的说服模型中信息内容对说服效果的影响作用,强调了在线产品评论作为消费者用来参考购买的有用信息,信息的浏览者对于产品评论信息的真实性、可靠性、内容与其所评价的产品的相关性以及是否为后续购买者提供了大量有用的信息这几个方面的主观感知(郭国庆,2010;李宏,2011)。其研究属性也基本围绕这几个有关信息质量评价的主观因子展开。评论差异性,即评论离散度,能显示不同评论中购买者态度或观点上的分歧程度。其研究属性通常采用评论者对网络平台设置的评分项打分的方差或标准差来度量。

评论内容的语义特征包括评论的效价、类型、可读性和强度,这些特性都与文字评论的文本内容的表达有关。简单来说,效价代表了文本内容的词语描述中总体体现出来的情感倾向,其研究属性有正面、负面和中立(或综合)之分;类型代表了文本词语中对产品属性及其体验的描述是客观还是主观之分;可读性代表了评论文本词语中每个评论者其自身带有的语言习惯表达、拼写、词汇选择、句长句式语法等是否容易让浏览阅读的人理解,因此其研究属性也是浏览评论者的一种主观性的感知(Korfiati,2012);强度代表了评论文本词语措辞中表现出的情感态度的强烈程度,其研究属性主要集中于浏览者对负面口碑中负面情绪强度的感知程度(黎小林,2007)。

评论内容的时间特性包括及时性和时效性,这两条特性与评论的时间信息有关。评论及时性代表评论时间与购买时间的间隔远近,研究属性是评论发表的天数,但是究竟天数长好还是短更好可能并不是简单的线性关系,因此到底是否及时的判断也就比较模糊了;而时效性代表评论时间与现在(浏览时间)间隔远近,以及是否在最近有频率较高的密集评论,这反映了该产品的近期火热与流行程度,研究属性是评论浏览者对时效性强与弱的主观评价(刘逶迤、逯万辉,2010;郭国庆等,2010;龚思兰等,2013)。

其他表1中未提及的较为重要的特性还有评论者特征等等。评论者的特征包括评论者是否匿名(身份知否披露)、评论者的专业性、评论者的声誉、排名等等(Racherla P,Friske W,2012;Hyunmi et al.2012)。这个部分我们只是将这些现有研究中涵盖的特征进行了简单归类和罗列,其中有些特征在技术、功能和研究范式发展过程中会出现不同程度的交叉重叠和所属类别上的变化,在后文中会有所提及。

二、在线产品评论作用

以上谈到的是在线产品评论的特征,对于在线产品评论的功能研究者们也有所探讨。在线评论的功能一方面包含有大量产品属性、使用价值方面的描述信息可以给潜在购买者信息上的借鉴,帮助他们降低不确定性风险;另一方面评论中含有大量购买的情感体验和表达信息,对商品有强大的推荐作用,大量比较集中的正面或者负面评论会引起潜在购买者的从众行为,影响他们购买或者不购买的最终决定。遵从这些意见购买产品(Park DH,et al.2007;Duan W J,et al.2008)。关于评论功能的衡量焦点主要集中在评论信息质量(评论有用性),评论可信度和消费者态度形成与改变以及具体的销量数据等。

Mudambi和Schuff(2010)从信息经济学中信息的诊断性角度定义了评论信息质量。早期的评论信息质量的评价并不局限于文本评论,但随着研究者对评论内容特征的关注,评论质量越来越多用来反映文本评论内容对浏览者的信息参考价值。正如上文中提到对于文本评论而言评论质量包含真实性、可靠性、相关性、有用性四个方面。借鉴技术接受模型TAM中人们接收新技术会受到对新技术感知有用性的影响这一思路,评论质量中关于评论有用性的评价指标更加受到重视,并成为判断评价信息功能的主要研究变量。早期的评论有用性研究将评论星级及评论长度作为评论有用性的衡量指标,其好处是指标简单,易量化。后期产品评论研究的重点转向文本内容认知,对于文本内容有用性的划分采用了评论长度和可读性两个维度来衡量,有的研究中也将评论有用性定义为评论感知价值(Schindler&Bickart,2012)。由于当前对文本内容分析的方法是基于文本语义属性的挖掘方法,对于在线产品评论相关特征的数据采集和统计大都是通过网络信息搜索软件实现,因此目前评论有用性的衡量通常是用网站中评论有用性的排名数据统计来替代。但是并不是所有购物网站的评论系统中都会设置评论是否有用这一浏览者打分机制,并且受到文化的影响,即便网站设置了这一功能,国内的消费者也没有去给评论打分的习惯。因此这种衡量方式的有效性也一直受到争议。

研究中与评论有用性常常共同出现的一个衡量评论的功能的变量就是评论的可信度。由于在交流有关研究领域发现可信度与劝说性之间的强相关,可信度被用来作为评论信息是否对潜在消费者态度以及行为有强的劝说性的衡量指标。从信息传播的角度来说,信息源、消息和接受者是信息评价的3个主要的信息元素。因此相比于有用性,在线评论的可信度更强调从评论强度、信息源的可信度、评论间的一致性、评论累积排名等维度来度量,从已有的研究文献来看,其中又主要侧重于对信息源可信度的判断,也就是对评论者的可信度的判断(Cheung等,2009)。Lis(2013)将信息源的专业度和值得信任程度作为信息源可信度的衡量标准和评论排名一起作为评论可信度的决定因素,其中值得信任程度中包含评论内容的质量、与其他评论的一致性以及其他消费者对评论的认可这几个方面。因此,评论可信度与评论有用性是有交叉又各有侧重的两个研究变量。研究者会根据研究方法以及目标选择其中合适的变量作为对评论功能的衡量。不过由于目前侧重于文本评论数据挖掘的研究方法所限,还是以有用性的排名统计作为评论价值功能的衡量更多见。

其他还有一些研究变量,比如将浏览者看完评论信息以后持有的态度作为衡量评论功能实现的衡量指标,比如对产品的购买意愿、感知的产品质量、满意度、忠诚度等(Reyes A & Rosso P,2012;Chang & Yen,2013),以及直接用企业经营数据,比如产品的销量、企业收入、公司股价来作为评论的作用,不过后两者多用于第三方评论或者公众舆论有关的评论效果研究中,与在线产品评论有关的经营数据最主要的还是被评论产品的销量数据(Sonnier等,2011)。

三、在线产品评论分析技术

在线评论信息挖掘研究集中在信息系统、电子商务管理科学等领域。近几年,在线评论信息挖掘日益成为在线产品评论研究的热点,由于文本挖掘技术的研究进展还处于不太成熟的阶段,各领域中计算机科学和信息科学领域对文本挖掘技术的研究居多。文本挖掘技术和自然语言处理等技术现在已经能对半结构化和非结构化数据进行挖掘,在线评论的表现形式为数量众多且非结构化的文本,但是如何提高对在线评论的挖掘精确度也一直是技术研究领域关注的焦点。目前,在挖掘技术上的研究集中于信息抽取、情感分析和文本分类这三类主流研究方法。信息抽取是情感分析的基础,同时信息抽取和情感分析又是文本分类的基础。信息抽取主要是通过对评论中描述产品性能或功能的名词或短语进行关键词的抽取,情感分析是通过语义分析对评论中需要联系上下文才能理解评论者表达效价进行情感倾向的判断,挖掘出的信息结果包括抽取的主题特征 (价格、质量、外观等)、情感倾向 (正面、中立、负面)、文本类别(主题和情感类别)。以情感分析为例,当前所广泛采用的文本语义属性分析的挖掘方法是不够成熟的,无论是词语极性推测法、点互信息法、抽取主观表达式法还是构造情感词典法,都是基于文本内容字面信息的加工和处理,而文本内容所包含的潜在信息却是无法挖掘的,如说话人的语言风格所反映出的评论人所属的用户群体或专业程度等,因此仅从字面来进行情感倾向的判断存在一定的不精确性。

但是也有越来越多的学者在信息抽取和文本挖掘的基础上从实证研究角度对在线评论的有用性、对消费者态度以及商家销量的影响等进行研究。有学者利用主题特征信息抽取技术从在线评论中抽取产品特征和主题信息,并以此研究发现评论中消费者提及最多的产品主题特征并不一定对他们的满意度影响最大(You WJ,et al.2012)。Cao等(2011)运用潜在语义文本分析文本挖掘法(LSA)应用logit回归模型研究了评论星级、评论时间、评论字数、评论中包含的句子数、语义特征(评论中的情感倾向)对评论有用性投票数的影响,经过发现评论的语义特征对评论有用性影响最大。Min和Park(2012)从评论者经验这一角度出发应用文本挖掘和实证分析方法研究如何根据评论者经验识别出高质量评论。还有研究者通过对手机评论进行情感分析,识别手机是否存在过度的功能设计并以此获得更多的顾客满意度来提高销售绩效(Liu P,et al.2010)。未来随着文本挖掘技术的进步,分析精确性不断提高,相信这类结合实证方法证明在线产品评论商业应用效果的研究也会越来越多并得出更有价值的结论。

四、结语

综上所述,在线产品评论现阶段为止的研究有以下三个方面的特点:第一,研究中关于在线产品评论的一般特征,内容特征,评论者特征等等这些特征形式早期研究较多。虽然在研究发展过程中会出现不同程度的交叉重叠和所属类别上的变化,但随着购物网站评论体系设置的成熟化,这些特征形式基本稳定下来,并且主要的特征属性都集中在评论文本的特征描述中,这也说明了文本评论的重要作用。因此,现阶段的研究主要集中于评论文本内容的深度挖掘带来的新的特征属性;第二,文本挖掘技术和自然语言处理等技术现在已经能对半结构化和非结构化数据进行挖掘,而在线评论的表现形式为数量众多且非结构化的文本,如何提高对在线产品评论的挖掘精确度也一直是技术研究领域关注的焦点。正因为文本挖掘技术的研究进展还处于不太成熟的阶段,现阶段的挖掘主题比较少,情感分析精度也不够高,因此其他领域即便将现有挖掘技术应用于实证研究中,也难以得到稳定的和有价值的结论。相信未来随着文本挖掘技术的进步,这类结合实证方法证明在线产品评论商业应用效果的研究也会越来越多,并得出更有价值的结论;第三,在商业应用研究领域,如何选取合适的研究变量和指标,比如消费者行为变量及观测指标来与文本挖掘技术得到的计量数据相结合,从而实现更准确有价值的实证研究,也是在研究方法上需要继续探索和解决的问题,比如目前用网站评论有用性的排名数据统计来替代评论有用性度量的方式过于单一且准确性受到质疑。

另外,还有两个在线产品评论研究中比较集中的主题未来也可能会继续发展:一个是购买者参与评论的动机及其在社交网络中的作用;另一个是对购物网站上越来越多出现的虚假评论现象的研究,目前的研究集中在虚假评论的识别以及其影响方面,未来随着消费者的经验增加以及网站成熟运作,这方面的研究还会有新的热点出现。

主要参考文献:

[1]李恒.在线评论特征的维度综述[J].企业技术开发,2015.1.

[2]李宏,喻葵,夏景波.负面在线评论对消费者网络网络购买决策的影响,一个实验研究[J].情报杂志,2011.5.

[3]龚思兰,丁晟春,周夏伟,巢乃鹏.在线商品评论信息可信度影响因素实证研究[J].情报杂志,2013.32.11.

[4]宋晓晴,孙习祥.消费者在线评论采纳研究综述[J].现代情报,2015.1.

[5]罗彪,丛日飞.留、传、搜、用:消费者行为视角下的电子口碑研究综述与展望[J].外国经济与管理,2015.37.8.

[6]You WJ,Xia M,Liu,L,et al.Customer knowledge discovery form online reviews[J].Electron Markets,2012.7.7.

[7]Cao Q,Gan QW.Exploring determinants of voting for the helpfulness of online user reviews:A text mining approach[J].Decision Support Systems,2011.11.9.

[8]Min H,Park JC.Identifying helpful reviews based on customer’s mention about experiences[J].Expert Systems with Application,2012.39.1.

上一篇:强化电子天平检定建立诚信计量 维护市场公平 下一篇:河北省农村公共文化服务体系建设研究