在线商品评论的效用分析研究.pdf
《在线商品评论的效用分析研究.pdf》由会员分享,可在线阅读,更多相关《在线商品评论的效用分析研究.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 15 卷第 5 期2012 年 5 月管理科学学报JOURNAL OF MANAGEMENT SCIENCES IN CHINAVol 15 No 5May 2012在线商品评论的效用分析研究杨铭,祁巍,闫相斌,李一军(哈尔滨工业大学管理学院,哈尔滨 150001)摘要:大多数电子商务网站为消费者提供相互交流的平台来发表其针对某件商品的评论 但是,随着在线商品评论的数量不断增加,潜在消费者越来越难从中发现有助于制定购买决策的信息 因此,如何从众多的评论中识别有用的评论,分析在线评论的效用成为关注的热点 本文对在线商品评论效用分析的最新研究进行评述,认为该领域的研究需要充分关注消费者的购买决
2、策过程,进而设计新的数据挖掘方法更好地辅助消费者的购买决策,同时为电子商务网站的运营商调整营销沟通策略提供决策支持关键词:电子商务;在线商品评论;信息过载;效用评价中图分类号:F272 5文献标识码:A文章编号:1007 9807(2012)05 0065 110引言许多消费者在电子商务网站进行交易之后,会对所购商品进行评分,发表评论,阐明使用商品和接受服务后的体验作为 B2C 电子商务网站的显著特征,在线商品评论不仅增加了消费者对 B2C 电子商务网站的认知有用性,而且提高了 B2C 电子商务网站的社会认可性1 作为一种反馈机制,在线商品评论不但促进了 B2C 电子商务网站与消费者的双向互动
3、,而且促成了大规模的口碑网络2 作为电子口碑(electronicword-of-mouth),在线商品评论显著地影响着消费者的购买决策和 B2C 电子商务网站的产品销售3 一方面,在线消费者常常通过衡量他人对某件商品的评论来制定自己的购买决策;另一方面,商品制造商可以从在线商品评论中获得启发,从而支持广泛的管理活动,如品牌塑造、客户关系管理、产品研发以及质量管理2 不论买家还是卖家,作为在线商品评论的读者都希望从中获得有助于制定决策的信息 然而,针对一件商品的在线商品评论往往数量众多而且内容质量参差不齐,这使得消费者很难把目光聚焦在最有价值的评论上,进而迅速制定购买决策 许多B2C 电子商务
4、网站,如亚马逊、当当、京东,提供在线商品评论的效用评价功能(如图 1 所示)依据每条评论获得的“有用”投票数占总投票数的比例对商品评论进行排序,获得支持票数越多的评论,其排名越靠前 但是这种全然依靠人工判断的效用评价机制很难真正地将高品质的在线商品评论准确而及时地呈现在消费者面前 例如,新近发表的在线商品评论需要很长时间来获得消费者的累计“有用性(helpful-ness)”投票,这导致很多高品质的评论由于没有及时获得足够的赞成票而被淹没在数量庞大的信息海洋中另外,在这种人工效用评价机制下,绝大多数在线商品评论被认为是“有帮助的”,消费者依然面临信息过载的挑战 在线商品评论的效用分析是指应用数
5、据挖掘的方法自动识别电子商务网站中那些对消费者制定购买决策有帮助的商品评论收稿日期:2010 11 05;修订日期:2011 07 04基金项目:国家自然科学基金资助项目(70601009;70890082)作者简介:杨铭(1982),男,内蒙古丰镇人,博士生 Email:yangming hit gmail com图 1卓越亚马逊网站上的商品评论效用评价Fig 1 A review utility evaluation on Joyo Amazon cn由于在线商品评论通常具有较强的主观性,消费者不得不揣测每条评论中的观点是否合理,还要综合权衡多方观点 有时甚至是相互冲突的观点4 具体而言,
6、潜在消费者需要对所看过的评论做出综合判断 为了缓解在线商品评论信息过载给消费者造成的负担,很多 B2C 电子商务网站提供商品的综合得分,即计算所有评论者给某件商品的评分的平均值 然而研究表明,消费者提供的商品评分呈双峰分布,这个得分只是折 衷 反 映 了 两 个 评 价 极 端(即 好 评 和 差评)5 但是,饱含强烈极性(如赞美、批评)与作者个人观点的在线商品评论也许并不可靠,或者对其他消费者的购买决策并没有帮助4 例如,某件商品的平均得分是 4 星,只能表明购买该件商品的所有评论者对这件商品的平均评分是积极的,而不能反映消费者对这件商品的意见 因此,B2C 电子商务网站所呈现的某件商品的平
7、均得分可能是误导性的推荐为解决当前 B2C 电子商务网站对在线商品评论的效用评价的局限性,学术界提出了一系列基于文本挖掘和信息质量评价理论的解决方案Liu 等6 认为对潜在消费者购买决策有用的在线商品评论取决于 3 个因素:评论者的经验(ex-pertise),评论的写作风格(writing style)和评论的时效(timeliness)该研究通过从 IMDB 影评数据集抽取相关属性建模拟合以上 3 个因素,进而构建非线性的回归模型,预测评论的有用性 Ghose 和 Ipeirotis7 则认为在线商品评论内容中的观点主观性(subjectivity)有助于预测评论的效用 Otterbach
8、er8 却认为评论的内容质量(message quality)是评价在线商品评论效用的重要方面 可以看出,以往研究对于影响在线商品评论效用的因素没有统一的看法在这种情况下,使用不同的数据挖掘技术,不同的数据集,以及不同的算法评价指标,会得出千差万别的结论 这些结论可能会使电子商务网站IT 人员感到无所适从本文从在线商品评论效用评价涉及的 4 个维度 评价目标、特征选取、评价方法和评价对象 梳理了近几年该领域的研究,分析了已有研究中存在的问题,并且针对这些问题提供了未来的研究方向和阶段性成果1效用评价研究的分类在线 商 品 评 论 的 效 用 评 价 是 基 于 CMC(computer med
9、iated communication)文本模式的分析 这类研究需要准确地评价、总结、表示CMC 文本,尤其是 CMC 主体内容的文本(如在线商品评论的主体文本内容)9 尽管前人对在线商品评论的文本分析进行了大量研究,但以往的研究主要集中在观点挖掘和情感分析两方面这主要有两方面的原因:首先,在线商品评论的内容富含观点与情感相关的内容10;其次,主观性是商品评论的固有特性,其中蕴含的商业价值使得商品评论成为情感分析与观点提取的重要研究对象4 与观点挖掘和情感分析类似,在线商品评论的效用评价研究要素包括评价目标、评价特征、评价技术和评价对象的选取11 按照这些要素和相应的维度划分,表 1 分别对以
10、上4 个要素进行了解释 在此基础上,表 2 对在线商品评论效用评价的国内外研究现状加以概述以下将从在线商品评论效用评价涉及的 4 个维度:评价目标、特征选取、评价方法和评价对象,梳理近几年该领域的研究,进而分析当前研究中存在的问题66管理科学学报2012 年 5 月表 1在线商品评论效用评价的研究分类Table 1 A taxonomy of online review utility evaluation研究要素维度划分描述/举例标识评价目标排序汇总分类依据评论的效用得分以降序呈现评论内容归纳汇总某件商品的所有在线商品评论区分高品质的评论G1G2G3评价特征语法特征语义特征体裁特征元数据Wo
11、rd/POS tag n-grams,措辞模式,停顿极性标识,评价组,文脉特征文体风格的词汇和结构测度评论的得票数,发表时间,商品评分F1F2F3F4评价技术机器学习相似度得分支持向量机,支持向量回归短语模式匹配,词频数T1T2评价对象实用型商品享用型商品数码相机,电脑,MP3 播放器等书籍,电影,音乐等D1D2表 2在线商品评论效用评价部分研究汇总Table 2 Selected previous studies in utility evaluation of online product reviews研究论文评价特征评价技术评价对象评价目标F1F2F3F4T1T2D1D2G1G2G3K
12、im 等13 Liu 等6 Liu 等17 Jindal 和 Liu18 Zhang4 Weimer 和 Gurevych12 Miao 等14 Mudambi 等38 1 1在线商品评论效用评价的目标由于在线商品评论不仅数量众多,而且信息质量参差不齐 解决这一信息过载(informationoverload)问题,并把有助于潜在消费者制定购买决策的有用评论及时呈现出来,涉及对在线商品评论的效用进行评价 当前研究中,对在线商品评论的效用评价目标主要体现在以下 3 个方面:对评论进行自动排序、归纳汇总和内容分类对评论进行自动排序就是按照评论的有用性得分,将高品质的评论及时呈现在潜在消费者面前 例
13、如,一些研究人员提出了两类基于效用得分的商品评论排序机制:面向顾客的排序机制 依照顾客的预期效用对评论进行排序7,13;面向厂商的排序机制 依据厂商对某商品的预期销量对评论进行排序7 还有的研究人员提出了观点搜索系统,该系统在对评论进行排序时考虑了信息质量的时间维度和主题相关性,从而可以满足潜在顾客的个性化需求14 即使网站能自动对在线商品评论的效用进行排序,消费者仍需要仔细揣测每条评论中包含的观点,有时甚至要权衡多方提出的对立观点 很多消费者可能会因此而无所适从,因此,消费者还需要了解所有评论者对某件商品的综合评价以及评论的归纳汇总 这有助于消费者迅速做出购买决策,缓解信息过载给消费者造成的
14、负担 当前 B2C 电子商务网站是基于消费者评分的平均值,归纳汇总某件商品评论信息,但这种综合评价的合理性受到以下两个事实的挑战 首先,实证研究表明商品评分呈现双峰分布,即消费者要么给予商品很高的评价,要么给予差评5 也就是说,消费者给某件商品的评分主要集中在76第 5 期杨铭等:在线商品评论的效用分析研究“4 星”以上和“2 星”以下第二,蕴含较强极性(赞美的或者批评的)和个人观点的商品评论可能并不可靠,或者对消费者的购买决策没有帮助4 例如,某位消费者在对某品牌豆浆机的评论中写道:“因为价格便宜,因为女儿爱喝豆浆,所以买了这款豆浆机现在每天都在用,真的很好用,物有所值”这篇评论的极性显然是
15、积极的,作者持赞成的观点 但是,这篇评论没有详细说明这款豆浆机究竟如何好用 所以这篇评论可能对其他消费者的购买决策基本没有帮助 因此,当前 B2C 电子商务网站提供的商品评价汇总并不能真正反映所有消费者的观点,而只是折衷反映了两个评价极端(即好评和差评)5 对某件商品的合理评价汇总需要考量每条评论的效用和极性Zhang4 利用以下加权方法计算所有评论者给予某件商品的综合评分V(P)=ni=1 u Ti(P)Polarity Ti(P)ni=1u Ti(P)(1)其中,V(P)表示所有评论者对某件商品P的综合评分,Ti(P)表示针对商品 P 的 1 篇消费者评论,u Ti(P)表 示 评 论Ti
16、(P)的 效 用,Polarity Ti(P)表示评论 Ti(P)的极性 V(P)是商品 P 的所有评论极性的加权平均值 另一种解决评论信息过载的手段是归纳所有评论 Hu 和Liu15 提出了对客户评论进行观点挖掘和归纳的方法,该方法由以下 3 步构成:1)识别客户评论中出现的产品特征;2)就每一产品特征,识别评论中含有积极观点的语句或者消极观点的语句;3)对上述产生的信息进行归纳 在此研究基础上,一些学者通过分析评论内容的内部主题结构对评论进行概括,从而归纳消费者所关注的事物16 但是,对在线商品评论进行概括的过程中很少有人强调评论的内容质量控制此外,对评论内容按照特定标准进行分类也是评论效
17、用评价的目标之一 比如,由于在线商品评论在文本编辑方面缺乏质量控制,垃圾评论(review spam)比比皆是,这就有必要区分所发表的评论是否是垃圾评论 Liu 等17 给出了测度在线商品评论质量的规范 依据这一规范,人工标记从亚马逊网站收集的在线商品评论 再用标记后的在线商品评论训练和验证基于统计学习理论的分类算法 支持向量机,最后利用该分类器自动侦测垃圾评论 Jandal 和 Liu18 则认为在线商品评论中存在故意误导其他消费者的垃圾信息,他们把垃圾评论分成 3 类:评论中包含错误的观点,仅对某一品牌进行评论,评论没有包含任何观点 依据这一分类,他们制定了以下侦测垃圾评论的策略:1)侦测
18、抄袭或者近似抄袭的评论;2)用人工标记的样本训练有监督的机器学习算法,再用该算法侦测第 类和第 类垃圾评论;3)利用 3 类垃圾评论的副本以及其他相关信息侦测第 类垃圾评论18 但是侦测垃圾评论面临着相当大的困难18,因为垃圾评论本身很难明确界定 例如,为了评价一篇在线商品评论的质量,研究者通常需要给出具体的评价准则或者规格(一般是描述商品的若干方面,如性能,价格等),然后观察某篇评论满足这些规格的程度,进而评估该评论的效用或质量 但是,前人提出的评价准则通常主要依据观察和经验,缺乏理论依据,这些准则有可能存在偏差 另外,目前还没有证据表明,在线消费者依据(或者应该依据)这些准则来判定某篇评论
19、是否对自己有帮助1 2评价在线商品评论效用的特征选取使用数据挖掘的方法对在线商品评论的效用进行预测,需要构建一系列数据属性来表征其效用 也就是需要明确,一篇在线商品评论具备了哪些数据特征即表明它是有用的 以往的研究主要使用了两类数据特征,分别是:文本特征(textfeature)与元数据特征(meta-data feature)文本特征包括语法特征(syntactic feature)、语义特征(semantic feature)和体裁特征(stylisticfeature)语法特征一直被广泛地用于表征在线商品评论 这类特征包括:word n-grams,词性标记,标点符号以及措辞模式 Zha
20、ng4 研究发现简单的语法特征,包括专有名词、数字、情态动词、感叹词、以wh 开头的单词、形容词比较级和最高级,在预测在线商品评论的效用时贡献最显著语义特征需要结合人工/半自动或者全自动的标注技术,添加词语/短语的极性或者情感程度的刻度11 这类特征包括极性标记(积极的/消极的,主观的/客观的),评价组(态度、倾向性、86管理科学学报2012 年 5 月等级以及词组的极性)和用来表示上下文语义倾向性的文脉特征体裁特征的使用也较为普遍,在表征在线商品评论效用评价方面的使用频率仅次于语义特征 这类特征包括词汇和结构属性,这些属性又与作者身份识别相关联,如文献 20 22 值得一提的是体裁特征适合用
21、于文本的主观性判别和观点判别23 元数据特征和在线商品评论的语言特征无关13,它能够表征商品评论作者与读者之间的互动属性 这类特征包括评论员给自己所购买商品的评分,一篇评论所获得的累计总投票数及赞成票数,产品的发布时间,评论的发表时间,和产品的描述等 绝大多数研究者使用了累计赞成票数对投票数的比例(x/y)作为元数据特征 这一特征直接而简便地近似表明了一篇评论的效用4,因而被广泛地作为效用评价模型的预测变量但是,目前学术界对于什么特征能够有效地刻画一篇评论的效用还没有形成一致的观点,有时这些观点甚至是相互冲突的 例如,Kim 等14 研究表明,刻画在线商品评论效用的最佳特征是评论篇幅,把评论文
22、本中的词汇按曲折变化形式进行归类得到的 tf-idf 得分,以及评论者给商品的评分 也就是说,Kim 等13 认为元数据特征和简单的文体特征足以刻画一篇评论的效用 而Weimerh 和 Gurevych12 却认为文体特征不如元数据特征的作用显著;Zhang4 则认为表面语法特征(shallow syntactic feature)在预测一篇评论的效用中说服力最强 郝媛媛等24 认为评论的正负情感倾向对评论的有用性影响显著 或许这些没有达成一致的观点是由于评论样本选取19,评价技术的选择以及评论效用界定的差异所引起的1 3在线商品评论效用评价技术在线商品评论效用评价的技术可以分为基于机器学习和
23、基于相似度得分的两类方法 基于机器学习的评价方法主要有支持向量机(supportvector machines,SVM)和支持向量回归(supportvector regression,SVR)支持向量机在文本分类算法中占有主导地位,而支持向量回归则被广泛用于处理连续性刻度,如情感强度25,评论的效用4,6,13 这是因为支持向量机和支持向量回归算法 可 以 使 用 功 能 强 大 的 核 函 数(kernelfunctions),而核函数可以捕获数据中的大量结构特征Liu等17 利用支持向量机侦测低质量的在线商品评论 设 x 表示一篇在线商品评论的特征向量,该篇评论的效用值可由方程(2)计算
24、,f(x)=wTx+b(2)其中,w表示特征权重向量;b表示截距 f(x)函数值越大,商品评论 x 的效用就越大 如果函数值为正,这篇评论就被判定为高质量;否则,就被判定为低质量 Chen 和 Tseng26 依据信息质量理论(information quality theory)提出了评价在线商品评 论 质 量 的 9 个 维 度,分 别 是 可 信 度(believability),客 观 性(objectivity),声 誉(reputation),相 关 性(relevancy),及 时 性(timeliness),完整性(completeness),信息翔实性(appropriate
25、 amount of information),容易理解程度(ease of understanding),简明扼要程度(concise reputation)然后从在线评论中提取文本特征和元数据特征分别表示以上 9 个维度 最后构造多类支持向量机(multi-class SVM)模型对在线评论进行分类,从而区分高质量的评论运用支持向量回归对某篇在线商品评论的效用进行评价可以用方程(3)表示u(x)=F(f1,f2,fi,fp)(3)其中,f1(x),fi(x),fp(x)表示在线商品评论的特征向量;u(x)表示评论的效用,函数的值域是 u 0,1,连续型的函数值可以尽可能准确的反应评论的真实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 在线 商品 评论 效用 分析研究
限制150内