一种基于情感分析的ugc模糊综合评价方法

文档序号:9929515阅读:763来源:国知局
一种基于情感分析的ugc模糊综合评价方法
【技术领域】
[0001 ]本发明涉及一种基于情感分析的UGC模糊综合评价方法。
【背景技术】
[0002] 随着Web2.0技术的不断发展,针对商品、服务、话题等对象,由普通网络用户自发 在网络平台上的发布信息越来越多,这些信息统称为用户生成内容(UGC,User Generated Content)。近年来,UGC以其快捷、去中心化的信息生态特点逐步被人们所接受,并在新闻论 坛、博客、微信、旅游评论、电商商品评论等领域都有广泛的应用。例如在电子商务领域的网 络购物过程中,由于购物平台的非实体性,消费者在选择商品时,无法实时体验商品性能, 因而无法更加全面的了解商品。针对此问题,电商平台不仅为消费者提供产品自身特征相 关信息(如多方位的商品外观展示、特性文字信息等),还展示了其他消费者对商品的评价, 让购买过该商品的消费者根据其自身的购物体验,对商品做出具体的评价。这些评价形式 的网络用户生成内容将作为其他消费者购买决策的重要参考。因此,消费者对商品的评价 将会直接影响着其他消费者购买该商品的意愿 [1]。但是,随着评论条数的不断增多,消费者 评价系统的作用似乎在减弱,几乎没有消费者为了了解商品的属性而去阅读成千上万的评 价信息。评价丰富了,但其后消费者从评价信息中获取的有用信息却越来越少。为了更好地 利用消费者评价信息,就需要针对这些海量的评价信息构建一个准确、高效的综合评价系 统。为电子商务、旅游体验等网络平台构建一个可靠、有效的用户生成内容综合评价方法, 不仅能帮助后续其他用户快速、精确、深入地了解商品、景点、服务等信息,也有利于企业稳 定老客户,进一步挖掘消费者的深度需求,提高产品和服务的质量,从而提高企业竞争力。
[0003] 模糊综合评价是一种利用模糊数学理论把定性评价转化为定量评价的有效方法。 李梵蓓首先将模糊数学的思想应用到商品质量综合评价问题上,然后利用编程实现该评 价方法,操作简单方便、结论可靠 [3]。王跃进等将多级模糊综合评价方法用于绿色食品的研 究[4]。乌云娜等运用模糊度量方法分析企业存在的风险,评价结果可为控制风险和优化并 购方案提供决策参考,是一种行之有效的评价企业并购风险方法 [5]。王涛从电子商务层面 构造出电子商务产品指标体系,应用模糊数学综合判断方法,对电子商务企业产品进行整 体分析和综合评判,评价出产品优劣。其不足是采用指标两两进行评价方法确定权重,主观 性太强,对商品的综合评价结果说服力不够强 [6]。杨静着眼于电子商务网站售后商品评价 环节存在的问题,构建的评价模型考虑了评价的公正性和易于理解性,但是对于模糊评价 矩阵是用调查统计的方法得到,此过程需要更多的人力物力。并且在各指标权重的判断过 程中,采用了专家经验判断,主观性较强 [7]。
[0004] 综上所述,由于人类的情感是非常丰富的,所以跨媒体UGC表达的显示和隐式情感 不能简单划分为正向情感、负向情感。而目前关于网络平台用户生成内容表达的用户情感 表示方法均为离散表示结构,不足以精细化表达用户情感。
[0005] 上述提及的参考文献如下:
[0006] [1]Park D H,Lee J,Han I.The effect of on-line consumer reviews on consumer purchasing intention:The moderating role of involvement[J] .International Journal of Electronic Commerce,2007,11(4):125-148。
[0007] [2]赵晓冬,郑涛.基于FUZZY-AHP评价方法的个人信用等级评价模型指标体系 [J].数量经济技术经济研究,2003,(5): 97-98。
[0008] [3]李梵蓓.商品质量的模糊综合评价[J].内蒙古财经学院学报,1994,4:92-95。 [0009] [ 4 ]王跃进,孟宪顾.绿色产品多级模糊评价研究[J ].中国机械工程,2000,11 (9): 1016-1020。
[0010] [5]乌云娜,蔡爽,王艳霞.企业并购风险分析和模糊度量[J].中国电力教育, 2006,管理论坛与教育研究专刊:94-96。
[0011] [6]王涛.电子商务企业产品评价指标体系的建立及模糊评价[J].现代情报, 2007,1:178-180〇
[0012] [7]杨静.电子商务网站商品模糊评价模型的构建[J].现代情报,2013,33(4)31-33〇

【发明内容】

[0013] 本发明目的是提供一种基于情感分析的UGC模糊综合评价方法,分别得到商品情 况综合得分,物流情况综合得分和服务情况综合得分,这样消费者和卖家都可以更好的了 解商品的信息。以便商家更好的提高商品整体的质量与服务。
[0014] 为了解决上述技术问题,本发明采用的技术方案是:
[0015] 一种基于情感分析的UGC模糊综合评价方法,包括以下步骤:
[0016] (1)建立电子商务商品评价指标结构模型
[0017] 经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘 宝购物时关心的因素,建立电子商务商品评价指标结构t吴型;
[0018] (2)文本情感分析
[0019] (2.1)信息抽取
[0020] 利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价意见, 并且累计关于商品的"好的评价信息"和"坏的评价信息"的数量;语句情感标签抽取方法是 指将一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行情感标 签的抽取与统计;
[0021] (2.2)情感极性判断 [0022] (2.2.1)初步判断
[0023] 信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用 hownet情感词语集和同义词词林]建立情感词典来直接确定其极性,比如"好"、"漂亮"相 关褒义词语记为"1" ;如果在褒义词之前加有否定词,如不好、不喜欢记为"_1" ;如果一般或 者其它中性的描述,就记为"〇";如果无法直接查找到情感词语的极性,则利用上下文关系 进行判断,如果消费者评论语句中出现转折词语,比如"尽管…还是…","可","但是"的词 语出现时,则在基本情感提取结果上减1;如果出现递进关系的词语,比如"不但、不仅、而 且"的词语出现时,在评论语句的基本情感基础上加1;
[0024] (2.2.2)进一步判断
[0025] 情感描述性词语被副词修饰的情况下,情感极性强度会被加强,好的情感倾向在 程度副词的修饰下会更好,坏的情感倾向则会更坏,比如"很好、超符合、极其差",当一个评 论中的情感描述词被程度副词修饰时,如果情感极性通过步骤(2.2.1)中的方法被判断为" 1",则将其更改为" 2" ;如果情感极性通过步骤(2.2.1)中的方法被判断为"-1",则将其更改 为,,-2" ;
[0026] 评论信息的情感极性判断完成之后,会得到一个相对应的数值,有五种可能:2、1、 0、-1、-2,分别将这五种可能与五个等级相对应,如{2,1,0,-1,_2} = {较好,好,一般,差,极 差};
[0027] (3)模糊综合评价
[0028] (3.1)模糊统计
[0029] ①在每一次试验中都要确定指标集U中的固定元素 Bi中的一个uo是否属于可变动 的等级集合;每一次试验中,指标集都必须属于一个确定清晰的集合,而每一个消费者对商 品的评价都可以看做一个试验,如:针对一条消费者评价,商品的质量情况属于五个等级中 的哪一个,必须清晰、明确,
[0030] ②在每一条消费者评论中,uo是固定的,而评价等级A在随机变动;如果在所分析 的n条评论中,元素 uo属于A的次数为m,则元素 uo对A的隶属频率定义为:
[0032]当商品评论条数n足够大时,根据大数定律,元素 u0的隶属频率总是稳定于某一 数,这个稳定的数即为元素 u0对A的隶属度,模糊统计用来确定模糊评价方法的隶属度; [0033] (3.2)模糊评价
[0034] (3 ? 2 ? 1)构建模糊评价指标
[0035] 根据商品评价指标确定指标集,一级指标集记为U= {Ui U2…Um},其中i = l, 2,. . .,m,表示有m个一级指标;二级指标记为Ui={uii,ui2r",uin},表示第i个一级指标有n 个二级指标;一级指标集为U={B1B2B3},二级指标集为B1 = {C1 C2 C3};
[0036] (3.2.2)确定评价集…,Vn}
[0037]每一个评价指标Ui有n个评价等级,淘宝评分系统用五颗星的评价方法,在这里用 常见的方法确定五个等级:{较好,好,一般,差,极差},评价等级与分数的对应关系为:I:较 好,好,一般,差,极差} = {5,4,3,2,1};
[0038] (3.2.3)确定评价指标权重
[0039] 首先,统计商品的评论信息条数(n);然后,利用步骤(2)实现信息抽取;然后统计 评论中提及的商品情况(m)、物流情况(f)、服务情况(x);接着,分别计算这三个指标的评论 条数占总评论条数的百分比作为权重,具体权重计算方法为:商品自身情况的权重为m/(m+ f+x),物流情况权重为f/(m+f+x),服务情况权重为x/(m+f+x)。同一条评论中同时
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1