基于观点势能测度的网络舆情场极性识别研究-黄微.pdf





《基于观点势能测度的网络舆情场极性识别研究-黄微.pdf》由会员分享,可在线阅读,更多相关《基于观点势能测度的网络舆情场极性识别研究-黄微.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、情报学报 ISSN 10000135第35卷第1 1期1185一1196,2016年11月JOURNAL OF THE CHINA SOCIETY FOR SCIENTIFICAND TECHNICAL INFORMATl0N ISSN 1000一0135Vo35 No1111851196 November 20】6doi:103772jissn10000135201601 1007基于观点势能测度的网络舆情场极性识别研究”黄 微1 高俊峰12(1吉林大学管理学院,长春130022;2北华大学信息资源管理与服务研究所,吉林132013)摘要 提出一种基于受众观点势能测度的网络舆情场极性识别方法
2、,为研判网络舆情受众的情感趋向和的舆情危机态势提供量化方案。研究首先对网络舆情场解构,界定网络舆情场观点势能取值与极性模态关系。其次构建观点强度测度指标体系,提出描述网络舆情受众的观点强度计量与可视化方案,最后通过实证对方法的操作步骤与可行性加以说明。关键词 网络舆情场 情感分析 观点势能计量 极性识别Study on the Polarity Identification of Online Public OpinionField Based on Opinion Potential MeasurementHuang Wei1 and GaoJunfen912(1School ofManag
3、ement,Jilin University,Changchun 130022;2Institute ofInformation Resource Management and Service,Beihua University,Jilin 132013)Abstract The research put forward a kind of method to identify the polarity of online public opinion field based onmeasurement of audiencesopinion potential,providing a qua
4、ntization scheme for analysis the sentiment trend of publicopinion audience and the crisis situation of public opinionFirstly,the structure of online public opinion field had beendeconstructed,the relationship between the value of the potential potential and the polarity modality has been definedSec
5、ondly,the index system for measure opinion intensity has been constructed,measurement and visualization program fordescription the audiencesopinion indensity has been proposedFinaly,Finally,the operation steps and the feasibility of themethod are demons-atedKeywords public opinion field,sentiment an
6、alysis,opinion potential metering,polarity identification1 问题的提出普通民众对所处社会环境中政治经济文化现象做出的反应传导至网络,形成特定时间维、空间维下的舆情发酵、传播与作用区域,即网络舆情场。随着外界敏感事项信息与网民认知性反馈信息的不断交互,代表网络舆情场内部观点势的网络舆情场极性也将随之动态演变。即时监测网络中舆情受众体的事项态度倾向、观点极端程度、受众范围是网络舆情管控的核心内容,通过观点趋势的研析,网监部门能够清晰的从宏观与微观的多层面上勾勒出舆情受众体的认知模式和行为模式,进而基于网络舆情的人为致变特征采取相应的干预策略
7、。学术界已经就网络观点挖掘和情感态度分析、网络舆情的危机等级评价等问题做出了大量的研收稿日期:2016年6月18日作者简介:黄微,男,1967年生,教授,博士生导师,主要研究方向:网络舆情分析,知识管理,信息生态,Email:hw9009souhueom。高俊峰,男,1987年生,博士研究生,主要研究方向:网络舆情分析,信息资源管理。1) 本文系国家自然科学基金项目“大数据环境下多媒体网络舆情信息的语义识别与危机响应研究”(项目编号71473101)研究成果之一。1185万方数据情报学报第35卷第11期2016年11月究。观点挖掘与情感分析方面:有文献通过分析Twitter等政治信息源头,对特
8、定人群有关当前政治事件的效能感受加以统计分析。12I。有文献基于概率潜语义分析(PLSA)构建情感词典,以此来分析网络舆情话题的情感演变规律”。有文献从复杂网络的角度出发分析网民观点的持有自信度、态度倾向转移”1。有文献提出无标度网络特性下的观点形成算法与观点交互算法并以此构建舆情二阶段演化模型。另外有学者以网络舆情中话题的细粒度分割为切人点,通过构建网络舆情中评论的主题抽取与情感识别模型,以此来分析网民对于舆情事项的观点偏好6娟1。基于本体技术的话题领域主题术语识别、网络舆情观点挖掘、情感分类等研究范式也是当前舆情分析的主流p川。有文献指出借助上下文确定网络话题的主题信息,将识别出的事项评论
9、主题定义为观点持有者对客观世界的实体或抽象的概念的指向,以此消除对评论观点主题的片面解读3。网络舆情的危机等级评价方面:有文献通过分析网络舆情建构人民群众对政府信息服务的满意度指标体系,将粗糙集条件信息熵等思想引入进满意度样本数据的处理流程中,并对指标体系进行了实例验证-“。有文献从网络舆情信息生命周期演变的视角建立舆情时间、内容、对象三个维度下的网络舆情监测框架,为网络舆情预警工作提供理论依据。1 3|。有文献从网络舆情信息的传播媒体、传播范围、传播速度、受众情绪倾向程度及相关度几个方面设计出网络舆情影响程度的量化指标,为量化测度综合评价网络舆情波及程度提供操作范式4|。有文献基于国内外舆情
10、危机评价研究成果,提出突发事件网络舆情信息流风险的模糊综合评价模型,并且以“邓正加事件”为例对模型效用进行了实证研究151。通过文献综述不难发现,网络危机事件发生的主要推力是舆情信息受众持有观点与情感的对抗分化,因此对网络舆情受众体的极化程度进行测度评价毫无疑问构成舆情分析的基础。舆情受众极化的前提是以观点聚合为条件,单纯考量受众个体的态度倾向无法就舆情极化的整体态势加以把握,需要从更为宏观的整体视角去综合分析微观层面上受众个体情绪、看法与立场等隐式信息。有鉴于此,本研究引入网络舆情场极性概念,为宏观微观融合的研究视角评估网络舆情危机态势提供一个操作方案,使其对科学研判网络舆情受众的态度倾向性
11、与观点激烈度,有的放矢地引导化解负面煽动性情绪有所裨益。2研究边界界定与网络舆情场极性识别机理21研究边界界定网络舆情场的极性演化与呈现模态是由客观世界中介性事项的敏感程度、负面程度所决定。形成网络舆情的社会中介性事项按其属性特征可被区分为政治事项(例如钓鱼岛问题)、个人伦理道德困惑事项(例如摔倒老人讹诈搀扶者)、恶性恐怖刑事事项(例如昆明31事件)、经济性事项(例如金融市场动荡)、生态危机事项(例如厦门PX项目)、公权部门公信失衡(例如呼格案)、娱乐起哄及造谣(例如“某星陪睡门”)等类别,网民就不同类别的舆情中介事项所产生情绪态度的倾向性与强度也具有显著差异。对于负面属性清晰、良恶定性无争议
12、的舆情事项,受众的观点情绪通常出现“一边倒”的现象。例如近来发生的“北大高材生弑母”一案,从2015年3月3日出现于网络以来,除了部分受众对北大高材生犯下如此暴行表示惋惜之外,笔者并未发现网络中存在任何支持弑母行为的观点言论,因为该类舆情事项的性质超越了多元主观认知的临界,受众对无争议恶性舆情事项的主观判断受社会契约、文化习俗与伦理道德,而非知识结构、心理认知方式的统驱。在此种形式下网络舆情场的主流情绪以声讨谴责为基准,即使存在诸如深刻反思,挖掘事项结构性成因的声音,也决然无法与舆情场中受众的主流情感构成对冲,因此该类舆情事项所产生的网络舆情场极性遵循“单极一多极一无极”的演进模式。另一类舆情
13、中介性事项中,虽然也存在着明显的负面恶意质性,然而伴随着非良性内涵的是事项本身的网络呈现方式模糊、话题争议性显著,可引申方向多维度,使得理性思维与对立的情绪化泄愤观点同时并存于网络舆情场,导致网络舆情场极性态势难以识别把握。例如,2015年因教育方式不当引发的“331南京虐童案”。在“虐童人”主观恶意低,且当事双方的司法免责愿望强烈的前提下,司法机关扔对当事人做出了严惩判决。从而引发了对司法判决必要性与否的双方舆论支持。该类舆情事项中,社会习俗与主观认知方式等舆情观点形成元素万方数据基于观点势能测度的网络舆情场极性识别研究交互博弈,致使相对立的观点情绪均可引起广泛共鸣,舆情场极性的演进时序节点
14、变得模糊不清,针对该类舆情场极性识别是本研究着重解决的目标。网络舆情场极性的外在表征是舆情受众体针对舆情事项的倾向性情感、态度与观点在时间序列下的显性化阐述,相似的观点情绪通过网络舆情场加以聚合,对立的观点态度经由网络舆情场异化区分。随着不断酝酿累积,受众群体之问异化对立的观点情绪在网络舆情场内形成一个“观点势能差”,网络舆情场极性状态的数理表征为观点势能差的取值区间变化,某一时间态势下网络舆情场的观点势能可通过测度舆情信息受众体所发布的网络意见强度得出。因此本文将以测度舆情受众体观点意见倾向性与强度为研究逻辑起点,提出基于观点势能测度的网络舆情场极性识别机理框架。22 网络舆情场极性识别机理
15、如果说观点传播、分化、聚合与劝服的网络舆情时空区域形成了网络舆情场,那么某一事项生成的网络舆情场能够被解构为无数个网络舆情子场(舆情事项网络讨论平台),网络舆情子场的范畴可以是微博、贴吧论坛、博客、社交媒体群等多种形式。各舆情子场内受众体的观点极性之和建构出时问维度内的网络舆情场极性形态,网络舆情场解构示意如图1所示。子场内被公开发布的信息笔者称其为“根源观点(Rooting opinion)”,舆情受众体在各舆情子场内以根源观点为中心所发出的留言评价、转载争论等堆砌形成“观点势能”。设Wp、Wo、Wn分别代表网络舆情受众体对于当前根源观点所持有并公开的观点倾向,Wp代表对根源观点内能引发舆论
16、的描述行为呈赞同情绪,Wo表示客观中立情绪,Wn表示厌恶反对情绪。相应地,舆情场极性根据观点场势能的情况可被定义如表1所示。表1 网络舆情场观点势能取值与极性模态关系界定观点势能取值域 网络舆情场极性1WxWy。l And WzWx一(0,双极0)And WzWy一(0,0)2WyWx一(n,+)And Wy 单极Wz-+(n,+)3WxWyll And WzWy。1 多极And WxWz14Wx_O And Wy。O And无极Wz+0笔者采用“Wx、Wy、Wz”三个未知数来表示“Wp、Wo、Wn”,例如观点势能取值域1中“Wx图1 网络舆情场解构万方数据情报学报第35卷第11期2016年1
17、 1月图2识别框架wy一1 And wzo”则表示赞同中立反对三种观点倾向中的任意两类观点在网络舆情场中的比值,当比值无限趋近于1,且与第三类观点取值比不高于比例阈值0时,网络舆情场极性呈现出双极化。而当任意两类观点与第三类观点的比值区间在(Q,+)中时(Q为比值阈值),网络舆情场极性呈现单极化。当网络舆情场中三类观点倾向取值较为平均亦或是主观性观点趋近于0而客观性观点仍在网络舆情场中保有相应的值域,此时网络舆情场呈现出多极化。当三类观点在网络舆情场中都消弭隐迹,网络舆情场极性形态为无极化。通过测度和计算时间维度中的网络舆情子场受众观点的势能差值,能够勾勒出网络舆情子场的过往或者当前极性,通过
18、各网络舆情子场的极性叠加,使得窥探某一网络舆情事项的受众情感激烈程度变得有迹可循。网络舆情场极性识别框架如图2所示。3 基于观点势能测度的网络舆情场极性识别方法图2描述了网络舆情场极性识别的框架,然而在识别流程中仍然有诸多问题需要解决,第一,如何从语义分析的维度下对附着在受众评论词汇、短语和句式中的即时情感、情感强度、情感倾向加以解读?第二,如何从传播的维度下量化某一受众观点的扩散程度?第三,如何将上述两个维度的指标加一1 188一权融合形成观点势能测度的指标体系?上述问题将在下文中逐步化解。31观点强度指标体系构建一方面考虑到网络舆情受众面向根源观点作出的主观评论语句所体现出的强度主要被语句
19、中情感激烈程度和语句被他人接受和认同程度所反映。另一方面本研究所提出的网络舆情场极性识别其本质是即时对时间序列下的受众进行立场情绪快照,因此观点强度指标体系不易复杂繁琐,以迅速可靠描述当前的受众倾向状态为基准。具体指标体系如表2所示。表2观点强度测度指标体系目标指标层 一级指标层 二级指标层评论语句中的 评论句中倾向词附着的良网络舆情 语义情感激烈 恶程度(N11,权重:075)受众面向 程度(M1,权评论句中倾向词的数量根源观点重:O65) (N12,权重:025)的显性立场情绪强 评论语句被他 回复量(N21,权重:014)度测度指 人接受和认同点赞量(N22,权重:043)标(S)的程度
20、(M2,权重:035) 转发量(N23,权重:043)指标权重赋予本着“语义强度优先,语用广度协同”的原则,将两个一级指标的权重分别设为065与035。因为只有在受众所持有的情感观点万方数据基于观点势能测度的网络舆情场极性识别研究极度强烈同时具有一定说服力的前提下,围绕其所陈述的主题才有可能形成群体的聚集与对立,而感情色彩稀缺且观点毫无吸引力的言论(并非客观中立的观点就无法引起抗辩)注定无法获得广泛的关注,因此笔者通过阈值的设定区分出二者对于受众观点强度的主次作用。对于评论语句语义层面的计量,本研究将句式中倾向词的良恶程度与倾向词的数量权重分别设为075和025,而对于受众观点传播维度的考量中
21、,笔者将“点赞量”与“转发量”两个二级指标的权重设为043,将“回复量”指标权重设为014,这是由于除极端异常情况之外,点赞与转发行为能被确定认为是对待测观点的认同和支持,而直接回复的行为除了支持以外,更有可能是对待测观点的批判与否定,某种意义上回复行为也是引起网络舆情场观点迅速聚合与对抗的直接原因之一,因此赋予其较低权重值。笔者构建的指标体系中,满足了观测点的可测可得性,虽然并非所有的观点评论都包含完整的指标观测点,然而却能够体现出受众观点强度的核心要素,实践中可根据待测度的网络舆情子场质性进行相应的微调以满足不同的任务目标。32 网络舆情受众的观点强度计量基于对大量的网络舆情数据分析研判,
22、笔者发现舆情观点的语义模式主要包括四类元素,即、。不同于句法成分的主语和宾语,与在舆情信息陈述的过程中经常的出现逆置,例如“小学生搀扶摔伤老人,反被老人讹诈”一句中,“小学生”与“老人”分别两次作为事项的与出现,另外舆情事项中包含一方或多方的情况也并不鲜见,因此与从根本上代表的是舆情事项的应事实体(人、物、情景、事件)。元素是对与动作状态的陈述,除了自身的标签化属性以外,应事实体所作出的行为是促使网络舆情形成的重要动因。一些情况下舆情受众在选择行为实体的词汇时会附着明显的情绪倾向(如例句中“讹诈”),个别情况下表达行为实体的词汇语义倾向性模糊不明,无助于识别观点的良恶状态。是对、元素形容修饰的
23、非实体性助词,通常伴随着情感倾向。、的多元组配形成评论文本的语义特征,舆情受众的评论观点也紧密围绕上述元素阐明立场、表露情绪。因此语义层面观点强度计量将首先解析根源观点,抽取其中的实体形成观点分析的基准词汇,明晰根源观点的情感倾向约束,而后分析受众针对根源观点所陈述的评论句式语义,区分其中的实体指代词和实体的描述词汇,将根源观点中的实体与评论句式中的实体指代词进行映射,构建时间序列内面向受众评论的“实体一倾向性描述”关联矩阵,构建“实体一倾向性描述”关联矩阵的目的是挖掘出受众评论句中情感词与根源观点的基准词之间的语义组配强度,再根据生成的强语义关系提出实体指示词与实体间的映射规则,进而对受众个
24、体的观点立场强度加以量化。设T=t,t:,t 3,一,t。为单位时间舆情受众抛出舆情评论文档集的语义标签化处理结果,集合r内的元素属性涵盖应事实体、行为实体、实体指代词和描述助词四类。设OT=ot,ot:,ot3,ot。为待测度网络舆情场中某根源观点的文本语义标签化处理结果,集合OT的元素类型包含应事实体、行为实体两类。研究首先对包含“ot”的评论文本进行分析,引入邻近算法(Adjacent method)按标点符号切割文本,而后基于情感词典计量行为描述词的倾向趋势与程度,得出评论文本持有受众对根源观点中的行为实体所持立场态度,以此初步充实矩阵。而后围绕根源观点的行为实体,按“ot+ot”或“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 观点 势能 测度 网络 舆情 极性 识别 研究

限制150内