中文微博情感评测报告.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《中文微博情感评测报告.ppt》由会员分享,可在线阅读,更多相关《中文微博情感评测报告.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中文微博情感评测报告 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望提纲研究背景及意义研究背景及意义任务预备任务预备任务分析与实施任务分析与实施总结总结背景 在Web2.0大背景下,微博作为用户发言、相互交流的重要途径,具有数量大、更新快的特点,是从中发掘用户观点以及情感倾向的可靠来源。针对微博的自然语言处理研究已成为当前一个新的研究热点和前沿课题,而情感分析就是其中一个热点话题。微博情感分析l情感分析,包括观点挖掘、观点分析、主客观分析等。情感分析的目的是从文本
2、中挖掘用户表达的观点以及情感倾向。l主要技术:(1)情感词典与规则相结合的方法(2)机器学习意义l过滤不合法网络舆论信息,营造良好的网络环境l监督舆论的走势,辅助社会管理l实现商品个性化推荐l对社会计算的研究有重要的意义提纲研究背景及意义研究背景及意义任务预备任务预备任务分析与实施任务分析与实施总结总结任务清单l任务一:观点句判定l任务二:分析情感倾向 l任务三:提取情感要素技术准备l分类器:SVM、CRFl情感词典扩充:加入网络用语和表情符号 l中文分词技术:海量云分词提纲研究背景及意义研究背景及意义任务预备任务预备任务分析与实施任务分析与实施总结总结任务处理流程构建特征集人工标注训练语料训
3、练集及训练模型生成预测集生成及预测人工标注l利用本团队自主开发的标注工具标注l严格按照主办方提供的标注规则,从样列文件中选取1219条具有代表性的微博进行标注l标注内容包括:是否为观点句、情感倾向性、情感要素训练语料任务一:人工标注的1219条微博任务二:任务一训练语料中451条为观点句的微博任务一特征集特征序号特征类型特征内容描述1链接是否含有url链接链接通常以http:开头。2表情符号是否含有情感表情符号参考网络表情符号词典3情感词是否出现情感词在基本的情感词典基础上,再加入包含情感的网络用语作为情感词典的扩充。4情感词个数情感词出现的个数5标点符号是否出现感叹号和问号。!?6标点符号是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中文 情感 评测 报告
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内