欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    谷尼Goonie互联网舆情监控系统技术白皮(共9页).doc

    • 资源ID:13690569       资源大小:775.50KB        全文页数:9页
    • 资源格式: DOC        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    谷尼Goonie互联网舆情监控系统技术白皮(共9页).doc

    精选优质文档-倾情为你奉上Goonie互联网舆情监控系统技术白皮书谷尼国际软件(北京)有限公司二一年八月专心-专注-专业目录1 系统概述 网络舆情形成迅速,对社会影响巨大,不仅需要各级党政干部密切关注,也需要社会各界高度重视。该方案可应用在政府的新闻监管、舆论监督等部门。 互联网舆情监控系统是一套利用搜索引擎技术、文本处理技术、知识管理方法,通过对互联网海量信息自动获取、提取、分类、聚类、主题监测、专题聚焦,实现用户对网络舆情监测和热点事件专题追踪等需求,形成舆情决策库、舆情简报等分析结果,为客户全面掌握舆情动态,做出正确舆论引导提供分析依据。谷尼互联网舆情监控是以信息采集技术为核心,应用信息采集技术、内容管理技术、知识管理技术、信息分类技术,实现网络舆情监测和新闻热点追踪、新闻监管等功能需求。为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。系统工作流程如下: 信息采集:互联网信息实时监测、采集、内容提取及排重; 信息处理:对抓取的内容进行自动分类聚类、主题检测、专题聚焦等; 信息服务:将采集并分析整理后的信息直接为用户或为用户辅助编辑提供信息服务,如自动形成舆情信息简报、追踪已发现的舆论焦点等。 2 系统结构总体来说,该监控管理软件的结构和特点如下:3 系统特点该项目与国内外互联网舆情监控系统或类似功能的系统比较,具有自己显著的技术特点,如允许用户定制舆情监控的范围、方式等,具体如下: 支持网页编码自动识别 支持URL去重识别 支持正文自动识别抽取,无须标签配置 支持分页采集 可设置采集频率 支持分布式部署 强大的信息采集功能 智能化的中文信息处理 全面的敏感信息分布式检索系统 分类、聚类等中文智能处理技术广泛采用 实时增量备份原则 合理的模块化结构及方便的分类监控 灵活的调度算法 支持新闻、博客、论坛、贴吧的采集监控 基于内容相似性去重识别 支持互联网关键词搜索采集入库 支持敏感词过滤提取 支持热点发现 支持网页快照4 性能指标 稳定性强:在机器不断电的情况下,采集系统能7×24不间断持续运行,不出现死机、无故重启、资源耗尽等问题;无需人工监控。 性能优越:在普通网络带宽情况下,单机PC的采集能力达到30页面/秒,网络带宽高的情况下可达到60-100页面/秒。 效率优良:采集器所耗费的带宽的利用率超过80。 抽取精确:正文的抽取准确率98%,误抽率不到1%。 CPU和内存的占有率不超过50。5 功能描述5.1 热点话题、敏感话题识别   可以根据新闻出处权威度、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用内容主题词组和回贴数进行综合语义分析,识别敏感话题。5.2 舆情主题跟踪  分析新发表文章、贴子的话题是否与已有主题相同。是根据文档内容间的相关程度进行分组归并。聚类不需要类别及相关训练样本。 聚类可以发现当前舆论焦点,或者相关文档的查找.通过对同一个阶段搜索到的大量信息进行聚类,我们可以很方便地发现当前关于什么类别的文章数量更多,那些信息之间的关系更紧密,这样我们可以很直观地了解到当前舆论的焦点,以及各个舆论点之间的联系紧密程度。5.3 自动摘要  对各类主题,各类倾向能够形成自动摘要。信息自动摘要的中心思想是让用户在查看搜索结果时候,无需点击进入每一个搜索结果去了解具体内容,而自动在搜索结果条目下显示摘要信息。这些“摘要”帮助用户迅速了解搜索结果的主要内容,提高了工作效率。5.4 舆情趋势分析  分析某个主题在不同的时间段内,人们所关注的程度。5.5 突发事件分析  对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。5.6 舆情报警系统  对突发事件、涉及内容安全的敏感话题及时发现并报警。5.7 舆情统计报告   根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。6 运行环境 操作系统:Microsoft Windows XP/NT/2000/2003/数据库为:SQL2005/2000服 务 器:CPU3.2G/内存2G/硬盘40G以上带宽要求:2M独享以上服务器数量:2台(1台采集监控、1台 数据库服务器)应用规模较大,可以采用多服务器集群的方式7 系统案例国家部委成功案例知名企业成功案例国家知识产权局国家邮政局国家农业部总后勤部空军司令部.中国第一汽车集团中石化西北油田分公司中石油华北油田分公司蒙牛乳业(北京)有限公司河南绿能高科有限公司中国网通集团河南公司中国联通北京分公司山西阳泉煤业集团有限责任公司北京图书大厦有限公司.地方政府成功案例其它成功案例衡水市委宣传部沈阳市委郴州市委宣传部淮安市委宣传部河南永城市委河南永城市公安局石家庄市政府四川人民政府福建省教育厅31个省市邮政局.人民邮电报业集团中国信息产业网深圳日报报业集团 深圳新闻网甘肃日报报业集团 每日甘肃网检察日报社正义网丽水日报社丽水网南京大学河北师范大学

    注意事项

    本文(谷尼Goonie互联网舆情监控系统技术白皮(共9页).doc)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开