探究云计算下大数据的信息检索技术应用(共5页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《探究云计算下大数据的信息检索技术应用(共5页).doc》由会员分享,可在线阅读,更多相关《探究云计算下大数据的信息检索技术应用(共5页).doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上探究云计算下大数据的信息检索技术应用 摘要:近年来,云计算得到了较为快速的发展,更多的企业及个人都会将业务转移至在线运用中去,而在线的移动设备、自动传感系统、社交网络等应用都会产生大数据信息,使得信息呈现出爆炸式的增加。在廉价的计算能力及云存储条件下反而加剧了大数据的产生量,使得解决信息检索及收集问题成为了必然之势。本文主要探讨了云计算基础上如何对大数据信息进行收集以及如何检索信息。 关键词:云计算 大数据信息 信息检索 中图分类号:TP391.3 文献标识码:A 文章编号:1007-9416(2015)07-0000-00 云服务在近年来得到了快速的增长,尤其是电子
2、商务及社交网络如视频、图片、音频等,是大数据快速增长的主要因素,这些数据往往只能够通过EB、PB、TB、GB甚至是ZB才进行描述。云计算如何对大数据信息进行正确地处理,如果能够从中获取到我们日常所需的信息则将会对整个人类社会产生巨大的影响。为此,云计算的大数据信息收集与检索将成为社会上科技应用的一个热点。 1 WEB信息收集及检索 信息的价值密度和信息的总量多少成反比,在成千上亿的信息页面之中,能够满足自身的需求信息可能只有几页。例如:一个多小时的视频播放,其有用的信息往往只存在几秒钟,而云计算拥有着超强的计算能力,要快速地获取处理结果需要通过云数据来进行。云计算如何在大量的数据中进行价值的挖
3、掘是目前所需要尽快解决的问题。谷歌和百度等公司在信息检索上处于领先地位,基于云计算大数据信息时代下,其核心思想仍然需要借鉴于这两大公司的核心思想,其中,云计算中的大数据信息检索过程主要分为检索以及网页收录这两个过程。 信息检索云中的各个服务器都会对数据信息进行分析和排序,计算出较高“相关度”的服务器排在最前面,同时,对存储服务器上的信息进行分布式的检索,其检索的方式主要有广度优先以及深度优先这两种方式。检索的结果最终会收录在Index Repository上,而网页收录在搜索引擎的索引中,会由使用者所提出的申请搜索在Index Repository中进行。然后会把索引词库以及网页内容倒排序在索
4、引之中,其中,网页的标题以及所有的连接数据都会储存在同一个索引里面,优先使用广度优先的方式来进行搜索,而网页内容则储存在另外一个优先的索引之中,便于深度优先方式的搜索。 信息检索云上各个主服务器中的数据是进行分析后再整理成的元数据。“相关度”高的服务器会排在最前面,然后再对存储服务器进行分布式的检索,其检索方式也是有广度优先以及深度优先这两种方式,其所检索得来的结果仍然会收录在Index Repository之中。而网页收录过程中会存在在搜索引擎的索引之中,当使用者提出搜索请求时,实际上是在Index Repository中进行信息搜索,其页面的内容则是依照PageRank的方法来计算出倒序索
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 探究 计算 数据 信息 检索 技术 应用
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内