2022年搜索引擎:从信息中搜寻财富搜索研究教程.docx
-
资源ID:81144256
资源大小:15.82KB
全文页数:8页
- 资源格式: DOCX
下载积分:9.9金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2022年搜索引擎:从信息中搜寻财富搜索研究教程.docx
2022年搜索引擎:从信息中搜寻财富搜索研究教程搜寻引擎,一个网络业最老的商业模式之一,一个成百万网民每天都要运用的服务,现在正在向全面商业化转型。那些具有商业价值却还未被人所知的信息有朝一日会被搜寻引擎开采出来,创建出滚滚的财宝。新一代搜寻引擎搜寻引擎曾经是互联网盛极一时的标记产物。Asking Jeeves,AltaVista,Google,雅虎等大大小小的搜寻引擎曾经给我们希望,承诺我们可以轻而易举地找到我们想要的信息。然而每个尝试在网络上搜寻过信息的网民都知道,搜寻引擎并非想象中那么好用-要么是找不到信息,要么是泥沙俱下,给你一大堆垃圾信息。对于商业公司来说,搜寻引擎也是吃力不讨好的活儿。分门别类储存大量现存信息已是不堪负担,何况网络上的信息正在以光速的速度增长。对IT技术和商业管理来说,搜寻信息的模式实在是一大挑战。IT市场分析公司IDC今年秋天出具的一份报告表明,前期被大肆宣扬为"运用简便易用,搜寻结果丰富"的搜寻引擎技术正在被信息更集中的局域网取代,因为用户知道在大多数搜寻系统的表现与他们的期望值相差太大。一般的公共搜寻引擎只能查到HTML格式,即超文本标示格式语言的网页,主要是因为搜寻引擎的自动排序软件spiders蜘蛛程序,只能接受这种格式的网页。这意味着,在企业内部的局域网上,任何没有运用HTML格式书写的信息将无法被外部的搜寻引擎查到。这些"沉没"的信息包括Powerpoint幻灯片文件、Word文档、PDF文件、各种各样的电子邮件内容,诸如CRM客户关系管理或者ERP企业资源管理这样的应用软件产生的数据库也是无法查到的,多媒体内容方面,数量正在高速发展的视频、音频文件通常也被解除在搜寻引擎之外。好在搜寻引擎技术发展快速,将来公共搜寻引擎能够弥补上述的缺陷。在过去的几个月中,搜寻引擎经过了商业化,技术上有了更新的成果。新型的搜寻引擎能够接受几十种软件格式,诸如智能搜寻和特性化搜寻的特色把它们与过去的搜寻引擎区分了开来。搜寻引擎挖掘信息资源的金矿在多数网民的印象中,门户模式与搜寻引擎是合而为一的,像雅虎,本身是搜寻引擎,后来建起了新闻服务和闲聊室,又如国内出名的门户网站新浪,最早是新闻比较好,后来也加强搜寻引擎的服务。但是现在根据业界一些流行的观点,门户模式、搜寻引擎最好分开做。门户模式管理好内容服务,搜寻引擎的核心部分技术外包。事实上搜寻引擎的技术外包在行业内不是什么隐私,雅虎自己的搜寻技术一般,它就采纳Google的技术;新浪也没有在搜寻引擎上花太大的力气,而是把技术服务外包给了3721。搜寻引擎的专业分工为这个行业分支的商业化创建了条件。利用有限的企业资源,搜寻引擎能够在用户界面、应用基础、嵌入技术、集成服务等多方面与商业企业合作。搜寻引擎从门户的阵营中分别出来,独立走出商业化的道路。AltaVista搜寻软件公司的欧洲区副总裁马克说,商业公司内各种格式的电子文件中,平均80%的信息未经整理,运用起来效率很低。"这就是搜寻引擎所能带给企业的价值。利用相同的技术,我们可以在零乱的信息中给公司挖掘出一座大金矿。"AltaVista针对商业客户的搜寻软件今年6月上市,该软件能用30种语言,搜寻200多种文件格式。"企业拥有搜寻引擎,就建立了一张信息资源的全景图。通过一张完整的、可搜寻的书目,信息在企业系统中的分布一目了然。"支持多语言,可搜寻各种格式文件是最近商用搜寻引擎竞争的卖点之一,还有其它一些搜寻引擎公司专注于一两种特定格式文件的搜寻。例如,Screening Room公司允许用户利用其技术,特地搜寻视频、音频文件,而驻扎于剑桥高校的初创公司NCorp特地从事格式化数据库的搜寻服务。NCorp的创始人兼首席执行官尼克说公司的核心搜寻业务仅限于IT业内,能够运用标准查询语句SQL的专业人士。"标准化数据库数量不如非标准化数据库那么多,但是它们有很大的发展潜力,以后确定有很大的搜寻需求。我们就看准了这个市场,打算逐步培育它。"公司出品的搜寻引擎Ijen不仅令初学者简单上手,而且能够供应给专家比SQL语句更优化的查询结果。"SQL语句能够为具有精确标准的查询问题供应答案,例如'公司本月的销售额是多少'。但是它无法解决智能化的模糊问题,例如'哪位员工最适合执行该安排'。"搜寻引擎的商业应用不少商业公司对搜寻引擎的效率仍旧表示怀疑,但是专家说,新一代搜寻引擎的初始排序速度特别快,花费时间很少。例如闻名的财经新闻集团路透社,它应用搜寻引擎在36小时内对200万个文件进行了排序。"新的搜寻引擎特别易用,公司可以从网上下载,自己就可以调试,30天后就能运用,几乎可以不依靠外部的技术支持。"Verity的市场总监西蒙也认为搜寻引擎依据企业要求的功能,打算时间有长有短,但是相比CRM或者ERP这样的项目,搜寻引擎只是一个小工程。"你安装好系统后,就可以起先排序了。执行程序就是了。"当然,专业用户对搜寻引擎的信息检索精确性要求特别苛刻,所以在引擎技术、数据容量升级的同时,开发厂商对信息原材料的提炼也做出了努力。他们深化到企业中,了解他们组织信息的过程和特征,并且参考前人的工作成果和资料修改了特性化的搜寻方式。这种努力慢慢有了成果。有的商业搜寻引擎有了分级功能,根据人们对文件关注程度的凹凸次序排列文件,有的则是从运用者动身,根据同一级别的雇员关注程度凹凸排序文件,还有的搜寻引擎将文件注释与专家举荐功能结合,用户不必打开文件就能对文件大致有个了解。"多数人最多读30个文件,所以搜寻结果不是越多越好,而是不管你用什么方法,要把最适合要求的30个文件找出来,放在列表的最前面。"搜寻引擎公司 Convera的负责市场开发的副总裁柏恩·布莱默说。该公司的母公司Excalibur技术公司最近与英特尔的互动媒体服务分部刚刚合并,合并后公司的第一家子公司就是Convera。因为搜寻引擎专业化发展而出现的新技术趋势真是数不胜数。另一家公司Fast Search把数据即时预警功能集成到搜寻功能中,其创意极其新奇。公司创始人兼CTO约翰·莱维克说,"我们能够即时过滤任何数据流。例如股票报价或者天气预报,并且产生即时报警报告。"这家公司主要的目标是金融企业的分析系统和内容网站的即时新闻,据他们估算,这些公司的信息更新速度大约是每秒钟更新5个文件。"我们引擎完全是即时更新的,新信息一出来,就可以查到。"作为企业局域网的一部分,搜寻引擎涉及许多企业敏感的商业信息,因此信息平安也是非常重要。搜寻引擎都考虑到了这一点,把运用权和限制权,分布到分散式系统上,每个子系统都拥有自己独立的帐号、主群和进入许可。"搜寻引擎能够同时搜寻多个文件,但是从平安考虑,每个文件都有独一无二的平安等级。搜寻引擎成热点各方面性能的提高使搜寻引擎即将成为企业信息系统的一部分。它就像一辆车的马达,放在企业信息战略框架中,与IT应用技术、学问管理体系和企业智能系统一起,构成了企业内部的信息神经网络。目前搜寻引擎开发商主要是争夺世界前2000强的公司,他们财大气粗,出手豪阔,但是从市场反馈看,一些中小型的公司也对搜寻引擎特别感爱好。例如 Inktomi有像太阳微系统公司这样的大客户-需排序多达7000万个文件,也有一些小客户-排序文件只有3000个。随着商业需求的不断增大,网络与商业企业趋向无缝结合,搜寻引擎有了用武之地,搜寻引擎企业外包,公共搜寻引擎收费摆上了议事日程。市场分析家预料搜寻引擎市场将持续增长,在今年底市场价值将达到150亿美元,但是这个新兴的技术市场也面临激烈的竞争。"许多开发商意识到简洁添加一个搜寻功能不足以开掘互联网的信息价值,达不到内外网络信息共享的目的。最好的解决方案是开发厂商将搜寻技术与商业战略构架集成在一起,集成得越完备,获得市场胜利的可能就越大。搜寻引擎的攻城略地也扩散到了移动商务领域,PDA、手持设备和手机日后都能运用搜寻引擎,搜寻引擎可以变得无处不在。从某种意义上说,单纯"今日你有否雅虎"这种口号已经死了,但是"今日你有否搜寻"这个提法在很长一段时间将代表业界的发展趋势,具有蓬勃的生命力。 (出处: