网络信息有效获取与可信度的案例分析.pdf
网络信息有效获取与可信度的案例分析*朱?宁?陈红勤?聂应高?摘?要?网络信息的有效获取一是要合理利用网络检索工具,迅速地查到信息源;二是要对捕捉到的信息源进行分析,正确地选择目标信息源;三是要对所获得的信息进行判断,准确地攫取答案信息。文章从文献型、数值型和事实型三种不同类型的信息检索典型案例,分析了信息获取过程中的可信度问题,为网络信息可信度的理论研究提供了实证依据。?关键词?网络信息?有效获取?可信度分析?案例分析Abstract:The effective accessing to network information,firstly,is to take advantage of network searchtools rationally,in order to seize the information resources rapidly;secondly,is to analyze the seizedinformation resources,in order to choose the objective information resources exactly;lastly,is to estimatethe seized information resources,in order to obtain the solution information soundly?In this paper,searchingtypical cases are based on three distinct types of resources including literary,numerical,and factual toanalyze the reliability issues in information acquisition process,and to provide the empirical references fortheoretical investigations on network information reliability issues?Key words:network information?effective accessing?reliability analysis?empirical analysis1?引言当今社会,网络成了人们获取信息的重要渠道之一,并且愈来愈成为人们生活、工作、学习中必不可少的工具。据?第 23 次中国互联网络发展状况统计报告?报道,截止 2008 年 12 月 31 日,中国网民规模达到 2?98 亿人,普及率达到 22?6%,超过全球平均水平 1,并且呈一种不断上升的趋势。有调查结果表明,网络、电视和报纸是网民获取信息的主要途径,网民选择的比例分别为网络 85?0%,电视 66?1%,报纸61?1%。此外,杂志、书籍和广播也是网民获取信息的途径,选择的比例都在 10%20%之间2。由于网络信息资源具有数量庞大、增长迅速、内容丰富、覆盖面广、形式多样、交互性强、检索便捷、使用高效等优势,因此产生了网民们对网络信息的依赖性。然而,在网络信息给人们带来帮助和实惠的同时,另一方面大量内容雷同、重复冗余、层次低劣、虚假错误的信息与正确有效、新颖逼真、健康有用、来源可靠的信息一起鱼目混珠、混淆一团,使得人们难辨真伪、不知取舍,又给人们带来了困惑和忧虑。网络信息的来源是否真实可靠?其信息的价值是否有效可信?成了人们提出质疑的重要问题。怎样有效获取网络信息,使之达到能被正确利用的效果?这就滋生了网络信息的可信度问题。网络信息的可信度,是指对网络信息可以信赖的程度。早在 20 世纪 50 年代,随着大众传播学的兴起,国外就 开 始 了 对 信息 的 可 信 度 研究(CredibilityResearch)。可信度研究最初所关注的是传播者(信源)可信度,即信息来源可信度;随着电视的兴起,人们的研究转向媒介(信道)可信度及对媒介间可信度的比较研究;到了网络时代,互联网成了人们获取信息的最主要渠道之一,人们逐渐开始了对网络信息的可信度进行研究3。笔者认为,对网络信息有效获取及可信度的研究可以从三个视角来考虑:一是从信息的来源进行分析,怎样合理有效地利用网络检索工具寻找真实的信息源?即从信源(传者)的角度分析,看信息的提供方(个人或机构)提供的信息是否真实可靠?二是从目标信息(用户需要捕捉的信息)的选择进行分析,怎样从55RESEARCHES IN LIBRARY SCIENCE?*本文系湖北省教育厅人文社会科学研究项目?网络信息资源可信度分析与评价研究?(编号:2009d036)研究成果之一。搜索到的众多相关信息中去选择与目标信息更接近的信息?即看信息获取的最终结果是否有效?能否满足提问者的实际需求?三是从攫取的信息内容进行分析,即对所获得的几种不同答案的信息进行比较,首先看提供的信息有没有真实可靠的依据?也就是说回答问题的信息有什么根据(是提供者个人的观点,还是引用他人的观点并且有文献来源的依据)?其次,根据查询者的文化知识水平,分析判断答案信息的真实性和准确性。目前,学界对网络信息资源评价研究的文章并不少,但对如何在杂乱无序的网络上去攫取有效信息的实证分析并不多。本文试图从实证案例的角度来探讨一下如何有效获取网络信息的问题,以期对网络信息可信度研究提供实证依据。2?信息来源可信度的案例分析实例之一:我校有位教师 2002 年正在进行 20 世纪 40 年代?延安文学史论?的课题研究,需要查询一部有关歌剧?白毛女?的最原始剧本,并提示,?白毛女?文本的形成和演化经历了由口头传说到歌剧本,再到电影和戏剧本过程,其间经历过两次重大修改和多次改编移植,形成了不同时期的若干个不尽相同的版本,希望图书馆尽可能提供最早的版本。笔者根据该咨询课题做了一个小试验。在文献信息检索实习课中,笔者以?歌剧?白毛女?的早期版本是什么版本?哪些馆有收藏?作为问题提出来,交给开设信息检索课程的学生来解答。在三个班 300 人左右的 学 生 中,几 乎 80%以 上的 学 生 都 是 通过?Baidu?搜索查找答案的,但查无结果;只有少数学生是通过本馆 OPAC(公共查询系统)来查找的,查找的结果也只有 1952 年的版本。2?1?案例分析第一,学生们没有弄清该问题的查找性质,简单地把它当做事实型信息的检索类型,企图在搜索引擎中直接获取答案信息,以致查无结果;第二,单纯认为网上信息的检索手段只有搜索引擎一种,即便在搜索引擎能检索到某些相关信息,但并不切题,其信息来源也不一定可靠,甚至是无效信息。如,有学生以?初版白毛女歌剧剧本?为检索词,在?Baidu?里搜索到有关白毛女歌剧剧本的信息共 79 项,但大多是剧情介绍或是网上各类书店发布的购书信息或珍本拍卖信息,查不到实质性的信息。第三,搜索引擎根本无法检测到各个图书馆的 OPAC 系统,因而则无法获取各个图书馆的馆藏书目信息。第四,选择本馆 OPAC系统查询是一种正确的检索途径,但无法判别检索的结果是否是早期的歌剧?白毛女?版本。总之,学生们不善于合理综合利用网络检索工具去捕捉有效信息源。2?2?网络检索工具的选择用户在网络上对信息的需求是千姿百态的,而且大多数用户获取信息的手段是通过搜索引擎,用得最多的搜索引擎要算 Google 和 Baidu 了。但在实际运用中,搜索引擎暴露出许多局限和不足。经考察研究发现,没有一个搜索引擎的索引量超过整个网络网页总数的 1?64。不仅单个搜索引擎的数据库所收集的 Web页面大大不足,就是所有的搜索引擎所储存的数据也只占全球 Web 页面的 50%强 5。这就是说,无论是独立搜索引擎还是元搜索引擎,在互联网上搜索信息的范围都是极为有限的。一般大型搜索引擎往往能搜索各种形式的网站信息,它们常常开辟专门的选项来搜索 Ftp、Gopher、BBS、新闻组中的内容。但有相当多的搜索引擎只能搜索 Web 网站,而无法查询其他形式的网站。值得注意的是,利用网络检索工具搜索网络信息资源,首先要分析信息资源的类型和存储处,也就是说所要查找的目标信息是属于文献型的还是数值型的或是事实型的,这些类型的信息分别在哪些数据库网站查找比较可靠;其次要正确选择检索工具,网络检索工具包括搜索引擎、网络数据库、联机公共查询目录、电子书刊、各类型网站等等,这些都是获取信息资源的重要手段。对于不同的问题应当有针对性地选择相应的检索工具,如果检索工具选择不当,势必导致错误的搜索导向或无效的检索结果。在实际操作中,对信息资源的搜寻有时往往不仅仅是单独使用某一种检索工具就能实现的,而是多种检索工具相互交替使用,才能最终达到理想的效果。2?3?网络检索工具的综合利用目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用,简单的关键词搜索返回的信息量过大,已经让用户无法承担 6。网络检索工具的种类有很多,如果按照其功能作用划分,可以分为三种类型:即文献型检索工具(包括题录、文摘、全文)、数值型检索工具和事实型检索工具。但是在实际操作过程中,往往某些检索课题不是简单利用一至两个检索工具就能完成的,而是需要多个检索工具反复交替使用方能达到预期效果。根据上述案例,正确的方法应该是:第一步,从综合网络检索工具如 Beidu 入手。弄清楚?歌剧?白毛女?的早期版本?是哪一年的什么版本?第二步,正确选择专门性检索工具。查找该咨询解答信息最有效的工具应该是 OPAC;其次,在最容易获取该信息的本馆 OPAC 中去查询;如果没有,再寻求其56?图?书?馆?学?研?究?2009?11他途径。第三步,在可信度较高的 OPAC 检索系统中查询。首先选择国内最有权威性的 OPAC 系统和收藏较完备的各大型图书馆的 OPAC 系统,如 CALIS、国家图书馆、北京大学图书馆、武汉大学图书馆等等;其次,按照自己的选择,一一尝试。3?目标信息可信度的案例分析实例之二:查找我国近 3 年(2006 2008)GDP(国内生产总值)的增长情况,要求有我国年度生产总值和人均国内生产总值的具体金额数据。3?1?案例分析所谓目标信息,就是在检索结果中的众多相关信息中与用户期望值最接近的信息。网络是一个庞大的信息资源库,利用网络检索工具寻求目标信息源,其检索的结果往往与查询者的检索策略息息相关。对大多数用户来说,初次检索大都是求全,无论是利用元搜索引擎还是独立搜索引擎,如果选择的检索词泛指性越大则检索结果的条目越多,多则成千上万条,少则几十上百条;二次检索是求精,在初次检索的基础上缩小或限定检索词的范围,达到接近目标信息源的范畴,最好是控制在 100 条以内;最后是求准,在二次检索的基础上,找出最切题的信息源。产生最后的检索结果后,要对几种不同信息源的可信度进行对比分析,从中选择可信度较高的信息。判断其可信度如何:一是要看该信息是不是有效信息,即是否能有效链接可供阅览,或者提供可供阅览的线索;二是看该信息是哪个网站发布的,该网站的可信度如何;三是要看该信息提供者(个人或团体机构)的可信度如何,是提供者自己的观点还是引证他人的观点,有没有提供该信息的来源和出处;四是要看信息源的时效性,要捕捉网络上最近和最新的信息源,一些过时的信息源常常会导致不正确的选择。如果达不到理想的需要,则要改变检索策略重新检索。根据上述咨询课题性质的判断,该问题是需要GDP 有关的具体数据,属于数值型信息检索的范畴。所谓数值型信息检索,就是以数值或数据(包括文献中的某一数据、公式、图表、化学分子式等等)为对象的一种检索形式。完成数值型信息检索主要借助于各种数值数据库和统计数据库。3?2?网络检索工具的选择与有效利用第一步,选择网络检索工具。首先利用搜索引擎找出与题意相关的数值数据库和统计数据库信息源。如,在?Baidu?里以?中国历年 GDP?中国历年人均GDP?为检索词,找到相关网页约1 910万篇。其检索结果太大,很难选择目标信息源。我们可以重新改变检索式,从高级检索里选择关键词?中国历年 GDP?、包括以下完整关键词?中国历年人均 GDP?、包括以下任意关键词?2008?,找到相关网页 99 篇。第二步,目标信息选择。根据上述 99 篇的检索结果,可以按照其内容提要选择与目标信息接近的信息源网站打开浏览。结果发现,大多数相关信息源都来自于博客,虽然这些网页提供有切题的事实数据,但大都没有注明统计数据的来源依据。那么,这就存在一个信息的可信度问题。怎样判别这些信息来源的可靠性呢?第三步,追踪查询。在对上述部分检索结果的浏览过程中,我们在某些博客和?百度知道?里发现有提供上述数据的来源依据,即中华人民共和国国家统计局网站和?中国统计年鉴?。这就为我们提供了一个可靠的信息来源依据。3?3?检索结果分析通过追踪查询,我们在中华人民共和国国家统计局的网站?统计公报?年度统计公报?全国年度统计公报里,查到?中华人民共和国 2008 年国民经济和社会发展统计公报?,近三年我国国内生产总值分别是:2006 年为211 924亿元、2007 年为257 306亿元、2008年为300 670亿元 7。在中华人民共和国国家统计局的网站?统计数据?年度统计数据?国民经济核算里,查到?中国统计年鉴 2008 年?,近三年我国人均国内生产总值分别是:2006 年为16 165元?人平;2007 年为18 934元?人平;2008 年未统计出来 9。这些数据虽然与网上博客提供的数据不大一样,但它是最可靠、最信赖的数据来源。这个案例说明,对可信度信息源的选择是获取有效信息的第二步。对信息源的分析与选择非常重要,如果分析不正确、选择不恰当,就会产生错误的检索结果。从上面二种实证分析案例可以看出,正确分析信息来源的可信度,综合利用网络检索工具,准确查找信息源是获取有效信息的第一步;在捕捉到的信息源的基础上,对即将选择信息的可信度进行认真比较分析,从中作出正确的选择是获取有效信息的第二步;在获取的有效信息源中,对各种不同的相关信息的内容进行分析判断,最后攫取可信度强的信息是获取有效信息的第三步。就信息检索而言,对获取信息的可信度分析,都是孕育在整个检索过程的每个环节上,如果在其中某一个环节上出现偏差,都可能导致不正确的检索结果。(下转第 19 页)57RESEARCHES IN LIBRARY SCIENCE?RUWF XM L Syntax Checker(http:?w w w?xml?com?pub?a?tools?ruw f?check?htm l)用于查找 XM L文件的错误。W3CFeedValidationService(http:?validator?w 3?org?feed?)用于查找 Atom和 RSS feed 中的错误语法。W3C LinkChecker(http:?validator?w3?org?checklink)用于搜寻查明网站内的所有链接里是否有断链。3?2?6?网页的 WCAG 测试HERA Accessibilitytesting with Style(http:?w w w?sidar?org?hera?index?php?en)使用一种极为复杂但容易理解的方式指出网页的 wcag1?0 兼容性问题。HiSoftwareCynthiaSaysportal(http:?w w w?cynthiasays?com?)采用了非常严格的规则来测试网页(根据 section 508 和 W CAG 1?0 规则),生成的报告也极为详细。TA W Web Accessibility Test(http:?ww w?taw dis?net?taw 3?cms?en)测试网页是否存在冲突(W CAG 1?0 兼容性),通过图形模式生成一份以 w cag 优先模式为基础的网站修改建议。WAVE 3?0Web AccessibilityTool(http:?www?wave?Webaim?org?wave?index?jsp)是高度可定制的工具,它采用了图形化模型展示网站兼容性问题(WCAG 1?0 and section 508)。ATRCWebAccessibilityChecker(http:?checker?atrc?utoronto?ca?index?html)测 试 网 站 的WCAG 2?0 优先级 2 兼容性,它会生成一份报告,提出一系列建议,如:如何提升页头、链接、数据、图表和文字的访问速度。4?总结与建议Web 无障碍网站的建设在总体规划上应该依照WCAG 可访问性规范设定的原则,把 Web 无障碍设计理念贯穿于整个网站设计的各个阶段。在网页编辑工具的选择上,选择符合开发工具易访问性规范 ATAG的网页编辑工具。在多媒体信息和网页文件的格式上,应选用具有可访问性特性的表现形式。在 Web 无障碍网站测评方面,除了采用一些工具软件来评估网页的无障碍水平外,最直接最有效的方式就是在规定时间内,安排若干种类型的视障人士尝试访问被测网页。就他们使用读屏软件读取网站内容的效果进行评定,并采用问卷调查或访谈等研究方法收集用户的反馈情况,再对材料进行加工整理,最后形成一份评估报告。这种方法无疑是最具权威的,但所花费的时间和经费相比之下可能会多出许多,因此评估网页无障碍水平需要综合考虑各方面的因素,以寻找到最合适的方法。注释 1 袁俊?面向建设无障碍网站的 Web 可访问性研究与应用?重庆:重庆大学,2006 2 袁俊等?建设无障碍网站的 Web 可访问性设计原则及技术?重庆大学学报(自然科学版),2007(7):119?122 3 钱国富,涂颖哲?图书馆网站中的无障碍建设问题研究?大学图书馆学报,2004(5):56?59 4 钱小龙,邹霞?美国信息无障碍事业发展概况:WCAG1?0 解读?中国特殊教育,2007(6)5W 3C?Checklist of Checkpoints for W eb Content AccessibilityGuidelines 1?0?http:?www?w3?org?TR?WCAG10?full?checklist?html,2008?12?25?张培宾?郑州航空工业管理学院图书馆。?赵?英?四川大学公共管理学院信息管理系副教授,硕士生导师。(上接第 57 页)注释 1 中国互联网络信息中心?第 23 次中国互联网络发展状况统计报告?http:?www?cnnic?net?uploadfiles?doc?2009?1?13?92209?doc,2009-04-15 2 中国互联网络信息中心?网络成为网民获取信息最主要途径?http:?www?gmw?cn?content?2007?01?24?content _ 540733?htm,2007-04-15 3 张明新?五十年媒介可信度研究述评?湖北大学成人教育学院学报,2005(5):8-11 4 郭家义?网络信息检索效率研究?图书与情报,2003(2):60-63 5 秦立轩,黄剑?网络信息检索及其局限性?数理医学杂志,2008(4):466-468 6 王宇佳?网络信息检索发展趋势摭谈?现代情报,2008(7):48-49 7 中华人民共和国国家统计局编?中国统计年鉴2008年国内生产总值?http:?www?stats?gov?cn?tjsj?ndsj?2008?indexch?htm,2009-05-03?朱?宁?陈红勤?聂应高?咸宁学院图书馆。19RESEARCHES IN LIBRARY SCIENCE?