搜索机器人应用于采集电子证据探讨.doc
《搜索机器人应用于采集电子证据探讨.doc》由会员分享,可在线阅读,更多相关《搜索机器人应用于采集电子证据探讨.doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、最新【精品】范文 参考文献 专业论文搜索机器人应用于采集电子证据探讨搜索机器人应用于采集电子证据探讨 摘 要 在网络犯罪中,很多的证据是散落在互联网的各个角落,特别是非法言论、虚假信息、传销广告、诈骗信息等。公安机关侦查部门就需要采用特殊手段,收集对案件有法律效力的网络电子证据。面对庞大的互联网信息,人工搜索的方式不仅费时费力,花费的人力物力成本高,而且不能够全面的获取需要的电子证据。运用搜索机器人的方式,建立互联网收集的信息收据库,根据制定的搜索规则,及时的遍历互联网络信息的节点,提取有效的电子证据,为司法实践提供高效全面的数据库查询,有力的打击网络犯罪。 关键词 搜索机器人 电子证据 信息
2、检索 作者简介:唐剑刚,云南警官学院信息网络安全学院教师,主要从事网络安全与计算机犯罪研究。 中图分类号:D925文献标识码:A文章编号:1009-0592(2014)02-259-02 在电子取证过程中,通过传统的手段获取分散在互联网上的电子证据是一件十分不容易的事情,不仅人工需要搜索大量的网页,进行庞大的数据筛选,还需要花费大量的人力物力。为提高公安机关侦查部门快速获取来自互联网的电子证据,可以运用搜索机器人的方式,并结合数据库管理系统的模式。采用搜索机器人可以极大的提高检索互联网信息的能力,有效的降低成本。 一、搜索机器人介绍 随着信息技术的飞速发展,搜索引擎已经成为日常生活查找信息的必
3、备工具,如Google、百度、雅虎等。除此之外,还有一些针对特定的信息进行搜索的工具,如专门搜索新闻、影视、图片等的搜索引擎。人们通过运用搜索引擎极大的提高了检索信息的能力,有效的降低了成本。 在司法实践中,为了互联网取证过程更方便、准确、及时,并获取作为电子证据使用的专业的检索信息,因此研究搜索机器人采集电子证据的模型具有重要的现实意义。 由于全球化资源的信息,导致信息的容量极大、具有异构性和分布式的特点,这给信息检索带来了挑战。如何快速获取所需信息是电子取证面临的重要问题。解决这个问题的途径是就是正确的使用搜索机器人。 搜索机器人也称“网络蜘蛛(Spider)”,是指根据设定的搜索策略、运
4、用定制的计算机程序代码实施互联网上信息的收集工作。通过对采集的庞大的凌乱信息进行分析和处理,再为用户提供信息检索服务。 二、搜索机器人的原理 搜索机器人是提供因特网和万维网上的一种信息检索服务的系统,其具有信息搜索、分析、索引、检索与提供服务功能。作为一种Internet信息检索系统,其基本原理是:使用Robot(一段搜索程序,此类还有Spider、Wander、Crawler等)来遍历整个可以访问到的因特网它通过遍历整个网络资源WEB资源,能够扫描用户指定的IP地址范围内的所有网站,通过网站内部的超链接、网站内的外部链接,沿着链接从一个网页爬行到另一个网页,从一个网站到另一个网站采集网页信息
5、数据。搜索机器人将分布在Web上的特定信息下载到本地建立的信息库,然后对本地的信息库根据设计要求进行自动分析并建立以关键词为单位的索引文件。当用户根据需要进行信息查询时,搜索引擎通过索引文件查找出数据库中匹配的文档或链接,并根据检索关键词在每网页中出现的频率,对包含这些关键词的网页进行排序,最后输出查询结果。 网络搜索机器人为保证采集的信息最新,还会回访已抓取过的网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。通常见到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当输入关键词进行查询时,搜索引擎会从庞
6、大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现出来。 搜索引擎功能的实现是建立在使用搜索机器人的基础上的进行Internet搜索,自动抓取目标网站的网页,然后将获取的网页内容进行索引,并同时记录与检索有关的属性,对于中文搜索引擎,还需要先对中文进行分词,然后数据库系统才能够提供用户的查询服务,进而开始检索索引文件并按照各种参数执行复杂高级的计算,最后生成查询结果并返回给用户。为了保证网络机器人遍历的信息范围更广、深度更强,那么需要定制一些重要的链接并制定合理的扫描策略。搜索机器人将遍历得到的网页信息保存在临时数据库中。再通过建立索引,按照倒排文件的格式存放来提高检索效
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 搜索 机器人 应用于 采集 电子 证据 探讨
限制150内