网络爬虫技术在交通信息获取的应用.docx
《网络爬虫技术在交通信息获取的应用.docx》由会员分享,可在线阅读,更多相关《网络爬虫技术在交通信息获取的应用.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络爬虫技术在交通信息获取的应用 摘要:互联网上的有关交通的网页文本数据常常是非结构化、分散性的,面对不断增长的海量信息,如何从中提取出有用的交通信息具有一定难度传统的信息采集处理方法很难高效准确地完成海量信息处理由此,网络爬虫技术则显示出其优越性文中介绍了网络爬虫技术的基本内容,总结了各类交通信息获取方法的研究,从不同方面综述了国内外应用网络爬虫技术解决交通信息获取问题的研究历史和现状,展望了网络爬虫技术在交通中的应用前景 关键词:交通工程;交通信息;网络爬虫技术;综述 在交通系统运行过程中会产生一系列的交通信息,各种信息技术广泛应用于智能交通系统的同时,积累了海量的交通数据,这些数据分散地
2、分布在互联网网页上海量交通信息对信息采集及处理方法等都提出了新的更高的要求传统的信息采集处理方法大多是对有限的、有规则的信息数据进行收集,并不能对海量交通信息进行批量获取、保存,以及管理,因此无法准确高效地解决海量交通信息获取问题在相关的研究中,有学者利用数据挖掘技术进行了大规模交通数据管理、整合和挖掘近年来,国内外一些学者尝试使用网络爬虫技术来获取互联网上的海量交通信息,将网络爬虫技术应用到了交通信息的获取分析中从目前的研究成果来看,网络爬虫技术对于交通中的各类信息获取具有很好的应用前景,将成为交通信息获取研究的重要方法之一 网络爬虫技术 网络信息获取技术,是指对网络流中非结构化的信息,设法
3、将其读取出来,然后将其保存至结构化的本地数据库其中,网络爬虫是最典型的例子网络爬虫,通常又称之为信息采集器或网络蜘蛛,是遍历并以有条理的自动方式下载文档的程序或软件年,全球首个网络检索工具诞生,即现阶段,一百零一度、等是相对来说比较盛行的搜索引擎网络爬虫的过程给定一个或多个种子,是网络爬虫的首要条件其次,需要将与这些相关联的网页下载下来,提取其中涉及到的所有超链接;最后,递归地继续去下载被这些超链接所标识的网页网络爬虫的过程见图使用遍历的方式,访问互联网这个超级“图”的各个节点,找寻并获取有用信息,这是网络爬虫的目的因此,网络爬虫的体系结构一般由以下几个模块组成:初始化模块、页面获取模块、页面
4、解析模块,以及过滤模块网络爬虫分类及爬虫搜索策略按照系统结构和实现技术,可以对网络爬虫进行分类主要包括通用网络爬虫(全网爬虫)、聚焦网络爬虫(主题网络爬虫)、增量式网络爬虫和深层网络爬虫这四种类型在实际应用中,通常将这几类爬虫进行结合使用以达到目的爬虫的搜索策略是网络爬虫的核心问题,其优劣决定了爬虫系统的效率和性能主要的网络爬虫搜索策略包括深度和广度优先、基于内容的、基于链接的搜索策略其中,由于能够较为全面地遍历中的所有网页结点,深度和广度优先搜索策略较适合全网爬虫,也即通用型网络爬虫系统基于内容的搜索策略,如算法,首先是对网页中的文本内容信息进行分析,然后依据用户主题与其之间的相关度,对网络
5、爬虫遍历的方向和路径进行确定当期望可以对重要性较高的网络页面优先抓取时,就可以采用基于链接的搜索策略该搜索策略首先挖掘及解析网页之间的链接关系,从而计算出网页的重要性,按照网络页面重要性相关度由高到低依次爬取 交通信息获取的研究 利用传感器网络、射频识别等技术获取交通信息在智能交通系统研究领域,利用传感器网络技术研究单点、断面和区域的交通信息获取方法是重点的研究方向张毅刚对交通信息获取的需求进行了分析,设计了无线传感网,用来获取道路交通信息李海舰研究了一种多参量交通信息获取的方法,实现了网络中单个传感器获取尽可能丰富的多参量交通信息而这些信息中,包含着交通流参数、交通流构成要素等射频识别技术,
6、又称之为无线射频识别对于特定目标,射频识别技术可通过无线电讯号对其进行识别,并读写相关数据利用射频识别技术原理,康慨设计了一种交通信息获取系统框架结构,来完成交通车辆信息的获取赵泰洋等提出了一种交通信息获取系统,这个系统就是基于射频识别技术,使获取车辆的身份信息和位置信息得到实现刘海华等建立了交通信息采集及融合处理技术框架,利用射频识别技术读卡装置来采集实时交通信息基于定位数据、多源数据等的交通信息获取基于定位数据与技术的交通信息获取是交通大数据研究的方向之一王汝洸研究了城市交通起讫点信息获取方法,其中就包括基于浮动车定位数据对这些信息进行获取赖见辉研究了基于手机定位数据的交通信息提取技术胡坚
7、明等基于无线定位技术,对相当精度交通信息的获取方法进行了研究对于基于多源数据的交通信息获取,戴志鑫通过该方法对交通状态特征信息的获取进行了研究基于交通控制系统、车辆系统和道路收费系统等多源数据,李琦提出了获取交通信息数据并对其进行预处理的方法利用摄像装置获取交通信息利用摄像装置进行动态交通信息的获取,是智能交通系统中的一个重要手段王超研究了适用于交通引导系统的交通数据采集技术,其中包括了利用摄像装置采集信息的视频车辆检测技术基于视频图像处理,张瑞等对微观交通数据的获取进行了研究,即通过视频数据获取车辆行驶轨迹、车速和车头时距等其他交通信息获取方法徐东伟对道路交通状态的获取方法进行了研究,提出了
8、道路交通状态多维多粒度获取方法具体来说,这种方法是基于交通信息模板、区域交通吸引子匹配、虚拟速度传感器节点及压缩感知来对道路交通状态信息进行获取从固定点、轨迹线和大空间交通数据三个方面,曲腾姣系统地解释了动态交通数据的获取技术通过对微观仿真系统模型结构及仿真运行特点进行研究,霍莹提出了基于时空折算对交通信息进行获取的方法交通信息获取是智能交通的重要组成部分,就目前而言,交通信息的获取方法多样,但大多数都是对有限个、结构化的数据进行获取虽然有些技术已经较为成熟,解决了结构化的交通信息的获取问题,但是面对海量交通信息,这些技术与方法仍均需要不断地改进,其研究也需要依据需求进一步深入 应用网络爬虫技
9、术进行交通信息获取 交通事故分析数据获取通过对交通事故涉及到的事故车辆、事故天气、道路状况等其他有关的数据进行获取和深度挖掘,从中找到交通事故致因,分析事故发生的规律等开发了一个爬虫,用于自动从签到数据中收集场所类型信息,研究了如何利用签到数据将人类活动信息融入城市地区撞车事故的空间分析中周菲菲截取了贵阳市和上海市这两地年的交通事故数据,并利用爬虫系统获取了网络中的车辆品牌数据,与原数据进行融合后生成车辆类型新变量,通过统计分析和可视化分析得到了影响交通事故发生的相关因素文献利用网络爬虫技术从中国天气网站抽取了天气信息,从新浪微博上获取了包含“交通事故”的消息,从中探索出了天气情况对交通事故发
10、生的影响南春丽等采用数据采集方法,从北京交通管理部门的网站,获取了交通事故点文字信息,然后将其与相关道路线形空间数据整合,进行了这两者等的相关性研究目前,国外在应用网络爬虫技术获取交通数据以用于交通事故分析方面的研究较少,而国内在这方面的研究则取得了相对较多的成果国内不同的相关研究获取的数据也不同,主要包括:外部互联网的车辆品牌数据、微博上的“交通事故”消息、权威网站的交通事故点文字信息等公共交通信息获取公共交通信息包括与公共交通服务有关的信号、数据、显示等,通过网络爬虫技术可对其进行批量获取提出了一种解决自行车需求预测问题的方法,其中便给出了用于读取数据的代码自行车共享系统产生的数据,即旅行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 爬虫 技术 交通 信息 获取 应用
限制150内