最新《交通规划年会交通分析模型》168-道路交通流数据质量控制与评价.pdf
《最新《交通规划年会交通分析模型》168-道路交通流数据质量控制与评价.pdf》由会员分享,可在线阅读,更多相关《最新《交通规划年会交通分析模型》168-道路交通流数据质量控制与评价.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 道路交通流数据质量控制与评价 谷远利 马韵楠 李巨伟 【摘要】【摘要】动态交通数据质量评价可为交通管理系统提供可靠的数据支持,是交通管理系统的重要组成部分。本文针对故障数据缺失、不规则时间点和异常数据这 3 类常见问题,提出了交通流数据质量的控制方法和流程。同时,第一次提出分三阶段分别对不同 ITS 检测器的交通数据质量进行评价,并构建了六维评价指标体系。最后以北京市二环路段交通流数据为例,对本文控制流程和评价方法进行了分析与验证。【关键词】【关键词】数据质量控制;故障数据;数据质量评价;ITS 检测器 1、引言、引言 近年,尽管我国各大道路交通基础设施建设取得了较大成就,但是机动车和驾驶
2、员的高速增长使交通管理工作承担了沉重的压力。与此同时,人民群众对交通信息的需求逐步向多元化、便捷化、高效化的模式转变。然而,要提供高质量的信息服务,就必须以高质量的数据为基础。通常检测设备直接获取的交通流数据层次差异大、有效性迥异、周期不同,无法真实反应交通流实际的运行情况。面对庞大而复杂的动态交通数据,如果不进行数据质量控制,既不利于从中找出规律,也不利于数据存储和利用。为体现多元属性的综合性概念,正确率已不再是衡量数据质量的惟一标准。因此,将数据质量定义为数据能否满足用户需求并较为准确的反应客观事实的程度,这样的相对性概念更能符合实际需求。交通流数据质量好坏直接关系到能否为路网服务水平评价
3、等提供可靠的数据保障,是智能交通系统发挥其应有作用的一个必要前提,也是城市交通管理指挥调度平台的重要依据1。因此,对交通数据进行质量控制和评价已经成为非常关键并亟待解决的问题。2、交通流数据质量控制、交通流数据质量控制 2.1 概述概述 进行质量控制不仅可以提高交通信息服务平台发布数据的精度,也能使交通管理者直观并快速的了解城市道路交通运行状况,以给出正确的决策。在整个数据处理过程中,质量控制主要针对数据属性,将海量原始数据中的故障数据,即异常、不规则时间点和丢失的进行修正与补齐,必要时还需要对故障检测器的判别。通过数据质量控制可以将原始数据输出为具有正确时间、空间分布和有效参数值的交通流数据
4、,以方便后续研究和应用。2.2 故障数据处理故障数据处理 对于交通流数据质量控制而言,主要目的就是提高数据精度。将采集到的交通流数据分为正确数据和故障数据,故障数据包括丢失数据、不规则时间点数据和异常数据。2 现有的研究中,一般只笼统的给出产生故障数据的几种情况2,并未深入的挖掘分析其源头。本文针对浮动车、微波和牌照法三种常用检测器在获取数据的整个过程中可能产生故障数据的原因和优缺点进行了比较,如表 1 所示。表 1 检测器产生故障数据原因及优缺点比较 浮动车 微波 牌照法 数据丢失 无法匹配到地图上;浮动车数量不足;硬件故障、噪声干扰、通讯故障 天气、灯光等影响 不规则时间点数据 GPS 漂
5、移、传输过程 硬件故障 设备不足 数据异常 不正常行驶、急停;定位精度不高;道路条件;车流密度过大、遮挡、有车辆停在检测点 天气、灯光等影响 优点 全天候、大范围的采集,获取动态数据 精确度较高、性能稳定 提供可视图像 缺点 涉及信息传输和安全等的维护,存在 GIS 系统不稳定 不适用于拥堵以及大型车较多、车型分布不均匀的路段 造价高,易受天气、灯光、阴影等环境因素影响,晚上报误率高 2.2.1 丢失数据处理丢失数据处理 数据丢失指某一次上传无法获得应有的理论数据样本,表现为关键交通流参数缺失,可能是因为数据无法获取或操作过程中被遗漏,这种缺失是不可避免的。以北京为例,采集器每 2min 采集
6、一次,即每天每个地点每条车道应产生 720 条数据。丢失数据的处理主要有通过交通流历史记录或者曲线拟合的方式近似复现丢失数据;根据导致丢失数据时间段的长短和补缺丢失数据的数据来源不同进行补缺3:对于 1min 内丢失的,优先采用同一检测器临近时间的数据平均;对于 1h 内丢失的,优先采用同一时间同一检测器采集的不同同向车道的数据;对超过 1h 的,采用标准值+扰动因子方法修补历史同期数据。2.2.2 不规则时间点数据处理不规则时间点数据处理 一些数据因为传输问题导致后台数据无法按照反馈频率(2min)或数据编号的顺序获取,即为不规则时间点的数据。为了使得到的数据可以后续同步应用,减少后期不必要
7、的工作量,也为了方便准确的发现缺失数据,需要将所采集到的原始交通流信息样本中的时间记录值字段与正常情况下采集时间点对比。将所有数据的时间点与各自最邻近的标准时间点作差之后,得到左偏和右偏差值4,使之符合横向时间序列(同一地点一天 24 小时数据排列)和纵向时间序列(同一地点每天同一时刻数据)。2.2.3 异常数据异常数据 异常数据指不在期望的范围内或不满足已有的原理与规则(如交通流理论),在检测周期中发生突变,不符合客观事实和逻辑的无效数据。异常数据判别是对原始数据中交通流参数记录值进行检验,由于无效的概念比较模糊,相对不易判别。异常数据判别方法有交通流参数合理阈值原理、交通流机理以及阈值原理
8、和交通流机理结合的 3 种5。此外,还需判别异常数据是否为事件数据(事故、道路维修等),若为事件数据则无需修正。3 异常数据的修正方法大多以回归、线性插值和加权移动平均等传统时间序列预测方法为主6。目前在应用中采用对于不满足阈值理论的数据,用阈值替代异常数据,但是不区分时间段和路段给予统一较高阈值来替换会导致修正速度偏大,不能准确的反应道路实际情况。考虑到浮动车可以获取大量连续数据,所以采用线性插值法或历史数据平均值替换更为准确和简便。2.2.4 故障检测器的判断故障检测器的判断 有时路段会出现数据连续周期较大偏离正常值,此时应考虑对检测器进行故障判别,尽量减少错误数据的产生。常用的判断方法有
9、以下几种:连续交通数据格式错误;连续交通数据丢失或异常;连续交通数据重复传入;所丢失或异常数据样本占总量的比例较高;夜间交通数据拥堵样本占夜间或全天交通样本比例较高6。如果有符合以上情况的数据,则应该根据数据编号对应检查固定检测设备是否故障,根据发回故障数据的车辆信息,由出租车公司检查相应浮动车 GIS 设备。3、交通流数据质量评价方法、交通流数据质量评价方法 数据质量评价要具有实际可操作性,就必须对数据质量进行量化,量化的第一步是制定出合理的评价指标。旅行时间数据精确度和完整度均可以达到 95%以上,故将其作为评价数据质量的参照。现有的质量评价方法主要是进行宏观分析7,但是考虑到路网中各个路
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 交通规划年会交通分析模型 最新 交通 规划 年会 分析 模型 168 道路 通流 数据 质量 控制 评价
限制150内