《5.4最大熵原理在交通流统计分布模型中的应用.pdf》由会员分享,可在线阅读,更多相关《5.4最大熵原理在交通流统计分布模型中的应用.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 1卷第 3期 2001年 9月 交 通 运 输 工 程 学 报 Journal of Traffic and Transportation Engineering Vol. 1 No. 3 Sep. 2001 收稿日期: 2001-03-28 作者简介: 俞礼军 ( 1972-) ,男 ,新疆阿拉尔人 ,长安大学博士生 ,从事交通工程研究 . 文章编号: 1671-1637( 2001) 03-0091-04 最大熵原理在交通流统计分布模型中的应用 俞礼军 ,严海 ,严宝杰 (长安大学 公路学院 ,陕西 西安 710064) 摘要: 交通流统计分布函数的形式具有多样性 ,选择把数据套到一个
2、适合的分布上去常常是困难 的。为此 ,寻求一种简便的产生概率密度函数的统一方法是十分必要的。运用最大熵原理不仅导出 了几个科学实践中常见的概率分布密度函数 ,而且在分析物理学中已有的导出公式的基础上给出 了交通工程实践中产生概率密度函数的统一方法及其实用的数值算法。 理论例题仿真与实例计算 验证表明该方法和程序是合理有效的。 关键词: 最大熵方法;交通流;概率密度函数 中图分类号: U491. 112 文献标识码: A Maximum Entropy Method and It s Application in Probability Density Function of Traffic F
3、low YU Li-jun, YAN Hai, YAN Bao-jie (School of Highway,Changan University,Xian710064,China) Abstract :Probability density function of traffic flow varies with different survey data. It is difficult to find a probability density function fitting for all kinds of traffic survey data. So to get an ordi
4、nary generating method of probability density function is greatly important for traffic researcher and engineer.The authors analyze the problem from the view of maximum entropy principle, work out six probability density function which often appear in traffic practice, and derive a formula and it s
5、practical algorithm from physicist s achievement. The method and program are proven to be really effective in theoretical simulation and practice examination. Key words:maximum entropy method; traffic flow; probability density function 目前实践中惯用的得到交通流统计分布模型 (概率密度函数 )的方法是: 调查数据 ,把数据套到一 个适合的分布上去 ,然后检验 ,
6、若分布通过检验则该 分布成为指导工作的理论过程。 为什么这些调查数 据应当符合某种概率分布? 概率分布 (模型或公式 ) 是凑巧吻合了这些数据 ,还是产生这些数据的母体? 更重要的是 ,在交通工程实践中如何面对大量的随 机数据和与之相关由直方图勾勒出来的复杂曲线形 状的概率密度函数拟合问题。 尽快找到一个通用的 生成概率密度函数的方法建立交通流统计分布模 型 ,不仅对道路交通规划设计和管理在实践中发挥 最大功效 ,而且对更深刻了解交通现象及其本质都 有着积极而深远的意义。 本文运用最大熵原理回答 了上述问题 ,从而为交通流统计分布建模提供了一 种有效方法。 1 最大熵原理 1. 1 基本原理
7、熵是来自热力学的一个概念。 在哲学和统计物 理中熵被解释为物质系统的混乱和无序程度。 信息 论则认为它是信息源的状态的不确定程度。 所谓熵 增加原理 ,是指孤立系统向着微观状态最混乱的方 向变化 ,直到熵达最大。 1948年 ,香农 ( SHANNON C E)把玻尔兹曼熵 的概念引入信息论并把熵作为一个随机事件的不确 定性或信息量的量度。 因此 ,信息数量的大小 ,可以 用被消除的不确定性的多少来表示 ,而随机事件不 确定性的大小可以用概率分布函数来描述。 如果随机变量 X 取值为 xi, i= 1, 2, , n,且 x = xi全体是两两不相容的 , xi出现的概率为 pi, i =1,
8、 2, , n, n i= 1 pi=1, 这 时称 X 为 概 率 场。 SHANNON证明了下式 ,即 H(X ) = - c n i= 1 pilnpi (c 0)( 1) 是满足下列条件的唯一函数: ( 1) H是 p1,p2, , pn的连续函数; ( 2)当且仅当 p1= p2= = pn时 , H取最大值; ( 3) H( X )= H( Y )+ H(X /Y ) ,其中 Y= f ( X ) , H (X /Y )为已知 Y 的条件下 , X 的条件熵 ,此时 ,称 H (X )为概率场 X 的熵。 如果随机变量 X 是连续分布的 ,其分布密度函 数为 f (x ) ,X 的
9、熵定义为 H (X ) = - R f ( x ) lnf (x ) dx( 2) 式中: R为 f ( x )的定义域。 基于熵的定义 ,可以直观地说明最大熵分布原 理 1: 最小偏见的概率分布是这样一种分布 ,使其熵 在根据已知样本数据信息的一些约束条件下达到最 大值 ,即 max H = - R f ( x ) lnf (x ) dx s. t. R f ( x )dx = 1 Rx n f (x ) dx = _n; n = 1, 2, , N ( 3) 式中: _n为第 n阶原点矩 ,其值可由样本数据计算 出来 ,计算公式见式 ( 4); N 为所用原点矩的阶数。 _n= 1 m m
10、 i= 1 xni( 4) 若 f (x )是用 N+ 1个参数形式表示的 ,则可以 用一种数值优化方法直接由式 ( 3)解出待定参数。 1. 2 最大熵分布概率密度函数的解析式 最大熵分布就是在保证样本的统计特性条件下 通过调整 f ( x )使熵 H达到最大。 现用经典的变分 法求解式 ( 3)。 引进拉格朗日不定乘子 0 、 1、N 做目标泛函 L =H + N n= 0 n Rx n f ( x )dx - _n( 5) 令 L 对 f ( x )的变分为 0,即 W L= - R 1+ lnf (x ) W f (x )dx+ N n= 0 n Rx nW f (x )dx= R 1
11、- lnf (x )+ N n= 0 nxnWf (x )dx= 0( 6) 由于 W f (x )的任意性 ,式 ( 6)方括号内的量必须为 0,因此得到 lnf (x ) = 0+ N n= 1 nxn( 7) 或f (x ) = exp 0+ N n= 1 nx n ( 8) 注意: 式 ( 7)、 ( 8)已用0代替了 0+ 1 。式 ( 8)就 是最大熵分布概率密度函数的解析式 ,也就是式 ( 3) 的一个最优解。 表 1给出了不同的约束下熵达极大时所对应的 分布密度函数。 包括表 1中的很多熟知的概率分布 都能用最大熵方法推导出来 ,这显示了最大熵原理 (方法 )可以作为众多概率分
12、布的统一理论的支点。 2 计算方法 最大熵分布概率密度函数的解析式 (即式 ( 8) ) 已经得到。 现在 ,只要确定各乘子 n( n= 0, 1, , N ) ,就可以用最大熵分布表示变量 x 的随机特性。 下面给出乘子 n(n= 0, 1, ,N )的计算公式。 2. 1 公式的导出 由概率的规范性公理可得下式 Rexp( 0+ N n= 1 nx n ) dx =1( 9) 两边乘以 e - 0 e - 0 = R exp( N n= 1 nxn) dx( 10) 0的计算公式为 0= - ln R exp( N n= 1 nxn) dx( 11) 为求乘子 n(n= 1, 2, , N
13、 ) ,可将式 ( 10)对 n微 分 ,得 0 n = - Rx n exp(0+ N j= 1 jx j ) dx( 12) 上式等号右边就是第 n阶原点矩的负值 ,即 0 n = - _n( 13) 将式 ( 11)对 n微分 ,又可得 92交通运输工程学报 2001年 表 1 熵达极大时的分布密度函数 约束方程概率分布函数名称说明 1均值给定 ,且大于 0,_=x f (x )= q p f (x )= pqx几何x 为离散变量 ,p+ q= 1 2均值给定 ,且大于 0,_= a xf (x )dxf ( x )= 1 _ - a e- x- a _ - a指数x 为连续变量 ,a为
14、 x 的下限 3x 仅能出现在 a、b之间f (x )= 1 b- a 均匀x 为连续变量 , b a 4x 的方差固定为 e 2,e = - (x - _ ) 2f (x )dx f(x)= 1 2 e exp - (x - _ )2 2 e 正态x 为连续变量 ,x 的均值为 _ 5 ( x - a)2的均值为固定值,_ =(x - a)2f (x ) dx ln(x - a)的均值为固定值 f(x)= n _ (x-a)n- 1ex p - ( x - a)n _ 韦伯 xa 6(x-a),ln1 + exp - x - a Uf (x )= exp - x - a U U 1 + ex
15、 p 1 + x - a U 2 罗吉斯蒂克 xa 0 n= - Rx n exp( N j= 1 jx j ) dx Rexp( N j= 1 jxj)dx (n= 1, 2, , N ) ( 14) 由式 ( 13)、 ( 14)可得 _n= Rx n exp( N j= 1 jx j ) dx R exp( N j= 1 jx j ) dx (n= 1, 2, ,N ) ( 15) 式 ( 15)即为求 n(n= 1, 2, ,N )的 N 个联立方程。 为便于数值求解 ,将式 ( 15)改写为如下形式 Qn= 1- Rx n exp( N j= 1 jxj)dx _n Rexp( N
16、j= 1 jx j )dx (n= 1, 2, ,N ) ( 16) 确定优化问题目标函数 minQ= N n= 1 Q 2 n( 17) 求解式 ( 17)就可得到问题的解。上式中 Qn为残 差 ,通过调整 n(n= 1, 2, ,N )的值可使它减小到 接近于零。 一般 R 0 (n、k= 0, 1, ) ( 18) (当 a,b 0, 1时表达式比较复杂 )。 定理 2 最大熵解 f (x )平均值收敛于 f - ( x ) ,即 对于 a,b 上的连续函数 F(x ) , F( x )对于 f (x )的 矩收敛于 F(x )对于 f - ( x )的矩 ,即 lim NR F(x )
17、 f ( x )dx= lim N b a F(x ) f (x ) dx= b aF( x )f - (x ) dx ( 19) 现在还无法证明 f (x )的逐点收敛性。 f ( x )的 平均值收敛性虽然比逐点收敛性弱 ,但在一般工程 应用已经足够。 最大熵方法是解决本文的矩问题的一种方法 , 它实质上是对未知高阶矩进行非零外推。 2. 2 算法步骤及实施要点 ( 1)根据已知样本数据 ,计算出各阶原点矩 ,一 般取 N= 3 6;同时确定积分的上界值和下界值。 一般情况下 ,当概率密度函数的曲线形状比较复杂 时 ,N 值要取得大一些 ,但样本容量不宜太小 (小于 30) ,否则高阶矩的
18、统计值会因误差较大而失去意 义。 用式 ( 17)计算 ,当 x 值较大且矩的阶数较高时 , 计算原点矩和中心矩就有溢出的可能性。 为了避免 计算机中止计算现象 ,可将 x 值域变换到 0, 1之 间来计算 ,先求出 n(n= 0, 1, , N ) ,然后再算出 原定义域的 n(n= 0, 1, , N)。计算经验表明 ,按式 ( 16)计算 ,须确定一个合适的积分限 R。若积分的上 界值和下界值选择不好 ,可能使最大熵分布的尾部 93第 3期俞礼军 ,等: 最大熵原理在交通流统计分布模型中的应用 出现一个不应有的升高现象。 为了消除这种现象 ,有 时需要进行多次试算 ,从结果的比较中选择一
19、个合 适的上、下界值。 ( 2)建立残差优化模型式 ( 17) ,维数 n= N+ 1, 设计变量就是 n(n= 0, 1, , N )。 设置优化搜索的 初始值。 使用经验表明 ,有一个好的初始点 ,对算法 的收敛很重要。 在实际应用中 ,各乘子 n(n= 0, 1, , N )对概率密度函数的曲线形状的影响很敏感 , 因而对这些乘子的取值需要取较高的有效位数 ,一 般用双精度计算。 ( 3)调用优化算法子程序。 ( 4)判断 ,若收敛则转 ( 6) ;否则转 ( 5)。 ( 5)用另一初始点重新计算 ,转 ( 3)。 ( 6)输出 n(n= 0, 1, , N )的值。 ( 7)计算结束。
20、 3 应用计算实例 作者编了软件 ,对现有的常见分布都进行了仿 真运算 ,限于篇幅这里只给两个仿真算例。图 1给出 了用 (四阶 )最大熵法拟合一个理论解析分布 (正态 分布 ,均值为 10,方差为 1,样本数为 200)的结果。 图 2给出了用 (四阶 )最大熵法拟合一个理论解析分 布 (指数分布 , = 1,样本数为 200)的结果。 从图中 可以看出拟合效果是比较好的。 图 1最大熵分布拟合 (理论 )正态分布 图 2 最大熵分布拟合 (理论 )指数分布 实例: 观测某路段非机动车流量 ,以 5 s为计算 图 3 最大熵分布拟合实测值 单位所得数据共 267个 , 试求此流量的统计分布。
21、 根据样本值可以做 出它的直方图 ,同时用三 阶样本矩做出它的最大 熵分布 ,如图 3所示。 其 最大熵法产生已知样本 的概率密度函数的解析表达式为 f ( x )= exp(0+ N n= 1 nxn) 式中:0= - 2. 466723 35438651;1= 0. 423 336552 697195;2= - 0. 101762 144355052;3= 0. 005 097382491 29024;理论流量 的统计均值为 x - = 4. 549425 420 675 66;标准差 ex = 5. 468170449 268 66 。 做i 2 检 验 拟 合 优 度 检 验( i 2
22、 = 13. 646 376 423 0595 i 2 0. 05= 19. 675) ,结果表明拟 合效果是优良的。 一般需要多次试算才能最终确定 最大熵分布的解析表达式。 这是它的不足之处 ,经多 次实测数据验证肯定该方法的实用性。 4 结语 利用最大熵方法 ,不仅使我们向各种数据为什 么符合某个概率分布的真正原因迈进了一大步 ,而 且获得了一个在交通工程实践中有广泛的应用前景 的方法。 应该指出 ,用最大熵方法产生的概率密度函 数属于一种理论模型 ,它除了具有明确的数学解析 式外 ,在计算方面也并不复杂。 最大熵方法产生概率密度函数的精度取决于样 本容量及其上下界值的选定。样本量如果太小
23、 (小于 30) ,高阶矩的统计值会因误差较大而失去意义。 样 本量最好大于 200 。需要样本量大是其缺陷 ,好在相 当多交通调查中能够保证样本量。 积分上下界值的 选定很重要。 积分的上界值和下界值选择不好 ,可能 使最大熵分布的尾部出现一个不应有的高出部分。 最大熵分布需要寻优计算 ,常常是反复试算才 能得到好的结果。 尽管最大熵方法有样本量、计算量大 (并不复 杂 )的缺点 ,但它不需要把数据套到一个常见的分布 上去然后假设检验。因而较之以上的缺点 ,最大熵方 法的优点是突出的。 由前文得到启发 ,恰当地把“熵达极大”作为目 标 ,辅以适宜的约束条件 ,然后把它“融入”交通工程 的研究对象则有可能得到有意义的结果。 参考文献: 1JAYN ES E T.Information theory and statistical mec- hanicsJ. Physical Review, 1957, 106( 4): 620 630. 2吴乃龙 ,袁素云.最大熵方法 M .长沙: 湖南科学技术 出版社 , 1999. 286 298. 94交通运输工程学报 2001年
限制150内