神经网络-(6)BP网络.ppt

资源ID：78599076 资源大小：270.50KB 全文页数：52页
资源格式： PPT 下载积分：15金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要15金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

神经网络-(6)BP网络.ppt

人工神经网络及其应用第6章BP神经网络1一、内容回顾二、BP网络三、网络设计四、改进BP网络五、内容小结内容支配2一、内容回顾感知机自适应线性元件3一、内容回顾感知机感知机简介神经元模型网络结构功能说明学习和训练局限性自适应线性元件4一、内容回顾感知机自适应线性元件Adline简介网络结构网络学习网络训练52.1 BP网络简介2.2 网络模型2.3 学习规则2.4 图形说明2.5 网络训练二、BP网络6反向传播网络(Back-Propagation Network，简称BP网络)是将W-H学习规则一般化，对非线性可微分函数进行权值训练的多层网络权值的调整接受反向传播(Back-propagation）的学习算法它是一种多层前向反馈神经网络，其神经元的变换函数是S型函数输出量为0到1之间的连续量，它可实现从输入到输出的随意的非线性映射2.1 BP网络简介72.1 BP网络简介BP网络主要用于下述方面函数靠近：用输入矢量和相应的输出矢量训练一个网络靠近一个函数模式识别和分类：用一个特定的输出矢量将它与输入矢量联系起来；把输入矢量以所定义的合适方式进行分类；数据压缩：削减输出矢量维数以便于传输或存储具有将强泛化性能：使网络平滑地学习函数，使网络能够合理地响应被训练以外的输入泛化性能只对被训练的输入输出对最大值范围内的数据有效，即网络具有内插值特性，不具有外插值性。超出最大训练值的输入必将产生大的输出误差82.2 网络模型一个具有r个输入和一个隐含层的神经网络模型结构 92.2 网络模型感知器和自适应线性元件的主要差别在激活函数上：前者是二值型的，后者是线性的BP网络具有一层或多层隐含层，除了在多层网络上与前面已介绍过的模型有不同外，其主要差别也表现在激活函数上。BP网络的激活函数必需是到处可微的，因此它不能接受二值型的阀值函数0，1或符号函数1，1BP网络常常运用的是S型的对数或正切激活函数和线性函数102.2 网络模型BP网络特点输入和输出是并行的模拟量网络的输入输出关系是各层连接的权因子确定，没有固定的算法权因子通过学习信号调整。学习越多，网络越聪慧隐含层越多，网络输出精度越高，且个别权因子的损坏不会对网络输出产生大的影响只有当希望对网络的输出进行限制，如限制在0和1之间，那么在输出层应当包含S型激活函数在一般状况下，均是在隐含层接受S型激活函数，而输出层接受线性激活函数112.2 网络模型S型函数具有非线性放大系数功能，可以把输入从负无穷大到正无穷大的信号，变换成-1到l之间输出对较大的输入信号，放大系数较小；而对较小的输入信号，放大系数则较大接受S型激活函数可以处理和靠近非线性输入/输出关系122.3 学习规则BP算法属于算法，是一种监督式的学习算法主要思想对于q个输入学习样本：P1,P2,Pq，已知与其对应的输出样本为：T1,T2,Tq使网络输出层的误差平方和达到最小用网络的实际输出A1,A2,Aq,与目标矢量T1,T2,Tq之间的误差修改其权值，使Am与期望的Tm,(ml,q)尽可能接近132.3 学习规则BP算法是由两部分组成,信息的正向传递与误差的反向传播正向传播过程中，输入信息从输入层经隐含层逐层计算传向输出层，每一层神经元的状态只影响下一层神经元的状态假如在输出层未得到期望的输出，则计算输出层的误差变更值，然后转向反向传播，通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标142.3 学习规则假设输入为P，输入神经元有r个，隐含层内有s1个神经元，激活函数为F1，输出层内有s2个神经元，对应的激活函数为F2，输出为A，目标矢量为T152.3 学习规则信息的正向传递隐含层中第i个神经元的输出输出层第k个神经元的输出定义误差函数162.3 学习规则利用梯度下降法求权值变更及误差的反向传播输出层的权值变更其中同理可得172.3 学习规则利用梯度下降法求权值变更及误差的反向传播隐含层权值变更其中同理可得182.3 学习规则对于f1为对数S型激活函数，对于f2为线性激活函数192.4 误差反向传播图形说明误差反向传播过程事实上是通过计算输出层的误差ek，然后将其与输出层激活函数的一阶导数f2相乘来求得ki由于隐含层中没有干脆给出目标矢量，所以利用输出层的ki反向传递来求出隐含层权值的变更量w2ki。然后计算同样通过将ei与该层激活函数的一阶导数f1相乘，而求得ij，以此求出前层权值的变更量w1ij假如前面还有隐含层，沿用上述同样方法依此类推，始终将输出误差ek逐层的反推算到第一层为止202.4 误差反向传播图形说明212.5 网络训练训练BP网络，须要计算网络加权输入矢量以及网络输出和误差矢量，然后求误差平方和当所训练矢量的误差平方和小于误差目标，训练停止；否则在输出层计算误差变更，且接受反向传播学习规则来调整权值，然后重复此过程网络完成训练后，对网络输入一个不是训练集合中的矢量，网络将以泛化方式给出输出结果222.5 网络训练为了能够较好地驾驭BP网络的训练过程，我们用两层网络为例来叙述BP网络的训练步骤初始化：用小的随机数初始化每一层的权值W和偏差B，保证网络不被大的加权输入饱和期望误差最小值error_goal最大循环次数max_epoch修正权值的学习速率1r，一般状况下k0.0l,0.7232.5 网络训练变量表达：计算网络各层输出矢量A1和A2以及网络误差EA1tansig(W1*P，B1)；A2purelin(W2*A1，B2)；ET-A；权值修正：计算各层反传的误差变更D2和D1并计算各层权值的修正值以及新权值：D2deltalin(A2，E)；D1deltatan(A1，D2，W2)；dlWl，dBllearnbp(P，D1，lr)；dW2，dB21earnbp(A1，D2，1r)；W1W1十dW1；B1B1十dBl；W2W2十dW2；B2B2十dB2242.5 网络训练计算权值修正后误差平方和SSEsumsqr(T-purelin(W2*tansig(W1*P，B1)，B2)检查：SSE是否小于err_goal。若是，训练结束；否则接着以上全部的学习规则与训练的全过程，可以用函数trainbp.m来完成它的运用只需定义有关参数：显示间隔次数，最大循环次数，目标误差，以及学习速率。调用后返回训练后权值，循环总数和最终误差TPdisp_freq max_epoch err_goal 1rW，B，epochs，errorstrainbp(W，B，F，P，T，TP)25三、网络设计3.1 网络的层数3.2 隐含层神经元数3.3 初始权值的选取3.4 学习速率3.5 期望误差的选取3.6 应用举例3.7 局限性263.1 网络的层数理论上已经证明：具有偏差和至少一个S型隐含层加上一个线性输出层的网络，能够靠近任何有理函数定理：增加层数主要可以进一步的降低误差，提高精度，但同时也使网络困难化，从而增加了网络权值的训练时间。一般状况下应优先考虑增加隐含层中神经元数仅用具有非线性激活函数的单层网络来解决问题没有必要或效果不好线性问题非线性问题273.2 隐含层神经元数网络训练精度的提高，可以通过接受一个隐含层，而增加其神经元数的方法来获得。这在结构实现上，要比增加更多的隐含层简洁得多定理：实现随意N个输入向量构成的任何布尔函数的前向网络所需权系数数目为在具体设计时，比较实际的做法是通过对不同神经元数进行训练对比，然后适当地加上一点余量283.3 初始权值的选取一般取初始权值在(-1，1)之间的随机数威得罗等人在分析了两层网络是如何对一个函数进行训练后，提出一种选定初始权值的策略选择权值的量级为在MATLAB工具箱中可接受函数nwlog.m或nwtan.m来初始化隐含层权值W1和B1。其方法仅运用在第一隐含层的初始值的选取上，后面层的初始值仍旧接受随机取数293.4 学习速率学习速率确定每一次循环训练中所产生的权值变更量大的学习速率可能导致系统的不稳定小的学习速率导致较长的训练时间，可能收敛很慢，不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值所以在一般状况下，倾向于选取较小的学习速率以保证系统的稳定性。学习速率的选取范围在0.01-0.8之间303.5 期望误差值选取在设计网络的训练过程中，期望误差值也应当通过对比训练后确定一个合适的值这个所谓的“合适”，是相对于所须要的隐含层的节点数来确定，因为较小的期望误差值是要靠增加隐含层的节点，以及训练时间来获得一般状况下，作为对比，可以同时对两个不同期望误差值的网络进行训练，最终通过综合因素的考虑来确定接受其中一个网络313.6 应用举例求解函数靠近问题有21组单输入矢量和相对应的目标矢量，试设计神经网络来实现这对数组的函数关系P=-1:0.1:1T=-0.96 0.577 -0.0729 0.377 0.641 0.66 0.461 0.1336 -0.201 -0.434 -0.5 -0.393 -0.1647 0.0988 0.3072 0.396 0.3449 0.1816 -0.0312 -0.2183 -0.3201测试集P2=-1:0.025:1323.6 应用举例目标矢量相对于输入矢量的图形初始网络的输出曲线 333.6 应用举例训练1000次 2000次343.6 应用举例训练3000次 5000次353.7 限制与不足须要较长的训练时间完全不能训练选取较小的初始权值接受较小的学习速率，但同时又增加了训练时间局部微小值 BP算法可以使网络权值收敛到一个解，但它并不能保证所求为误差超平面的全局最小解，很可能是一个局部微小解36四、BP网络的改进4.1 目标4.2 附加动量法4.3 误差函数改进 4.4 自适应学习速率374.1 目标加快训练速度避开陷入局部微小值384.2 附加动量法利用附加动量的作用则有可能滑过局部微小值修正网络权值时，不仅考虑误差在梯度上的作用，而且考虑在误差曲面上变更趋势的影响，其作用犹如一个低通滤波器，它允许网络忽视网络上微小变更特性该方法是在反向传播法的基础上在每一个权值的变更上加上一项正比于前次权值变更量的值，并依据反向传播法来产生新的权值变更394.2 附加动量法带有附加动量因子的权值调整公式其中k为训练次数，mc为动量因子，一般取095左右附加动量法的实质是将最终一次权值变更的影响，通过一个动量因子来传递。当动量因子取值为零时，权值变更仅依据梯度下降法产生当动量因子取值为1时，新的权值变更则是设置为最终一次权值的变更，而依梯度法产生的变更部分则被忽视掉了促使权值的调整向着误差曲面底部的平均方向变更，当网络权值进入误差曲面底部的平坦区时，i将变得很小，于是，wij(k+1)wij(k)，从而防止了wij=0的出现，有助于使网络从误差曲面的局部微小值中跳出 404.2 附加动量法在MATLAB工具箱中，带有动量因子的权值修正法是用函数learnbpm.m来实现的trainbpm.m可以训练一层直至三层的带有附加动量因子的反向传播网络下面是对单层网络运用函数trainbpm.m的情形：W，B，epochs，errorstrainbpm(W，B，F，P，T，TP)414.3 误差函数改进当ak趋向1时，E趋向一个常数，即处于E的平坦区，f(n)0，可能造成完全训练的麻痹现象当一个网络的误差曲面存在着平坦区时，可以选用别的误差函数f(tk,ak)来代替(tk-ak)2的形式，只要其函数在ak=tk时能达到最小值424.3 误差函数改进包穆(Baum)等人于1988年提出一种误差函数为不会产生不能完全训练的麻痹现象434.3 误差函数改进与常规的误差函数的状况ij=f(n)(tk-ak)相比较，其中的f(n)项消逝了当n增大，进入激活函数的平坦区，使f(n)0时，不会产生不能完全训练的麻痹现象但由于失去了f(n)对w的限制作用，过大的w又有可能导致网络过调或振荡 1989年，范尔曼(S.Fahlman)提出一种折中的方案，即取kf(n)+0.1(tk-ak)一方面复原了f(n)的某些影响另一方面当|n|变大时，仍能保持k有确定的大小，从而避开了麻痹现象的发生 444.4 自适应学习速率通常调整学习速率的准则是，检查权值的修正值是否真正降低了误差函数，假如的确如此，则说明所选取的学习速率值小了，可以对其增加一个量；否则可认为产生过调，应当减小学习速率的值一种自适应学习速率的调整公式454.4 自适应学习速率MATLAB工具箱中带有自适应学习速率进行反向传播训练的函数为 trainbpa.m可训练直至三层网络。运用方法W,B,epochs,TEtrainbpa(W，B，F，P，T，TP)可以将动量法和自适应学习速率结合起来以利用两方面的优点。这个技术已编入了函数trainbpx.m之中函数的调用和其他函数一样，只是须要更多的初始参数而已TPdisp_freq max_epoch error_goal lr 1r_inc 1r_dec mom_const err_ratio；W，B，epochs，error;lrtrainbpx(W，B，F，P，T，TP)46五、内容小结内容支配一、内容回顾二、BP网络三、网络设计四、改进BP网络47五、内容小结反向传播法可以用来训练具有可微激活函数的多层前向网络,以进行函数靠近，模式分类等工作反向传播网络的结构不完全受所要解决的问题所限制。网络的输入神经元数目及输出层神经元的数目是由问题的要求所确定输入和输出层之间的隐含层数以及每层的神经元数是由设计者来确定的已经证明，两层S型线性网络，假如S型层有足够的神经元，则能够训练出随意输入和输出之间的有理函数关系48五、内容小结反向传播法沿着误差表面的梯度下降，使网络误差最小，网络有可能陷入局部微小值附加动量法使反向传播削减了网络在误差表面陷入低谷的可能性并有助于削减训练时间太大的学习速率导致学习的不稳定，太小值又导致极长的训练时间。自适应学习速率通过在保证稳定训练的前提下，达到了合理的高速率，可以削减训练时间80-90的实际应用都是接受反向传播网络的。改进技术可以用来使反向传播法更加简洁实现并须要更少的训练时间49五、内容小结下次讲课内容反馈网络Hopfield网络50作业用BP神经网络对一个简洁的非线性神经元进行训练。输入矢量 p=-3 2目标矢量 t=0.4 0.851The EndQuestions&SuggestionsThanks！52

注意事项

本文（神经网络-(6)BP网络.ppt）为本站会员（1398****507）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。