ch典型神经网络.pptx





《ch典型神经网络.pptx》由会员分享,可在线阅读,更多相关《ch典型神经网络.pptx(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、BP网络 是一种单向传播的多层前向网络,其神经元的变换函数是S型函数,因此输出量为0到1之间的连续量,它可以实现从输入到输出的任意的非线性映射。由于其权值的调整采用反向传播(Backpropagation)的学习算法,因此被称为BP网络,思想是梯度下降法,通过梯度搜索技术,使网络实际输出值与期望输出值的误差均方值最小。反向传播网络(BackPropagation Network,简称BP网络)是对非线性可微分函数进行权值训练的多层网络。第1页/共62页7.2.1 BP网络特点是多层网络,包括输入层、隐层和输出层层与层之间采用全互连方式,同一层神经元之间不连接权值通过学习算法进行调节神经元激发函
2、数为S函数层与层的连接是单向的,信息传播是双向的第2页/共62页7.2.2 BP网络结构 BP神经网络模型结构 输入层隐层输出层输 入输 出第3页/共62页BP网络是一种多层前向神经网络v一般分三层:输入层,隐层,输出层,也可以有2层或更多个隐层。v层与层之间采用全互联方式,同一层单元之间不存在相互连接。第4页/共62页1)输入层单元无转换函数,直接接收信号传给下一层,所以有些书不认为输入层是一个网络层。2)只有当希望对网络的输出进行限制,如限制在0和1之间,那么在输出层应当包含 S 型激活函数,在一般情况下,x1x2xny1yp均是在隐含层采用 S 型激活函数,而输出层采用线性激活函数。第5
3、页/共62页7.2.3 Bp网络的逼近第6页/共62页用于逼近的BP网络第7页/共62页前向传播:计算网络输出前向传播:计算网络输出隐层输出采用隐层输出采用S函数函数输出层输出第8页/共62页反向传播:采用反向传播:采用学习算法调整各层间权值学习算法调整各层间权值 梯度下降法梯度下降法第9页/共62页第10页/共62页第11页/共62页BP网络逼近仿真第12页/共62页第13页/共62页 初始化 加输入和期望输出计算隐层和输出层的输出迭代次数加1调节输出层和隐层的连接权值 改变训练样板训练样终止?迭代终止?BP算法的基本流程NoNoyy第14页/共62页小结:一、结构特点 1.BP网络具有一层
4、或多层隐含层,与其他网络模型除了结构不同外,主要差别表现在激活函数上。2.BP网络的激活函数必须是处处可微的,所以它就不能采用二值型的阀值函数0,1或符号函数1,1,BP网络经常使用的是S型的对数或正切激活函数和线性函数。3.只有当希望对网络的输出进行限制,如限制在0和1之间,那么在输出层应当包含S型激活函数,在一般情况下,均是在隐含层采用S型激活函数,而输出层采用线性激活函数。第15页/共62页4、输入和输出是并行的模拟量;5、网络的输入输出关系是各层连接的权因子决定,没有固定的算法;6、权因子是通过学习信号调节的,这样学习越多,网络越聪明;7、隐含层越多,网络输出精度越高,且个别权因子的损
5、坏不会对网络输出产生大的影响第16页/共62页7.2.6 BP网络模式识别一、由于神经网络具有自学习、自组织和并行处理等特征,并具有很强的容错能力和联想能力,因此,神经网络具有模式识别能力。在神经网络识别中,根据标准的输入输出模式对,采用神经网络学习算法,以标准的模式作为学习样本进行训练,通过学习调整神经网络的连接权值。当训练满足要求后,得到知识库,利用神经网络并行推理算法便可对所需的输入模式进行识别。第17页/共62页7.2.7、BP学习规则 BP算法属于算法,是一种监督式的学习算法。其主要思想为:对于q个输入学习样本:P1,P2,Pq,已知与其对应的输出样本为:T1,T2,Tq。学习的目的
6、是用网络的实际输出A1,A2,Aq,与目标矢量T1,T2,Tq,之间的误差来修改其权值,使Al,(ll,2,q)与期望的Tl尽可能地接近;即:使网络输出层的误差平方和达到最小。第18页/共62页感知机网络利用输出误差只能修改最后一层的权值而BP网络实现了多层学习,每一层的权值均可训练学习修改。BP算法学习过程由两部分组成:信息的前向传播与误差的后向传播。第19页/共62页 BP算法是由两部分组成:信息的正向传递与误差的反向传播。在正向传播过程中,输入信息从输入经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层没有得到期望的输出,则计算输出层的误差变化值,然后转
7、向反向传播,通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标。第20页/共62页7.2.8、BP网络的训练过程 为了训练一个BP网络,需要计算网络加权输入矢量以及网络输出和误差矢量,然后求得误差平方和。当所训练矢量的误差平方和小于误差目标,训练则停止,否则在输出层计算误差变化,且采用反向传播学习规则来调整权值,并重复此过程。当网络完成训练后,对网络输入一个不是训练集合中的矢量,网络将给出输出结果。第21页/共62页 为了能够较好地掌握BP网络的训练过程,我们再用两层网络为例来叙述BP网络的训练步骤。1)用小的随机数对每一层的权值W初始化,以保证网络不被大的加权输入
8、饱和;2)计算网络各层输出矢量A1和A2以及网络误差E第22页/共62页3)计算各层反传的误差变化并计算各层权值的修正值以及新权值4)再次计算权值修正后误差平方和:5)检查误差是否小于给定误差,若是,训练结束;否则继续。第23页/共62页以上所有的学习规则与训练的全过程,仍然可以用函数来完成。它的使用同样只需要定义有关参数:显示间隔次数,最大循环次数,目标误差,以及学习速率,而调用后返回训练后权值,循环总数和最终误差:TPdisp_freq max_epoch err_goal 1r;W,B,epochs,errorstrainbp(W,B,F,P,T,TP);第24页/共62页7.2.9 B
9、P网络的设计 1 网络的层数:理论上已经证明:具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数。增加层数主要可以更进一步的降低误差,提高精度,但同时也使网络复杂化,从而增加了网络权值的训练时间。一般情况下,应优先考虑增加隐含层中的神经元数。能不能仅用具有非线性激活函数的单层网络来解决问题呢?结论是:没有必要或效果不好。第25页/共62页2 隐含层的神经元数 网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元数的方法来获得。这在结构实现上,要比增加更多的隐含层要简单得多。在具体设计时,比较实际的做法是通过对不同神经元数进行训练对比,然后适当地加上一点余量。第26
10、页/共62页3)初始权值的选取一般取初始权值在(-1,1)之间的随机数。在MATLAB工具箱中可采用函数来初始化权值阈值。由于每次训练时都对权值进行随机初始化,所以每次训练得到的网络权值都是不一样的。第27页/共62页4 学习速率 学习速率决定每一次循环训练中所产生的权值变化量。大的学习速率可能导致系统的不稳定。小的学习速率导致较长的训练时间,可能收敛很慢,不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性。学习速率的选取范围在00108之间。第28页/共62页5 期望误差的选取 在设计网络的训练过程中,期望误差值也应当
11、通过对比训练后确定一个合适的值。这个所谓的“合适”,是相对于所需要的隐含层的节点数来确定,因为较小的期望误差值是要靠增加隐含层的节点,以及训练时间来获得的。一般情况下,作为对比,可以同时对两个不同期望误差值的网络进行训练,最后通过综合因素的考虑来确定采用其中一个网络。第29页/共62页7.2.10 BP网络的局限与不足(1)需要较长的训练时间 因为涉及到求导的运算,需要的时间较长(2)训练瘫痪问题通常为了避免这种现象的发生,一是选取较小的初始权值,二是采用较小的学习速率,但这又增加了训练时间。第30页/共62页(3)局部极小值BP算法可以使网络权值收敛到一个解,但它并不能保证所求为误差超平面的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ch 典型 神经网络

限制150内