第06讲反向传播网络优秀课件.ppt
《第06讲反向传播网络优秀课件.ppt》由会员分享,可在线阅读,更多相关《第06讲反向传播网络优秀课件.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第06讲反向传播网络第1 页,本讲稿共37 页反向传播网络(BackPropagation Network,简称BP网络)是将WH 学习规则一般化,对非线性可微分函数进行权值训练的多层网络。BP 网络是一种多层前向反馈神经网络,其神经元的变换函数是S 型函数,因此输出量为0到1之间的连续量,它可以实现从输入到输出的任意的非线性映射。由于其权值的调整采用反向传播(Backpropagation)的学习算法,因此被称为BP 网络。第2 页,本讲稿共37 页BP 网络主要用于:1)函 数 逼 近:用 输 入 矢 量 和 相 应 的 输 出 矢 量 训 练 一 个 网络逼近个函数;2)模 式 识 别:
2、用 一 个 特 定 的 输 出 矢 量 将 它 与 输 入 矢量联系起来;3)分类:把输入矢量以所定义的合适方式进行分类;4)数据压缩:减少输出矢量维数以便于传输或存储。第3 页,本讲稿共37 页61 BP 网络模型与结构 一个具有r 个输入和一个隐含层的神经网络模型结构 第4 页,本讲稿共37 页感知器和自适应线性元件的主要差别在激活函数上:前者是二值型的,后者是线性的。BP 网络具有一层或多层隐含层,除了在多层网络上与前面已介绍过的模型有不同外,其主要差别也表现在激活函数上。BP 网络的激活函数必须是处处可微的,所以它就不能采用二值型的阀值函数0,1 或符号函数1,1,BP 网络经常使用的
3、是S 型的对数或正切激活函数和线性函数。第5 页,本讲稿共37 页图6.2 BP 网络S 型激活函数 因为S 型函数具有非线性放大系数功能,它可以把输入从负无穷大到正无穷大的信号,变换成-1 到l 之间输出,对较大的输入信号,放大系数较小;而对较小的输入信号,放大系数则较大,所以采用S 型激活函数可以去处理和逼近非线性的输入/输出关系。第6 页,本讲稿共37 页只有当希望对网络的输出进行限制,如限制在0和1之间,那么在输出层应当包含S 型激活函数,在一般情况下,均是在隐含层采用S 型激活函数,而输出层采用线性激活函数。BP 网络的特点:1、输入和输出是并行的模拟量;2、网 络 的 输 入 输
4、出 关 系 是 各 层 连 接 的 权 因 子 决 定,没 有固定的算法;3、权 因 子 是 通 过 学 习 信 号 调 节 的,这 样 学 习 越 多,网络越聪明;4、隐 含 层 越 多,网 络 输 出 精 度 越 高,且 个 别 权 因 子 的 损坏不会对网络输出产生大的影响第7 页,本讲稿共37 页62 BP 学习规则 BP 算法属于 算法,是一种监督式的学习算法。其主要思想为:对于q个输入学习样本:P1,P2,Pq,已知与其对应的输出样本为:T1,T2,Tq。学习的目的是用网络的实际输出A1,A2,Aq,与目标矢量T1,T2,Tq,之间的误差来修改其权值,使Al,(l l,2,q)与期
5、望的Tl尽可能地接近;即:使网络输出层的误差平方和达到最小。第8 页,本讲稿共37 页BP 算法是由两部分组成:信息的正向传递与误差的反向传播。在正向传播过程中,输入信息从输入经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层没有得到期望的输出,则计算输出层的误差变化值,然后转向反向传播,通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标。第9 页,本讲稿共37 页图6 3 具有一个隐含层的简化网络图 设输入为P,输入神经元有r 个,隐含层内有s1 个神经元,激活函数为F1,输出层内有s2 个神经元,对应的激活函数为F2,输出为A,
6、目标矢量为T。第10 页,本讲稿共37 页621信息的正向传递1)隐含层中第i 个神经元的输出为:2)输出层第k个神经元的输出为:3)定义误差函数为:(6.1)(6.2)(6.3)第11 页,本讲稿共37 页6 2 2 利用梯度下降法求权值变化及误差的反向传播(1)输出层的权值变化对从第i 个输入到第k个输出的权值有:其中:同理可得:(6.4)(6.5)(6.6)(6.7)第12 页,本讲稿共37 页(2)隐含层权值变化 对从第j 个输入到第i 个输出的权值,有:其中:同理可得:(6.8)(6.9)(6.10)第13 页,本讲稿共37 页通过MATLAB 的实现过程:1)对 于(6 1)式 所
7、 表 示 的 隐 含 层 输 出,若 采 用 对 数S 型 激 活 函数,则 用 函 数logsig.m;若 采 用 双 曲 正 切S 型 激 活 函 数,则 用函数tansig.m;2)对 于(6 2)式 所 表 示 的 输 出 层 输 出,若 采 用 线 性 激 活 函 数 有purelin.m 与之对应;3)对于(6 3)式所表示的误差函数,可用函数sumsqr.m 求之;4)有learnbp.m 函 数 专 门 求(6 4)、(6 7)、(6 8)和(6 10)式 所 表示的输出层以及隐含层中权值与偏差的变化量;5)由(6.5)和(6.9)式所表示的误差的变化有函数deltalin.m
8、、deltatan.m、deltalog.m来解决。它们分别用于线性层、双曲正切层和对数层。第14 页,本讲稿共37 页6 2 3 误差反向传播的流程图与图形解释 误差反向传播过程实际上是通过计算输出层的误差ek,然后将其与输出层激活函数的一阶导数f2 相乘来求得ki。由于隐含层中没有直接给出目标矢量,所以利用输出层的ki反向传递来求出隐含层权值的变化量w2ki。然后计算并同样通过将ei与该层激活函数的一阶导数f1 相乘,而求得ij,以此求出前层权值的变化量w1ij。如果前面还有隐含层,沿用上述同样方法依此类推,一直将输出误差ek一层一层的反推算到第一层为止。第15 页,本讲稿共37 页图6
9、4 误差反向传播法的图形解释 第16 页,本讲稿共37 页6.3 BP 网络的训练过程 为了训练一个BP 网络,需要计算网络加权输入矢量以及网络输出和误差矢量,然后求得误差平方和。当所训练矢量的误差平方和小于误差目标,训练则停止,否则在输出层计算误差变化,且采用反向传播学习规则来调整权值,并重复此过程。当网络完成训练后,对网络输入一个不是训练集合中的矢量,网络将以泛化方式给出输出结果。第17 页,本讲稿共37 页为了能够较好地掌握BP 网络的训练过程,我们用两层网络为例来叙述BP 网络的训练步骤。1)用 小 的 随 机 数 对 每 一 层 的 权 值W 和 偏 差B 初 始 化,以 保证 网
10、络 不 被 大 的 加 权 输 入 饱 和;并 进 行 以 下 参 数 的 设定或初始化:a)期望误差最小值error_goal;b)最大循环次数max_epoch;c)修 正 权 值 的 学 习 速 率1r,一 般 情 况 下k 00l0 7;d)从1开 始 的 循 环 训 练:for epoch 1:max_epoch;第18 页,本讲稿共37 页2)计算网络各层输出矢量A1 和A2 以及网络误差E:A1 tansig(W1*P,B1);A2 purelin(W2*A1,B2);E T-A;3)计 算 各 层 反 传 的 误 差 变 化D2 和D1 并 计 算 各 层 权 值 的 修正值以
11、及新权值:D2 deltalin(A2,E);D1 deltatan(A1,D2,W2);dlWl,dBl learnbp(P,D1,lr);dW2,dB21earnbp(A1,D2,1r);W1 W1 十dW1;B1 B1 十dBl;W2 W2 十dW2;B2 B2 十dB2;第19 页,本讲稿共37 页4)再次计算权值修正后误差平方和:SSE sumsqr(T-purelin(W2*tansig(W1*P,B1),B2);5)检 查SSE 是 否 小 于err_goal,若 是,训 练 结 束;否 则继续。以上所有的学习规则与训练的全过程,仍然可以用函数trainbp.m 来完成。它的使用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 06 反向 传播 网络 优秀 课件
限制150内