2022年BP神经网络的matlab实现学习历程.pdf
《2022年BP神经网络的matlab实现学习历程.pdf》由会员分享,可在线阅读,更多相关《2022年BP神经网络的matlab实现学习历程.pdf(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、考拉 BP神经网络的matlab 实现学习历程(一)考拉 BP神经网络的matlab 实现学习历程(一)本文考拉 BP神经网络的matlab 实现学习历程 系列由论坛 超级版主akjuan 整理和原创,我们在此表示特别感谢这两天在学习bp,总结和汇报一下,和大家一起学习。希望初入神经网络能有所收获,给新手一些帮组和启发。也希望熟悉bp 的高手,多提宝贵意见和建议。学习内容总结成五个小节,具体内容如下:第一节内容: 包括神经网络的基础知识,BP网络的特点,bp 主要应用的场合,使用时应注意的问题。第二节内容: 主要是阐述BP中几个容易混绕的概念和问题,包括什么是网络的泛化能力过拟合是什么,怎么处
2、理学习速率有什么作用神经网络的权值和阈值分别是个什么概念用BP逼近非线性函数,如何提高训练精度?第三节内容: 主要阐述使用matlab 实现,为了充分利用数据,得到最优的网络训练结果,在网络建立前, 应该进行的基本数据处理问题,包括:BP神经网络matlab 实现的基本步骤,数据归一化问题和方法,输入训练数据的乱序排法,以及分类方法, 如何查看和保存训练的结果,每次结果不一样问题。第四节内容: bp 神经网络进行交通预测的Matlab 例子及源代码, bp 神经网络进行交通预测的 Matlab 程序的优化(主要是按设置误差要求,寻找最优网络过程)第五节内容: bp 神经网络处理蠓虫分类问题的m
3、atlab 例子及源代码。不多说,先如主题,第一节,很基础,高手见谅。什么是神经网络?神经网络是由很多神经元组成的,首先我们看一下,什么是神经元上面这个图表示的就是一个神经元,我们不管其它书上说的那些什么树突,轴突的。 我用个比较粗浅的解释,可能不太全面科学,但对初学者很容易理解:1、我们把输入信号看成你在matlab 中需要输入的数据,输进去神经网络后2、这些数据的每一个都会被乘个数,即权值w,然后这些东东与阀值b 相加后求和得到u,3、上面只是线性变化,为了达到能处理非线性的目的,u 做了个变换,变换的规则和传输函数有关精品资料 - - - 欢迎下载 - - - - - - - - - -
4、 - 欢迎下载 名师归纳 - - - - - - - - - -第 1 页,共 21 页 - - - - - - - - - - 可能还有人问, 那么那个阀值是什么呢简单理解就是让这些数据做了个平移,这就是神经元工作的过程。处理后的结果又作为输入,可输给别的神经元,很多这样的神经元,就组成了网络。 在 matlab 中具体用什么算法实现这些,我们先不管,我们需要注意的是怎么使用。比如使用 BP的神经网络newff()构建一个网络,这些在后面的学习将提到。BP网络的特点网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复
5、杂的问题。我们无需建立模型,或了解其内部过程,只需输入,获得输出。只要 BPNN结构优秀, 一般 20 个输入函数以下的问题都能在 50000 次的学习以内收敛到最低误差附近。而且理论上, 一个三层的神经网络,能够以任意精度逼近给定的函数,这是非常诱人的期望;网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,即具有自学习能力;网络具有一定的推广、概括能力。bp 主要应用回归预测 (可以进行拟合,数据处理分析,事物预测,控制等)、分类识别 (进行类型划分,模式识别等),在后面的学习中,我都将给出实例程序。但无论那种网络,什么方法,解决问题的精确度都无法打到100% 的,但并不影响其使用
6、,因为现实中很多复杂的问题,精确的解释是毫无意义的,有意义的解析必定会损失精度。BP注意问题1、BP算法的学习速度很慢,其原因主要有:a 由于 BP算法本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必然会出现“锯齿形现象”,这使得BP算法低效;b 存在麻痹现象, 由于优化的目标函数很复杂,它必然会在神经元输出接近0 或 1 的情况下,出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;c 为了使网络执行BP算法,不能用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法将引起算法低效。2、网络训练失败的可能性较大,其原因有:a 从数学角度
7、看,BP算法为一种局部搜索的优化方法,但它要解决的问题为求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;b 网络的逼近、 推广能力同学习样本的典型性密切相关,而从问题中选取典型样本实例组成训练集是一个很困难的问题。3、网络结构的选择:尚无一种统一而完整的理论指导,一般只能由经验选定。为此, 有人称神经网络的结构选择为一种艺术。 而网络的结构直接影响网络的逼近能力及推广性质。因此, 应用中如何选择合精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 2 页,共 21 页 - - - -
8、 - - - - - - 适的网络结构是一个重要的问题。4、新加入的样本要影响已学习成功的网络,而且刻画每个输入样本的特征的数目也必须相同。5、采用 s 型激活函数, 由于输出层各神经元的理想输出值只能接近于1 或 0,而不能打到1或 0,因此设置各训练样本的期望输出分量Tkp 时,不能设置为1 或 0,设置或较为适宜。考拉 BP神经网络的 matlab 实现学习历程(二)本文考拉 BP神经网络的matlab 实现学习历程 系列由论坛 超级版主akjuan 整理和原创,我们在此表示特别感谢本节主要学习BP中几个容易混绕的概念和问题:什么是网络的泛化能力过拟合是什么,怎么处理学习速率有什么作用神
9、经网络的权值和阈值分别是个什么概念用BP逼近非线性函数,如何提高训练精度?什么是网络的泛化能力?一个神经网路是否优良, 与传统最小二乘之类的拟合评价不同(主要依据残差, 拟合优度等 ) ,不是体现在其对已有的数据拟合能力上,而是对后来的预测能力,既泛化能力。网络的预测能力(也称泛化能力、推广能力)与训练能力(也称逼近能力、学习能力)的矛盾。一般情况下,训练能力差时,预测能力也差,并且一定程度上,随训练能力地提高,预测能力也提高。 但这种趋势有一个极限,当达到此极限时,随训练能力的提高,预测能力反而下降,即出现所谓“过拟合”现象。此时,网络学习了过多的样本细节,而不能反映样本内含的规律。过拟合是
10、什么,怎么处理?神经网络计算不能一味地追求训练误差最小,这样很容易出现“过拟合”现象,只要能够实时检测误差率的变化就可以确定最佳的训练次数,比如 15000 次左右的学习次数,如果你不观察,设成500000 次学习,不仅需要很长时间来跑,而且最后结果肯定令人大失所望。避免过拟合的一种方法是:在数据输入中, 给训练的数据分类,分为正常训练用、 变量数据、测试数据,在后面节将讲到如何进行这种分类。其中变量数据,在网络训练中,起到的作用就是防止过拟合状态。学习速率有什么作用?学习速率这个参数可以控制能量函数的步幅,并且如果设为自动调整的话,可以在误差率经过快速下降后,将学习速率变慢,从而增加BPNN
11、 的稳定性。此时训练方法采用精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 3 页,共 21 页 - - - - - - - - - - 复制内容到剪贴板代码 :DE = traingda; % 变学习率梯度下降算法 = traingdx; % 变学习率动量梯度下降算法DE可以定义一个变动的学习速率,如复制内容到剪贴板代码 :DEp = -1 -1 2 2; 0 5 0 5; t = -1 -1 1 1; net = newff(p,t,3,traingda); = ; = ; net = train(n
12、et,p,t); y = sim(net,p)DE在后面的拟合例题中,我们也将用到学习速率这个参数。神经网络的权值和阈值分别是个什么概念?第一节中, 我们已经谈到了权值和阀值的概念。这里我们更深入的说明一下,因为他们很重要,关系到网络最后的结果。权值和阈值是神经元之间的连接,将数据输入计算出一个输出,然后与实际输出比较,误差反传,不断调整权值和阈值。假如下面两个点属于不同的类,须设计分类器将他们分开引用 :p1=1 1 -1; p2=1 -1 -1;这里用单层神经元感知器,假设初始权值复制内容到剪贴板代码 :DEw= DE同时假设初始阀值复制内容到剪贴板代码 :DEb=输出 a1 a2精品资料
13、 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 4 页,共 21 页 - - - - - - - - - - 复制内容到剪贴板代码 :DEa1=hardlims(w*p1+b) a2=hardlims(w*p2+b)DE如果不能分开,还须不断调整w,b 用 BP逼近非线性函数,如何提高训练精度(1) 调整网络结构增加网络的层数可以进一步降低误差,提高精度但会使网络复杂化,从而增加网络的训练时间。 精度的提高实际上也可以通过增加隐层神经元的数目来获得,其效果更容易观察和掌握,所以应优先考虑。(2) 初始值选取为了使
14、误差尽可能小,需要合理选择初始权重和偏置,如果太大就容易陷入饱和区,导致停顿。一般应选为均匀分布的小数,介于 (-1 ,1) 。(3) 学习速率调整学习速率的选取很重要,大了可能导致系统不稳定,小了会导致训练周期过长、收敛慢,达不到要求的误差。一般倾向于选取较小的学习速率以保持系统稳定,通过观察误差下降曲线来判断。 下降较快说明学习率比较合适,若有较大振荡则说明学习率偏大。同时,由于网络规模大小的不同,学习率选择应当针对其进行调整。采用变学习速率的方案,令学习速率随学习进展而逐步减少,可收到良好的效果。(4) 期望误差期望误差当然希望越小越好,但是也要有合适值。考拉 BP神经网络的 matla
15、b 实现学习历程(三)本文考拉 BP神经网络的matlab 实现学习历程 系列由论坛 超级版主akjuan 整理和原创,我们在此表示特别感谢本节主要学习使用matlab 实现 bp 算法的一般步骤和过程。为了充分利用数据, 得到最优的网络训练结果,在网络建立前应该进行的基本数据处理问题,包括:(1)BP 神经网络 matlab 实现的基本步骤(2) 数据归一化问题和方法(3) 输入训练数据的乱序排法,以及分类方法(4) 如何查看和保存训练的结果(5) 每次结果不一样问题。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - -
16、- - -第 5 页,共 21 页 - - - - - - - - - - 用 matlab 实现 bp,其实很简单,按下面步骤基本可以了BP神经网络matlab 实现的基本步骤1、数据归一化2、数据分类,主要包括打乱数据顺序,抽取正常训练用数据、变量数据、测试数据3、建立神经网络,包括设置多少层网络(一般3 层以内既可以,每层的节点数(具体节点数,尚无科学的模型和公式方法确定,可采用试凑法, 但输出层的节点数应和需要输出的量个数相等) ,设置隐含层的传输函数等。关于网络具体建立使用方法,在后几节的例子中将会说到。4、指定训练参数进行训练,这步非常重要,在例子中,将详细进行说明5、完成训练后,
17、就可以调用训练结果,输入测试数据,进行测试6、数据进行反归一化7、误差分析、结果预测或分类,作图等数据归一化问题归一化的意义:首先说一下,在工程应用领域中,应用BP网络的好坏最关键的仍然是输入特征选择和训练样本集的准备,若样本集代表性差、矛盾样本多、数据归一化存在问题,那么,使用多复杂的综合算法、 多精致的网络结构,建立起来的模型预测效果不会多好。若想取得实际有价值的应用效果,从最基础的数据整理工作做起吧,会少走弯路的。归一化是为了加快训练网络的收敛性,具体做法是:1 把数变为( 0,1)之间的小数主要是为了数据处理方便提出来的,把数据映射到0 1 范围之内处理,更加便捷快速,应该归到数字信号
18、处理范畴之内。2 把有量纲表达式变为无量纲表达式归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量比如,复数阻抗可以归一化书写:Z = R + jL = R(1 + jL/R) ,复数部分变成了纯数量了,没有量纲。另外,微波之中也就是电路分析、信号系统、电磁波传输等,有很多运算都可以如此处理,既保证了运算的便捷,又能凸现出物理量的本质含义。神经网络归一化方法:由于采集的各数据单位不一致,因而须对数据进行-1,1归一化处理, 归一化方法主要有如下几种,供大家参考:1、线性函数转换,表达式如下:复制内容到剪贴板精品资料 - - - 欢迎下载 - - - - -
19、- - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 6 页,共 21 页 - - - - - - - - - - 代码 :DEy=(x-MinValue)/(MaxValue-MinValue)DE说明: x、y 分别为转换前、后的值,MaxValue、MinValue 分别为样本的最大值和最小值。2、对数函数转换,表达式如下:复制内容到剪贴板代码 :DEy=log10(x)DE说明:以 10 为底的对数函数转换。3、反余切函数转换,表达式如下:复制内容到剪贴板代码 :DEy=atan(x)*2/PIDEmatlab 中归一化的实现:matlab 中的归一化处
20、理有五种方法,只会其中一种就可以了,我喜欢用第4种,因为习惯和方便注意:第一组和第二组归一化函数在以上已遗弃,他们的用法相似, pre* 是归一化, post*是反归一化, tram* 是使用同样的设置归一化另外一组数据1. 内部函数 premnmx 、postmnmx、tramnmx,将数据归一化到(-1,1) premnmx的语法格式是复制内容到剪贴板代码 :DE :Pn,minp,maxp,Tn,mint,maxt=premnmx(P,T)DE其中 P,T分别为原始输入和输出数据,minp 和 maxp分别为 P中的最小值和最大值。mint和 maxt 分别为 T 的最小值和最大值。我们
21、在训练网络时,如果所用的是经过归一化的样本数据,那么以后使用网络时所用的新数据也应该和样本数据接受相同的预处理,这就要用到tramnmx,换句话说使用同一个归一化设置 (setting)归一化另外一组数据。如下所示:复制内容到剪贴板代码 :DEPn=tramnmx(P,minp,maxp)DE其中 P和 Pn分别为变换前、后的输入数据,maxp和 minp 分别为 premnmx函返回的最大值maxp和最小值 minp。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 7 页,共 21 页 - - - -
22、- - - - - - 2、prestd 、poststd 、trastd归化数据到 (0,1) 用法与 1 差不多。详细可以help prestd。上述两种方法是可以相互转化的,比如, 第一种归化后的数据为p,则(1+p)./2的结果就是第二种了3、mapminmax()将数据归一化到(-1,1),是中 *mnmx系列的替换函数该函数同时可以执行归一化、反归一化和归一化其他数据的功能,具体看帮助和后面的实例复制内容到剪贴板代码 :DE% 归一化数据输入为p,输出为t normInput,ps = mapminmax(p); normTarget,ts = mapminmax(t); % 反归
23、一化trainOutput = mapminmax(reverse,normTrainOutput,ts); trainInsect = mapminmax(reverse,ts); validateOutput = mapminmax(reverse,normValidateOutput,ts); validateInsect = mapminmax(reverse,ts); testOutput = mapminmax(reverse,normTestOutput,ts); testInsect = mapminmax(reverse,ts); % 例子:x1 = 1 2 4; 1 1 1
24、; 3 2 2; 0 0 0 y1,PS = mapminmax(x1,0,1)% 归化到 0,1,若不填,则默认为-1,1 % 还原:x1_again = mapminmax(reverse,y1,PS)DE4、mapstd() 将数据归一化到(0,1),是中 *std系列的替代函数同理, 3 和 4 两种方法是可以相互转化的,比如,第一种归化后的数据为p,则 (1+p)./2的结果就是第二种了。5、自己写归一化函数,这个网上很多,大家可以百度下输入训练数据的乱序排法,以及分类注意: dividevec()函数在版本还可以使用把数据重新打乱顺序,进行输入,可以让数据更加具备典型性和更优良的泛
25、化能力!精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 8 页,共 21 页 - - - - - - - - - - 把数据进行打乱,并分类为:训练输入数据、变量数据、测试数据的方法我用百度搜了一下,发现有些方法,但居然很少看到使用matlab 内部函数直接进行的,其实 matlab 自带的内部函数dividevec,完全能胜任上述工作,推荐! 但这个存在一个问题是,因为打乱了,最后分析结果的时候,数据重新排列困难,因为丢失了数据在数组中的位置参数。具体用法可以参见下面我的bp 交通预测的例子。因为我用的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 BP 神经网络 matlab 实现 学习 历程
限制150内