神经网络+数学建模模型及算法简介ppt课件.ppt
《神经网络+数学建模模型及算法简介ppt课件.ppt》由会员分享,可在线阅读,更多相关《神经网络+数学建模模型及算法简介ppt课件.ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、神经网络算法简介一、引例一、引例 1981年生物学家格若根(W Grogan)和维什(WWirth)发现了两类蚊子(或飞蠓midges)他们测量了这两类蚊子每个个体的翼长和触角长,数据如下:翼长 触角长 类别 1.64 1.38 Af 1.82 1.38 Af 1.90 1.38 Af 1.70 1.40 Af 1.82 1.48 Af 1.82 1.54 Af 2.08 1.56 Af翼长 触角长 类别1.78 1.14 Apf1.96 1.18 Apf1.86 1.20 Apf1.72 1.24 Af2.00 1.26 Apf2.00 1.28 Apf1.96 1.30 Apf1.74 1
2、.36 Af 问:若抓到三只新的蚊子,它们的触角长和翼长分别为(1.24,1.80); (1.28,1.84);(1.40,2.04)问它们应分别属于哪一个种类? 把翼长作纵坐标,触角长作横坐标;那么每个蚊子的翼长和触角决定了坐标平面的一个点.其中 6个蚊子属于 APf类;用黑点“”表示;9个蚊子属 Af类;用小圆圈“。”表示 得到的结果见图1 图1飞蠓的触角长和翼长 一、引例一、引例 1989年美国大学生数学建模问题 思路: 例如;取A(1.44,2.10)和 B(1.10,1.16),过A B两点作一条直线: y 1.47x - 0.017 其中x表示触角长;y表示翼长 分类规则:设一个蚊
3、子的数据为(x, y) 如果y1.47x - 0.017,则判断蚊子属Apf类; 如果y1.47x - 0.017;则判断蚊子属Af类 一、引例一、引例 作一直线将两类飞蠓分开 分类结果:(1.24,1.80),(1.28,1.84)属于Af类;(1.40,2.04)属于 Apf类图2 分类直线图 一、引例一、引例 D: (1.40, 2.04)C: (1.28, 1.84)B: (1.24, 1.80)DCB缺陷:根据什么原则确定分类直线? 若取A=(1.46,2.10), B=(1.1,1.6)不变,则分类直线变为 y=1.39x+0.071分类结果变为: (1.24,1.80), (1.
4、40,2.04) 属于Apf类; (1.28,1.84)属于Af类 哪一分类直线才是正确的呢? 一、引例一、引例 AfAphC: (1.24, 1.80)B: (1.28, 1.84)A: (1.40, 2.04)ABCA(1.44,2.10) 再如,如下的情形能不能用分类直线的办法呢? 新思路:将问题看作一个系统,飞蠓的数据作为输入,飞蠓的类型作为输出,研究输入与输出的关系。一、引例一、引例 方法:方法:马氏距离判别法、马氏距离判别法、Bayes判别法等判别法等人工神经网络模型前言 所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统。 粗略地讲,大脑是由大量神经细胞或神
5、经元组成的。每个神经元可看作是一个小的处理单元,这些神经元按某种方式连接起来,形成大脑内部的生理神经元网络。 这种神经元网络中各神经元之间联结的强弱,按外部的激励信号做自适应变化,而每个神经元又随着所接收到的多个接收信号的综合大小而呈现兴奋或抑制状态。生物神经网基本工作机制:一个神经元有两种状态兴奋和抑制平时处于抑制状态的神经元,当接收到其它神经元经由突触传来的冲击信号时,多个输入在神经元中以代数和的方式叠加。进入突触的信号会被加权,起兴奋作用的信号为正,起抑制作用的信号为负。如果叠加总量超过某个阈值,神经元就会被激发进入兴奋状态,发出输出脉冲,并由轴突的突触传递给其它神经元。人工神经网络的生
6、物学基础人工神经网络的生物学基础细胞体突触轴突树突图12.2 生物神经元功能模型输入输出信息处理电脉冲形成传输人工神经网络的生物学基础人工神经网络的生物学基础信息输入信息输入信息传播与处理信息传播与处理信息传播与处理(整合)信息传播与处理(整合)信息传播与处理结果:兴奋与抑制信息传播与处理结果:兴奋与抑制信息输出信息输出神经网络的基本思想人工神经元的基本构成:1()niiiyfw xyx1x2x nw1w2w n 人工神经元信息处理单元人工神经元信息处理单元 )(ixf i )(ixf i 人工神经元信息处理单元人工神经元信息处理单元信息输入信息输入 )(ixf i 人工神经元信息处理单元人工
7、神经元信息处理单元信息传播与处理:加权求和信息传播与处理:加权求和 )(ixf i 人工神经元信息处理单元人工神经元信息处理单元信息传播信息传播 )(ixf i 人工神经元信息处理单元人工神经元信息处理单元信息传播与处理信息传播与处理 )(ixf i 人工神经元信息处理单元人工神经元信息处理单元信息输出信息输出 f(X)是激发函数;它可以是线性函数,也可以是非线性函数例如,若取激发函数为符号函数 miiixwz1. 0, 0, 0, 1)sgn(xxxmiiimiiixwxwzfy11, 0, 1)(S型传递函数型传递函数xe11f(x)xxxe1e11e12f(x) f (x) 1.0 0.
8、5x0 f (x) 1.0 0 x-1.0 注:一个神经元含有与输入向量维数相同个数的权系数,若将阈值看作是一个权系数,-1是一个固定的输入,另有n-1个正常的输入,则式也可表示为: 1()ni iiyfwx 参数识别:假设函数形式已知,则可以从已有的输入输出数据确定出权系数及阈值。 1()niiiyfw xojx1-1x2简单原理 人工神经网络是根据人的认识过程而开发出的一种算法。 假如我们现在只有一些输入和相应的输出,而对如何由输入得到输出的机理并不清楚,那么我们可以把输入与输出之间的未知过程看成是一个“网络”,通过不断地给这个网络输入和相应的输出来“训练”这个网络,网络根据输入和输出不断
9、地调节自己的各节点之间的权值来满足输入和输出。这样,当训练结束后,我们给定一个输入,网络便会根据自己已调节好的权值计算出一个输出。这就是神经网络的简单原理。神经网络的作用神经网络的作用 网络说话网络说话 人们把一本教科书用网络把它读出来(当然需要通过光电,电声的信号转换);开始网络说的话像婴儿学语那样发出“巴、巴、巴”的声响;但经过BP算法长时间的训练竟能正确读出英语课本中 90的词汇 从此用神经网络来识别语言和图象形成一个新的热潮。人工神经网络基本特点人工神经网络基本特点 (1)可处理非线性 (2)并行结构对神经网络中的每一个神经元来说;其运算都是同样的这样的结构最便于计算机并行处理 (3)
10、具有学习和记忆能力一个神经网络可以通过训练学习判别事物;学习某一种规律或规则(4)对数据的可容性大在神经网络中可以同时使用量化数据和质量数据(如好、中、差、及格、不及格等)(5)神经网络可以用大规模集成电路来实现如美国用 256个神经元组成的神经网络组成硬件用于识别手写体的邮政编码人工神经网络的分类按网络连接的拓扑结构分类:层次型结构:将神经元按功能分成若干层,如输入层、中间层(隐层)和输出层,各层顺序相连人工神经网络的分类按网络内部的信息流向分类:前馈型网络:网络信息处理的方向是从输入层到各隐层再到输出层逐层进行 u y 神经网络的学习规则神经网络的学习规则 关键在于如何决定每一神经元的权值
11、。 常用的学习规则有以下几种:(1)Hebb规则(2)Delta规则 (最小均方差规则 )(3)反向传播学习方法(4)Kohonen学习规则(用于无指导训练网络 )(5)Grosberg学习方法神经网络常用模型神经网络常用模型共70多种,具有代表性的有:(1)感知器(Perceptron) (2)多层前馈(BP)网络 (3)Hopfield网络 (优化)(4)Boltzmann机(在BP中加入噪声) (5)双向联想记忆网络(快速存储) 人工神经网络的工作原理人工神经网络的工作原理到底是怎样的,我们可以从一个最简单的网络来剖析,一定程度上打开这个黑匣子。1958年,美国心理学家Frank Ros
12、enblatt提出一种具有单层计算单元的神经网络,称为Perceptron,即感知器。感知器是模拟人的视觉接受环境信息,并由神经冲动进行信息传递的层次型神经网络。单层感知器的结构与功能都非常简单,以至于在解决实际问题时很少采用,但由于它在神经网络研究中具有重要意义,是研究其它网络的基础,常作为学习神经网络的起点。人工神经网络的工作原理感知器模型(单层前向神经网络)j=1,2, ,m Tni,.,x,.x,xx)(21X12(y)TimY,y ,.y ,.,yTnjijjjj,.,w,.w,ww)(21W输出类别指示输入样本人工神经网络的工作原理感知器模型净输入:输出为:Tj为阀值,sgn为符号
13、函数niiijjxwnet10()()()nTjjjijijiysgn netTsgnw xsgnW X人工神经网络的工作原理(C.)感知器模型具体的:设输入向量设输入向量X=(x1 ,x2)T输出:输出:则由方程则由方程w1jx1+w2jx2-Tj=0确定了二维平面上的一条分界确定了二维平面上的一条分界线线ojx1-1x2010122112211jjjjjjjTxwxwTxwxwo人工神经网络的工作原理感知器模型具体的:则由方程则由方程w1jx1+w2jx2-Tj=0确定了二维平面上的一条分界确定了二维平面上的一条分界线线(Why?) w1j x1+w2j x2 Tj = 0 w1j x1
14、= Tj - w2j x2 x1 = (Tj -w2j x2) / w1j = - ( w2j/ w1j ) x2 +Tj / w1j = a x2 +c人工神经网络的工作原理感知器模型具体的:这样的话,我们就可以得到 0XWTj 思路: 例如;取A(1.44,2.10)和 B(1.10,1.16),过A B两点作一条直线: y 1.47x - 0.017 其中x表示触角长;y表示翼长 分类规则:设一个蚊子的数据为(x, y) 如果y1.47x - 0.017,则判断蚊子属Apf类; 如果y1.47x - 0.017;则判断蚊子属Af类 一、引例一、引例 作一直线将两类飞蠓分开人工神经网络的工
15、作原理感知器模型一个最简单的单计算节点感知器具有分类功能。其分类原理是将分类知识存储于感知器的权向量(包含了阈值)中,由权向量确定的分类判决界面将输入模式分为两类。ojx1-1x2单层感知器的局限性是:仅对线性可分问题具有分类能力。神经网络研究的发展神经网络研究的发展(1)(1)第一次热潮第一次热潮(40-60(40-60年代未年代未) ) 1943 1943年年, ,美国心理学家美国心理学家W.McCullochW.McCulloch和数学家和数学家W.PittW.Pitt 在提出了一个简单的神经元模型,即在提出了一个简单的神经元模型,即MPMP模型。模型。19581958年,年,F.Ros
16、enblattF.Rosenblatt等研制出了感知机等研制出了感知机(Perceptron(Perceptron)。)。(2)低潮低潮(70- -80年代初年代初) ):(3)第二次热潮第二次热潮 1982年,美国物理学家年,美国物理学家J.J.Hopfield提出提出Hopfield模模型,它是一个互联的非线性动力学网络型,它是一个互联的非线性动力学网络, ,他解决问题的方他解决问题的方法是一种法是一种反复运算的动态过程反复运算的动态过程, ,这是符号逻辑处理方法所这是符号逻辑处理方法所不具备的性质不具备的性质. . 1987年首届国际年首届国际A ANN大会在圣地亚哥召开,大会在圣地亚哥
17、召开,国际国际A ANN联合会成立,创办了多种联合会成立,创办了多种A ANN国际刊物。国际刊物。经典的人工神经网络算法BP算法BP (Error Back Proragation,BP)误差反向传播算法它是有指导训练的前馈多层网络训练算法,是靠调节各层的加权,使网络学会由输入输出对组成的训练组执行优化的方法是梯度下降法BP算法是使用非常广泛的一种算法,最常用的转移函数是Sigmoid函数xexf11)(梯度法 考虑无约束问题, 其中函数f(x)一阶连续可导,梯度指对各个自变量的偏导数依次排列所成的向量。梯度法就是在点x处以f(x)的负梯度方向进行搜索的一种优化方法,其迭代公式,其中, 是从
18、出发的搜索方向,取最速下降方向nExxf),(min)()()1(kkkkdxx)(kd)(kx)()()(kkxfd经典的人工神经网络算法BP算法BP 网络模型输入层输入层隐层隐层输出层输出层 网络学习的目的是要使网络产生尽可能逼近理想的反应。网络受训练时,不断将网络的输出数据与理想数据相比较,并按学习规格改变权重,直到网络的输出数据对所有训练数据与理想输出数据之差在要求的误差范围之内。BPBP神经网络模型神经网络模型 简单网络经典的人工神经网络算法BP算法学习的过程: 正向传播:输入样本输入层各隐层输出层 判断是否转入反向传播阶段:若输出层的实际输出与期望的输出(教师信号)不符 误差反传误
19、差以某种形式在各层表示修正各层单元的权值 网络输出的误差减少到可接受的程度 进行到预先设定的学习次数为止 假设有P个训练样本,即有P个输入输出对(Ip, Tp),p=1,P, 其中输入向量为 TpmppiiI),.,(1目标输出向量为(理论上的) TpnppttT),.,(1网络输出向量为 (实际上的) TpnppooO),.,(1简单网络的简单网络的B-P算法算法nipipiot12)(min(p=1,P) (2) 通常理论与实际有误差,网络学习则是指不断比较,并根据极小原则修改参数wij,使误差平方和达最小:记 Delta学习规则: pipipiotPppjpipjPppipiijiiot
20、w11)((4) ijijijwww (3) ijw表示递推一次的修改量,则有称为学习的速率学习的速率一般取值为0.10.3 简单网络的简单网络的B-P算法算法记wij为从输入向量的第j (j=1,m) 个分量到输出向量的第i (i=1,n)个分量的权重。ipm= -1 , wim= (第i个神经元的阈值) (5)注:由(1) 式,第i个神经元的输出可表示为mjpjijpiiwfo1)(特别当f是线性函数时 biwaomjpjijpi1)((6)简单网络的简单网络的B-P算法算法 训练用的性能指标为1:ppijijEww 按梯度法公式ppjpjpjpEEotE,)(212:pppiijpiij
21、EEowow复合求导21,()()2ppkpkpipipikpjpiEtotooo 其中最小求E的最小值,只需考虑EP达到最小的递推算法ppipjpi pjijEaiaiw 因而11ppijpi pjpi pjijEwaiiw pipiik pkpjkijijijoNetaaw iaiwww 则,piij pipipijNetw ioaNetb令求E的最小值的梯度下降法就是Delta学习规则。111PPpijpi pjppijEwiw多层前馈网络多层前馈网络 (l)输入层不计在层数之内,它有N0个神经元设网络共有L层;输出层为第L层;第 k层有Nk个神经元假设:假设: (2) 设)( iuk表
22、示第k层第i神经元所接收的信息 wk(i,j) 表示从第k-1层第j个元到第k层第i个元的权重, )(iak表第k层第i个元的输出 有些文献将输入层作为一层(3)设层与层间的神经元都有信息交换(否则,可设它们之间的权重为零);但同一层的神经元之间无信息传输 (4) 设信息传输的方向是从输入层到输出层方向;因此称为前向网络没有反向传播信息 (5) 表示输入的第j个分量 )(0ja假设:假设: 在上述假定下网络的输入输出关系可以表示为:,1),()(),()(),()(.,1),()(),()(),()(,1),()(),()(),()(1101112221212211111011LLLNjLLL
23、LNjNjNiiufiaijajiwiuNiiufiaijajiwiuNiiufiaijajiwiuL(7) 其中k(i)表示第k层第i个元的阈值. ,f为S函数PppEE1LNipLppiaitE12)()()()(21 定理 对于具有多个隐层的前馈神经网络;设激发函数为S函数;且指标函数取 则每个训练循环中按梯度下降时;其权重迭代公式为)()()()()()()()(iufiaitipLpLppL( )(1)( )( )1( , )( , )( )1,., ,ppppllllwi jwi jajlL1( )( )( )(1)111( )( )( )( , )11.lNpppplllljif
24、 uij wj ilL 其中1111( )( , )( )( )LNLLLLjuiw i j aji1:ppLLEww 按梯度法公式( ):( )ppLLLLEEa iwa iw复合求导( )( )LLa if ui证明思路与简单模型相同。( )( ):( )( )ppLLLLLLEEa iuiwa iuiw复合求导不同的是这里具有隐层不同的是这里具有隐层LNipLppiaitE12)()()()(21ijjk11exp()11exp()iijijijjkjkjkkOxIOOIIOOI:输入节点:图像特征分量值输出节点::输入节点:输出节点:输入节点:输出节点:输输入入层层隐隐层层输输出出层层
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经网络 数学 建模 模型 算法 简介 ppt 课件
限制150内