神经网络基本原理学习PPT教案.pptx
《神经网络基本原理学习PPT教案.pptx》由会员分享,可在线阅读,更多相关《神经网络基本原理学习PPT教案.pptx(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 人工神经网络( ANN,Artificial Neural Network)也简称为神经网络(NN),是由大量的简单处理单元经广泛并行互连形成的一种网络系统。它是对人脑系统的简化、抽象和模拟,具有人脑功能的许多基本特征。 目前,人工神经网络已成为许多高科技领域的一个热门话题。在人工智能领域,它已实际应用于决策支持、模式识别、专家系统、机器学习等许多方面。2 由于神经网络是多学科交叉的产物,各个相关的学科领域对神经网络都有各自的看法,因此,关于神经网络的定义,在科学界存在许多不同的见解。目前使用得较广泛的是T.Koholen(芬兰赫尔辛基技术大学 )的定义,即神经网络是由具有适应性的简单单元
2、组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。3 人脑的基本组成是脑神经细胞,大量脑神经细胞相互联接组成人的大脑神经网络,完成各种大脑功能。而人工神经网络则是由大量的人工神经细胞(神经元)经广泛互连形成的人工网络,以此模拟人类神经系统的结构和功能。 了解人脑神经网络的组成和原理,有助于对人工神经网络的理解。 4人工神经网络概述人体神经结构与特征虽然神经元的形态各不相同,但是都由细胞体和突起两大部分组成,而突起又分树突和轴突。5 轴突是由细胞体向外延伸出的所有纤维中最长的一条分枝,用来向外传递神经元产生的输出信号。每个神经元只发出一条轴突,短的仅几个微米,
3、其最大长度可达1m以上。6 突触,在轴突的末端形成了许多很细的分枝,这些分枝叫神经末梢。每一条神经末梢可以与其他神经元形成功能性接触,该接触部位称为突触。每个神经元大约有103105个突触,换句话说,每个神经元大约与103105个其它神经元有连接,正是因为这些突触才使得全部大脑神经元形成一个复杂的网络结构。 所谓功能性接触,突触的信息传递特性可变,因此细胞之间的连接强度可变,这是一种柔性连接,也称为神经元结构的可塑性,这正是神经元之间传递信息的奥秘之一。7 树突是指由细胞体向外延伸的除轴突以外的其他所有分支。不同的神经元其树突的数量也不同,长度较短,但数量很多,它是神经元的输入端,用于接受从其
4、他神经元的突触传来的信号。 细胞体是神经元的主体,胞体和树突表面是接受的其他神经元传来的信号的主要部位。8 神经元中的细胞体相当于一个初等处理器,它对来自其他各个神经元的信号进行总体求和,并产生一个神经输出信号。由于细胞膜将细胞体内外分开,因此,在细胞体的内外具有不同的电位,通常是内部电位比外部电位低。细胞膜内外的电位之差被称为膜电位。在无信号输入时的膜电位称为静止膜电位。当一个神经元的所有输入总效应达到某个阈值电位时,该细胞变为活性细胞(激活),其膜电位将自发地急剧升高产生一个电脉冲。这个电脉冲又会从细胞体出发沿轴突到达神经末梢,并经与其他神经元连接的突触,将这一电脉冲传给相应的神经元。细胞
5、体突触轴突树突图12.2 生物神经元功能模型输入输出信息处理电脉冲形成传输9 生物神经元的功能与特征根据神经生理学的研究,生物神经元具有如下重要功能与特性。(1)时空整合功能神经元对不同时间通过同一突触传入的神经冲动,具有时间整合功能。对于同一时间通过不同突触传入的神经冲动,具有空间整合功能。两种功能相互结合,使生物神经元对由突触传入的神经冲动具有时空整合的功能。(2)兴奋与抑制状态神经元具有兴奋和抑制两种常规的工作状态。当传入冲动的时空整合结果使细胞膜电位升高,超过动作电位的阈值时,细胞进入兴奋状态,产生神经冲动。相反,当传入冲动的时空整合结果使细胞膜电位低于动作电位阈值时,细胞进入抑制状态
6、,无神经冲动输出。10(3)脉冲与电位转换 突触界面具有脉冲/电位信号转化功能。沿神经纤维传递的信号为离散的电脉冲信号,而细胞膜电位的变化为连续的电位信号。这种在突触接口处进行的“数/模”转换,是通过神经介质以量子化学方式实现的如下过程:电脉冲神经化学物质膜电位(4)神经纤维传导速率 神经冲动沿神经纤维传导的速度在1m/s150m/s之间。其速度差异与纤维的粗细、髓鞘(包绕在神经元的轴突外部的物质,起绝缘作用 )的有无有关。一般来说,有髓鞘的纤维,其传导速度在100ms以上,无髓鞘的纤维,其传导速度可低至每秒数米。11 人脑神经系统的结构与特征 (1)记忆和存储功能 人脑神经系统的记忆和处理功
7、能是有机地结合在一起的。神经元既有存储功能,又有处理功能,它在进行回忆时不仅不需要先找到存储地址再调出所存内容,而且还可以由一部分内容恢复全部内容。尤其是当一部分神经元受到损坏(例如脑部受伤等)时,它只会丢失损坏最严重部分的那些信息,而不会丢失全部存储信息。12 人脑神经系统的结构与特征(2)高度并行性 人脑大约有10111012个神经元,每个神经元又有103105个突触,即每个神经元都可以和其他103105个神经元相连,这就提供了非常巨大的存储容量和并行度。例如,人可以非常迅速地识别出一幅十分复杂的图像。13(3)分布式功能 人们通过对脑损坏病人所做的神经心理学研究,没有发现大脑中的哪一部分
8、可以决定其余所有各部分的活动,也没有发现在大脑中存在有用于驱动和管理整个智能处理过程的任何中央控制部分。人类大脑的各个部分是协同工作、相互影响的,并没有哪一部分神经元能对智能活动的整个过程负有特别重要的责任。 可见,在大脑中,不仅知识的存储是分散的,而且其控制和决策也是分散的。因此,大脑是一种分布式系统。14(4)容错功能 容错性是指根据不完全的、有错误的信息仍能做出正确、完整结论的能力。大脑的容错性是非常强的。例如,我们往往能够仅由某个人的一双眼睛、一个背影、一个动作或一句话的音调,就能辨认出来这个人是谁。15(5)联想功能 人脑不仅具有很强的容错功能,还有联想功能。善于将不同领域的知识结合
9、起来灵活运用,善于概括、类比和推理。例如,一个人能很快认出多年不见、面貌变化较大的老朋友。 (6)自组织和自学习功能 人脑能够通过内部自组织、自学习能力不断适应外界环境,从而可以有效地处理各种模拟的、模糊的或随机的问题。16人工神经元及人工神经网络人工神经元的结构 如同生物学上的基本神经元,人工的神经网络也有基本的神经元。人工神经元是对生物神经元的抽象与模拟。所谓抽象是从数学角度而言的,所谓模拟是从其结构和功能角度而言的。 从人脑神经元的特性和功能可以知道,神经元是一个多输入单输出的信息处理单元, 其模型如下图所示: 神经元模型x1x2xny12n17人工神经元及人工神经网络神经元模型x1x2
10、xny12n18人工神经元及人工神经网络M-P模型 M-P模型属于一种阈值元件模型,它是由美国心理学家Mc Culloch和数学家Pitts提出的最早(1943)神经元模型之一。M-P模型是大多数神经网络模型的基础。 19 在如图所示的模型中,x1,x2,xn表示某一神经元的n个输入;i表示第i个输入的连接强度,称为连接权值;为神经元的阈值;y为神经元的输出。可以看出,人工神经元是一个具有多输入,单输出的非线性器件。 神经元模型的输入是 i xi (i=1,2,n) 输出是 y=f()=f( i xi ) 其中f 称之为神经元功能函数(作用函数,转移函数,传递函数,激活函数)。注:可以令x0=
11、 -1,w0=,这样将阈值作为权值来看待。神经元模型x1x2xny12n20常用的人工神经元模型 功能函数f是表示神经元输入与输出之间关系的函数,根据功能函数的不同,可以得到不同的神经元模型。常用的神经元模型有以下几种。(1)阈值型(Threshold) 这种模型的神经元没有内部状态,作用函数f是一个阶跃函数,它表示激活值和其输出f()之间的关系,如图5-3所示。 f()10图 5-3 阈值型神经元的输入输出特性 0001)(f21 阈值型神经元是一种最简单的人工神经元。这种二值型神经元,其输出状态取值1或0,分别代表神经元的兴奋和抑制状态。任一时刻,神经元的状态由功能函数f 来决定。 当激活
12、值0时,即神经元输入的加权总和超过给定的阈值时,该神经元被激活,进入兴奋状态,其状态f()为1; 否则,当0时,即神经元输入的加权总和不超过给定的阈值时,该神经元不被激活,其状态f()为0。22(2)分段线性强饱和型(Linear Saturation) 这种模型又称为伪线性,其输入输出之间在一定范围内满足线性关系,一直延续到输出为最大值1为止。但当达到最大值后,输出就不再增大。如图5-4所示。图 5-4 分段线性饱和型神经元的输入输出特性 f()0123(3)S型(Sigmoid) 这是一种连续的神经元模型,其输出函数也是一个有最大输出值的非线性函数,其输出值是在某个范围内连续取值的,输入输
13、出特性常用S型函数表示。它反映的是神经元的饱和特性,如图5-5所示。f()图 5-5 S型神经元的输入输出特性10ef11)(24(4)子阈累积型(Subthreshold Summation) 这种类型的作用函数也是一个非线性函数,当产生的激活值超过T值时,该神经元被激活产生一个反响。在线性范围内,系统的反响是线性的,如图56所示。f()T01图5-6 子阈累积型神经元的输入输出特性,)(eeeef. 1)(1f25 从生理学角度看,阶跃函数(阈值型)最符合人脑神经元的特点,事实上,人脑神经元正是通过电位的高低两种状态来反映该神经元的兴奋与抑制。然而,由于阶跃函数不可微,因此,实际上更多使用
14、的是与之相仿的Sigmoid函数。 26人工神经网络 人工神经网络是对人类神经系统的一种模拟。尽管人类神经系统规模宏大、结构复杂、功能神奇,但其最基本的处理单元却只有神经元。人工神经系统的功能实际上是通过大量神经元的广泛互连,以规模宏伟的并行运算来实现的。 基于对人类生物系统的这一认识,人们也试图通过对人工神经元的广泛互连来模拟生物神经系统的结构和功能。27人工神经网络 人工神经元之间通过互连形成的网络称为人工神经网络。在人工神经网络中,神经元之间互连的方式称为连接模式或连接模型。它不仅决定了神经元网络的互连结构,同时也决定了神经网络的信号处理方式。28人工神经网络的分类目前,已有的人工神经网
15、络模型至少有几十种,其分类方法也有多种。例如:1)按网络拓扑结构可分为层次型结构和互连型结构 2)按信息流向可分为前馈型网络与有反馈型网络;3) 按网络的学习方法可分为有教师的学习网络和无教师的学习网络;4) 按网络的性能可分为连续型网络与离散型网络,或分为确定性网络与随机型网络;29神经元的模型确定之后,一个神经网络的特性及能力主要取决于网络的拓扑结构及学习方法30人工神经网络的互连结构及其学习机理人工神经网络的拓扑结构 建立人工神经网络的一个重要步骤是构造人工神经网络的拓扑结构,即确定人工神经元之间的互连结构。根据神经元之间连接的拓扑结构,可将神经网络的互连结构分为层次型网络和互连型网络两
16、大类。层次型网络结构又可根据层数的多少分为单层、两层及多层网络结构。31人工神经网络的互连结构及其学习机理x1x2xno1o2onwnmw11w1mw2mwn1输出层输入层32单层网络结构有时也称两层网络结构单层或两层神经网络结构是早期神经网络模型的互连模式,这种互连模式是最简单的层次结构。1)不允许属于同一层次间的神经元互连。2)允许同一层次间的神经元互连,则称为带侧抑制的连接(或横向反馈)。此外,在有些双层神经网络中,还允许不同层之间有反馈连接。输 出层x1o1w11w1mx2o2w2mxnomwn1输入层V33多层网络结构 通常把三层和三层以上的神经网络结构称为多层神经网络结构。所有神经
17、元按功能分为若干层。一般有输入层、隐层(中间层)和输出层。输出层隐藏层输入层o1o2omx1x2xn34多层网络结构1)输入层节点上的神经元接受外部环境的输入模式,并由它传递给相连隐层上的各个神经元。2)隐层是神经元网络的内部处理层,这些神经元再在网络内部构成中间层,由于它们不直接与外部输入、输出打交道,故称隐层。人工神经网络所具有的模式变换能力主要体现在隐层的神经元上。 3)输出层用于产生神经网络的输出模式。 较有代表性的多层网络模型有:前向网络模型、多层侧抑制神经网络模型和带有反馈的多层神经网络模型等。35 多层前向神经网络多层前向神经网络模型如图5-8所示。输入模式:由输入层进入网络,经
18、中间各层的顺序变换,最后由输出层产生一个输出模式,便完成一次网络更新。前向网络的连接模式不具有侧抑制和反馈的连接方式。图5-8 多层前向神经网络模型36 多层侧抑制神经网同一层内有相互连接的多层前向网络,它允许网络中同一层上的神经元之间相互连接,如图5-9所示。这种连接方式将形成同一层的神经元彼此之间的牵制作用,可实现同一层上神经元之间的横向抑制或兴奋的机制。这样可以用来限制同一层内能同时激活神经元的个数,或者把每一层内的神经元分成若干组,让每组作为一个整体来动作。图5-9 多层侧抑制神经网络37 带有反馈的多层神经网络 这是一种允许输出层-隐层,隐层中各层之间,隐层-输入层之间具有反馈连接的
19、方式,反馈的结果将构成封闭环路。x1o1输出层隐藏层输入层x2o2omxn38 带有反馈的多层神经网络 这种神经网络和前向多层神经网络不同。多层前向神经网络属于非循环连接模式,它的每个神经元的输入都没有包含该神经元先前的输出,因此可以说是没有“短期记忆”的。但带反馈的多层神经网络则不同,它的每个神经元的输入都有可能包含有该神经元先前的输出反馈信息。因此,它的输出要由当前的输入和先前的输出两者来决定,这有点类似于人类短期记忆的性质。39人工神经网络的运行一般分为学习和工作两个阶段。40人工神经网络学习 人工神经网络最具有吸引力的特点是它的学习能力。 人工神经网络学习和记忆的心理学基础 学习和记忆
20、是人类智能的一个重要特征。有一种观点认为,人类的学习过程实际上是一种经过训练而使个体在行为上产生较为持久改变的过程。按照这种观点,学习离不开训练。41人工神经网络学习 学习和记忆同样也应该是人工神经网络的一个重要特征。 人工神经网络的学习过程就是它的训练过程。人工神经网络的功能特性由其连接的拓扑结构和突触连接强度(即连接权值)来确定。神经网络训练的实质是通过对样本集的输入/输出模式反复作用于网络,网络按照一定的学习算法自动调节神经元之间的连接强度(阈值)或拓扑结构,当网络的实际输出满足期望要求,或者趋于稳定时,则认为学习圆满结束。42 现以人工神经网络对手写“A”、“B”两个字母的识别为例进行
21、说明,规定当“A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。 网络学习的准则应该是:如果网络作出错误的的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。 如果输出为“0”(即结果错误),则把网络连接权值朝着减小综合输入加
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经网络 基本原理 学习 PPT 教案
限制150内