教学课件第10章模式识别的理论和方法(第10-3讲)(研究生学位课)ppt(全).ppt
《教学课件第10章模式识别的理论和方法(第10-3讲)(研究生学位课)ppt(全).ppt》由会员分享,可在线阅读,更多相关《教学课件第10章模式识别的理论和方法(第10-3讲)(研究生学位课)ppt(全).ppt(117页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教学课件第10章模式识别的理论和方法(第10-3讲)(研究生学位课)数字图像处理学数字图像处理学第第10章章 模式识别的理论和方法模式识别的理论和方法(第三讲)(第三讲)阮秋琦教授阮秋琦教授10.3 神神经经网网络络与深度学与深度学习习1943年心里学家W.McCulloch 和 数理逻辑学家W.Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型;1945年J.Von Neumann(冯.诺依曼)提出了简单神经元构成的自再生自动机网络结构。20世纪50年代中期和60年代初,F.Rosenblatt提出了一类所谓的感知机(perceptron)的概念;Minsky和Papert
2、于1969年出版的专著“感知机”论证了简单的线性感知机功能有限,神经网络的研究进入了低潮;80年代初期,美国的物理学家Hopfield发表了两篇关于人工神经元网络的研究论文引起了巨大反响。1986年,Rumelhart,Hinton 和 Williams发表了最新的研究成果,针对多层类感知机单元开发了新训练算法后,大大地改变了研究进程,与传统方法不同,神经网络可以使用反向传播从原始数据开始,自动地学习适合于识别的表示。深度学习在挑战其他求解方法的应用中也表现突出。10.3.1 感知机感知机感知机(perceptron)是二分类的线性分类模型,属于有监督学习算法。感知机旨在求出将输入空间中的事件
3、分为两类的分离超平面。为求得超平面,感知机引入了基于误分类的损失函数(或称代价函数),一般利用梯度下降法对损失函数进行最优化求解。1.感知机基本原理感知机基本原理图10-17 感知机的基本模型图10-18 感知机的几何描述如果训练数据集是线性可分的,如图10-19所示,则感知机一定能求得分离的超平面。图10-19线性可分数据集如果是非线性可分的数据,如图10-20所示,则无法获得超平面。图10-20 线性不可分数据集(10-98)(10-99)图10-21 二维中最简单的两类例子,决策 边界是一条直线 图10-22 用更一般的符号表示决策边界。对于n维情形下的一个点,验证将针对一个超平面进行,
4、超平面的方程是(10-100)这个方程可用求和式表示为(10-101)描述一般形式的分类问题时,给定向量总体中的任意模式向量x,我们想要找到一组具有这种性质的权值。(10-103)(10-104)3.感知机的学感知机的学习习策略策略关于梯度下降法算法梯度下降(Gradient Descent)是迭代法的一种,可以用于求解最小二乘问题。梯度下降法的计算过程就是沿梯度下降的方向求解极小值(当然,也可以沿梯度上升方向求解极大值)。如Rosenbrock函数:在数学最优化中,Rosenbrock函数是一个用来测试最优化算法性能的非凸函数,由Howard Harry Rosenbrock在1960年提出
5、。也称为Rosenbrock山谷或Rosenbrock香蕉函数,或简称为香蕉函数。Rosenbrock函数的定义如下:图10-23 Rosenbrock函数优化过程是之字形的向极小值 点靠近 4.感知机学感知机学习习算法算法感知机采用随机梯度下降法最小化经验损失函数。即:(10-116)(10-117)(10-118)说明原始形式算法的小例子请参阅教材(1)原始形式算法原始形式算法在线性代数中,内积空间中一族向量的格拉姆矩阵(Gramian matrix)是内积的对称矩阵,它的一个重要的应用是计算线性无关,即一族向量线性无关当且仅当格拉姆行列式(格拉姆矩阵的行列式)不等于零。格拉姆矩阵以丹麦数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学 课件 10 模式识别 理论 方法 研究生 学位 ppt
限制150内