突触动力学Ⅱ有监督学习西安电子科技大学.pptx
本章内容要点有监督学习的理论解释有监督的函数估计有监督的学习相当于操作性条件反射有监督的学习相当于有先验知识的随机模式学习前馈网络的监督学习算法感知器最小均方误差(LMS)算法反向传播(BP)算法第1页/共12页第一部分内容有监督学习和无监督学习有监督的函数估计有监督学习相当于操作性条件反射有监督学习相当于有先验知识的随机模式学习第2页/共12页有监督学习 给定一系列训练样本,其中每个样本都做上了标记,比如说标记出这个样本来自对一个苹果的一次观测。学习的目的是从这些带有标记的样本中学习到一些概念,比如说什么样的数据对应苹果而不是香蕉,并且在未来给出新的样本时,能够正确预测新样本的标记。第3页/共12页无监督学习给定一系列没有任何标记的训练样本,学习的目的时发现隐藏在这些样本中的某种结构,例如样本的聚类情况。环境学习系统状态向量第4页/共12页有监督的函数估计给定观察得到的随机矢量样本对:要估计一个未知函数:使得期望误差函数EJ最小。误差=期望输出-实际输出第5页/共12页有监督的函数估计设N N为一个神经网络的传递函数,那么可以定义瞬时误差为 ,这是一个随机向量,由于我们不知道联合概率密度函数p(x,y)p(x,y)无法求出 ,一般用均方差 替代。随机逼近用观测到的随机量来估计期望值,然后在离散的近似算法中使用这些估计量。用的比较多的近似算法是随机梯度下降法。如本章将要讲述的WidrowWidrows LMSs LMS算法中所用的就是随机梯度。第6页/共12页有监督学习相当于操作性条件反射操作性条件反射强化响应,如果输入与期望的输出不同,就调节权值m。第7页/共12页无监督学习相当于传统条件反射传统条件反射强化刺激。这种神经网络直接把输入x耦合到输出y。例如,一个生物体学会了一刺激响应对:例如,一个生物体学会了一刺激响应对:那么在条件那么在条件刺激刺激 S中加一个条件中加一个条件B进行学习,得到进行学习,得到 不断强化刺激,直到输入不断强化刺激,直到输入B B时反应为时反应为R R。这样就有:。这样就有:也就是学会了一条规则。如巴普洛夫条件反射试验。也就是学会了一条规则。如巴普洛夫条件反射试验。第8页/共12页有监督学习相当于 有先验知识的随机模式学习模式:模式空间 上的点时变模式:定义在 中的轨迹线随机模式学习由已知的样本x(1),x(2)x(n)来估计x的概率密度函数p(x)模式类:是 的子集,也叫决策类,满足:第9页/共12页有监督学习相当于 有先验知识的随机模式学习类的概率其中 ,是一个指示器函数,定义为指示函数指出了模式 x 的类隶属关系。如果 S 是将映射到 而不是 。就称模式 x 以不同的程度隶属于不同的类。类的概率满足第10页/共12页区分学习类型的标准:先验知识在有监督和无监督模式学习中,系统都不知道 它们的区别在于是否有先验知识以及学习系统如何利用贝叶斯学习中用到了指示器函数,是有监督的学习噪声随机竞争学习律:没有使用类成员信息校正突触矢量,是非监督学习监督随机竞争学习律:采用增强函数 奖励正确的模式分类1,惩罚错误的模式分类为1。是有监督模式学习。第11页/共12页感谢您的观看!第12页/共12页