2022年仿生模式识别_拓扑模式识别_一种模式识别新模型的理论与应用 .pdf
《2022年仿生模式识别_拓扑模式识别_一种模式识别新模型的理论与应用 .pdf》由会员分享,可在线阅读,更多相关《2022年仿生模式识别_拓扑模式识别_一种模式识别新模型的理论与应用 .pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、仿生模式识别(拓扑模式识别) 一种模式识别新模型的理论与应用王守觉(中国科学院半导体研究所神经网络实验室,北京100083)摘 要: 本文提出了一种模式识别理论的新模型,它是基于“认识”事物而不是基于 “区分”事物为目的.与传统以 “最佳划分”为目标的统计模式识别相比,它更接近于人类 “认识” 事物的特性,故称为“仿生模式识别”.它的数学方法在于研究特征空间中样本集合的拓扑性质,故亦称作“拓扑模式识别”.“拓扑模式识别”的理论基点在于它确认了特征空间中同类样本的连续性(不能分裂成两个彼此不邻接的部分)特性.文中用“仿生模式识别” 理论及其“高维空间复杂几何形体覆盖神经网络”识别方法,对地平面刚
2、体目标全方位识别问题作了实验.对各种形状相像的动物及车辆模型作全方位8800次识别,结果正确识别率为99175 % ,错误识别率与拒识率分别为0与0125 %.关键词:模式识别;神经网络;仿生学;高维几何中图分类号:O235文献标识码:A文章编号:037222112 (2002) 1021417204Bionic(Topological)Pattern Recognition A New Model of Pattern RecognitionTheory and Its ApplicationsWANG Shou 2jue(Lab of ArtificialNeural Networks,
3、Institute of Semiconductors , C AS , Beijing100083, China)Abstract :A new model of pattern recognition principles ,witch is basedon“matter cognition”insteadof“matter classification”in traditional statistical pattern recognition,has beenproposed. This new model is better closer to the function of hum
4、an being ,ratherthan traditional statistical pattern recognition using“optimal seperating”asits main principle. S o the new model of pattern recognition iscalled the Bionic Pattern Recognition. Its mathematical basis are topological analysis of sam ple set in the high dimensional featurespace,theref
5、ore it is also called the Topological PatternRecognition. The basic idea of this model is basedon the fact of the continuityin the feature spaceof any one of the certain kinds of sam ples. We did experiments on recognition of omnidirectionally oriented rigidobjects on the samelevel ,with the Bionic
6、Pattern Recognition usingneural networks ,which acts by the methodof covering the high di2mensional geometrical distribution of the sam ple set in the feature space.Many animal and vehicle models(even with rather similarshapes ) were recognizedomnidirectionally thousandsof times. For total 8800 test
7、s,the correct recognition rate is 99175 % ,the errorrate and the rejection rate are 0 and 0125 respectively.Key words :pattern recognition;neural networks ;bionics ;high dimensional geometry1 引言模式识别的发展已有几十年的历史.早在20世纪30年代,Fisher提出的判别分析就是利用已知的两类向量的概率分布函数来设计将两类向量分开的决策规则的问题1 .随即在统计模式识别发展以后,模式识别就被认为是用来选择
8、使平均风险达到最小的模式类别.因而,划分类别问题,与统计判决理论完全相同2 .近年受到人们关注的支持向量机(SVM )的最早提出者Vapnik在1974年提出了“最优分类超平面” 的概念3 并在此基础上后来发展构造成了支持向量机(SVM)4 .综上所述,数十年来人们在研究模式识别问题中,考虑的出发点都是在若干类别的最佳分类划分上.其根本原因或许在于用这样的数学描述与处理方法最具有一般性、 通用性.但众所周知,即使基于目前最先进的模式识别理论基础上的识别机,其实际效果却仍然远不能令人满意.虽然Vapnik在一本非常出色的书中是这样批评人工智能学者的5 . (为了忠于原文,把Vapnik书中(中译
9、本)原话一段引在下面,这对说明本文的目的与出发点是必要的. ) Vapnik写道:“在80年代,人工智能学者在计算学习领域中扮演了主要的角色.在这些人工智能研究者中间,一些较极端的学者有很大的影响(正是他们强调了 复杂的理论是没有用的,有用的是简单的算法) .这些人工智能学者对于处理学习问题有丰富的经验,善于对一些理论上非常复杂的问题构造 简单的算法. 60年代末,人们认为在几年之内就可以完成计算机自然语言翻译器(但时至今日我们尚离解决这个极其复杂的问题很远) ;在此之后的另一个计划是构造通用问题求解器;再之后又是建立大系统自动控制机的计划,等等.所有这些科研计划都没有取得成功.接下来要研究的
10、问题就是如何建立一种计算学习技术.这些学者首先做收稿日期:2002207212;修回日期:2002208205基金项目:国家自然科学基金项目(No160135010 )第10期2002年10月电 子 学 报ACTA E LECTRONICA SINICAVol. 30No.10Oct.2002名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 的是改变了所用的术语.特别地,感知器被改称为神经网络.然后这些研究被称作是与生理学家共同进
11、行的,对学习问题的研究减少了一般性,增加了主观色彩.在60和70年代学习问题研究的主要目标是寻找从小数量样本出发进行归纳推理的最好途径,而到了80年代,目标变成了构造利用大脑来推广的模型. (原文注:当然研究人是如何学习的是很有意义的,但是这并不一定是建立人工学习机器的最佳途径,正如人们对鸟类如何飞行的研究实际上对建造飞机没有多少帮助一样).”本文对Vapnik这段话并非有所评议,只想说明,本文题目用 “仿生模式识别” 中的“仿生”二字,并非Vapnik所批评的“目标变成了构造利用大脑来推广的模型”,而只是为了从功能上更接近于人类对事物的识别过程,而从数学模型上加入了实际“被识别对象”的某些普
12、遍存在的 “特殊性”.这个所谓“特殊性”是针对目前传统的模式识别数学描述方法的“一般性与通用性”而言的,它在实际的模式识别问题中却仍然具有一般性与通用性.本文的基本出发点就在于把模式识别问题看成模式的“认识”,而不是分类划分,不是模式分类;是一类一类样本的“认识”,而不是多类样本的划分.因而,其基本数学模型当然会与传统模式识别的 “最优分类”界面的概念大不相同.2 人类的识别功能与传统模式识别方法的差异设想农村中的一孩子,能认识牛 、 羊 、 马 、 狗 、 树林 、 房子等等农村中所有的一切,但没见过汽车;如果有一辆汽车突然出现在他面前时,试问他会怎样想呢?他会把汽车与以前见过的牛 、 羊
13、、 马 、 狗 等一件件比较,看与哪件最相像吗? (传统模式识别正是这样的)不,他绝不是这样想的,而是认为“我没见过这种东西”“我不认识这种东西”.这正是人类认识事物与传统模式识别的差别.人类侧重于 “认识”,只有在细小之处才重视“区别”(例如要区分狼与狗或马与驴等等) ,而传统模式识别则只注意“区分”,没有重视“认识”的概念.本文提出的 “仿生模式识别” 就是从 “认识”模式的角度进行模式识别;既然它的基本概念不同于已经发展数十年的传统模式识别,为强调与传统模式识别在概念上的不同,用了“仿生模式识别” 这一名词;其中“仿图1生” 二 字 的 含 义 只 是在模式识别的功能和数学模型上强调了从
14、“认 识”的 概 念 出 发,更 接 近 于 人 类 的 识别;而 从 实 现 的 途 径上看,还 没 有 “仿 生”的含 意.下 面 把 仿 生模式识别与传统模式识别的比较与差异以图表方式表示在图1中.3 从基本数学模型看仿生模式识别与传统模式识别的本质差别传统模式识别其基本数学模型的基点在于如文献5 中第12页所述的:所有可用的信息都包含在训练集( 1 - 1)式中的情况下(注:原文(1 - 1)式即训练集坐标( x1, y1) ,( x1, y1) )这就是说在同类样本点相互之间没有任何关系的先验知识存在,因此,一切都只能从特征空间中不同类样本的划分出发了.然而在自然界实际规律中并非如此
15、;本文所提出的仿生模式识别就在于引入了同类样本间存在的某些普遍的规律性而建立起来的 “多维空间中非超球复杂几何形体覆盖”的识别原理.下节将重点讨论同类样本间普遍存在的规律性(亦即普遍存在的先验知识)4 仿生模式识别的基点 特征空间中同类样本全体的连续性规律人们在对事物的识别过程中,存在两种不同的归类过程.一种是“同源” 的归类过程,例如同为简体汉字的手写体识别.另一种是不同源的按逻辑知识归类过程,例如手写体中简体汉字与繁体汉字的归并.对学过简体汉字而未学过繁体汉字的人,对于简体汉字的印刷体、 手写楷书和行书等往往都能认识,而对于繁体汉字却不认识.因为繁体汉字与简体汉字并不源于同一个字形,而是被
16、人为地定义为同一个字的,靠事先学习的逻辑知识把二类归并成一类.我们把“同源”的称为同一类,而在识别以后再按逻辑归类知识把需要归在一起的类别合并.因而以下所称同类样本指的都是“同源”的一类样本.以下讨论“同源” 同类样本的连续性规律;自然界任何欲被认识的事物(包括事物、 图像 、 声音 、 语言 、 状态等等)若存在两个 “同源”同类而不完全相等的事物,而这两个事物的差别是可以渐变的或非量子化的(宏观世界的绝大部分事物正是如此,即使像“苹果产量” 那样不可能细化到一只苹果以下,但以重量计的 “苹果产量” 是考虑为可以渐变的)则这两个同类事物之间必至少存在一个渐变过程,在这个渐变过程中间的各事物都
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年仿生模式识别_拓扑模式识别_一种模式识别新模型的理论与应用 2022 仿生 模式识别 拓扑 一种 模型 理论 应用
限制150内