模糊模式识别.ppt
《模糊模式识别.ppt》由会员分享,可在线阅读,更多相关《模糊模式识别.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模糊模式识别n模式识别基本概念n模式识别的原理n模糊集的贴近度n模糊模式识别的直接方法最大隶属原则 n模糊模式识别的间接方法择近原则n多特征模糊模式识别n模糊模式识别的应用3.1 模式识别基本概念n模式指事物的标准形式、样本。n模式识别是将待识别的对象特征信息与给 定样本特征信息比较、匹配,并给出对象所 属模式类的判断。n读远方家人亲笔信n熟悉一个朋友的面孔n公安人员识别指纹n军用卫星遥感图像识别n人类基因图谱识别3.1 模式识别基本概念n模式识别是利用计算机模拟人的形象思维方法对客观事物进行识别和分类。n模式识别实质上是利用计算机辨识数据结构的过程。n分类和识别二者有许多相似之处,但有区别。
2、n本质上,分类是建立(或寻求)确定数 据,而模式识别则是试图获取新的数据并 将其归入由分类处理所得到的某一种类型之中。3.1 模式识别基本概念n分类是定义模式,模式识别是将数据进行归类。n模式识别是一种有模式的分类问题,而聚类分析是一种无模式的分类问题。n分类过程和模式识别过程都需要建立反馈回路,一方面用以寻找更好的数据分割方法,另一方面用于解决模式匹配错误以实现有效的归类。n现实中的许多模式识别问题,都在很大程度上包含着模糊性信息,因此应用模糊集合论解决模式识别问题,有着广泛的应用。3.2 模式识别的原理 模式识别系统的结构 1 传感器部分感知器,有时又称探头、测试头、感应头。用以将各种待识
3、别对象的模式转变为电信号。根据识别对象,如目标、景物、图像、人物、文字、语言等的种类、性质不同,传感器的形式、原理也不一样,但它们大都基于物理学、电子学、光电子等原理,如利用微波、电磁感应、光电效应、红外线等。传感器的性能直接影响识别系统的质量一般要求它具有足够高的灵敏度、精度、保真性、稳定性及抗扰能力。3.2 模式识别的原理 2 信号预处理部分传感器输出的信号一般比较微弱,波形不规则等,因此不能直接使用。必须对这一信号进行必要的加工、处理,如通过放大、去噪、整形、转换为数字信号等,将信号进行“正规化”处理,可供识别使用。传感器和信号处理两部分的主要任务是向识别系统提供识别对象尽可能多的原始数
4、据(信息)。3.2 模式识别的原理 3 特征分析部分特征分析包括特征标定、特征选择和特征提取三部分。特征标定是提出原始特征值的过程,这项工作通常由专门技术人员根据特定传感器特性和实际测到的结果进行标定。特征选择是从原始的p个特征值中选择s个特征值构成最佳子集的过程。必须选择那些反映待识别对象的各种最重要而又本质的、可区别于它事物的特征作为最佳特征子集。3.2 模式识别的原理特征提取表示将原始具有p个特征值的p维特征空间转换为s维空间的过程。在转换过程中原p空间的有用信息得到最佳保存,其作用并得到加强。特征提取也可以通过计算机对有规则的数据进行判断,来评价特征提取的质量。4 识别分类部分 在基于
5、数值模式识别的统计方法中,每个一个输入观测可表示为一个多维向量(特征向量),该向量的每一个分量表示一个特征。3.2 模式识别的原理 根据从待识别对象提取的特征信息量,按照某种设计的分类原则,对输入的模式进行聚类分析,一般认为把具有相似特征的不同输入观测值可以归入一类,而不同特征的输入观测值分到不同的类别。模式识别的原理被识别对象特征信息数字化多维数据向量通过辨识其数据结构并根据定义的模式对其进行归类。3.3 模糊集的贴近度1 贴近度的定义贴近度的定义 贴近度是对两个模糊集接近程度的一种度量。定义定义1 设A,B,C F(U),若映射 N:F(U)F(U)0,1 满足条件:(1)(2)(3)若A
6、BC,则 N(A,C)N(A,B)N(B,C)则N(A,B)称为模糊集A与B的贴近度.N为F(U)上的贴近度函数.几种常见的贴近度类型:设A,B,C F(U),(1)海明(Haming)贴近度 若U=u1,u2,un,则当U为实数域上的闭区间a,b时,则 几种常见的贴近度类型:设A,B,C F(U),(2)欧几里德(Euclid)贴近度若U=u1,u2,un,则当U=a,b时,有 (3)最大最小贴近度 若U=u1,u2,un,则当U=a,b时,有(4)算术平均最小贴近度 若U=u1,u2,un,则当U=a,b时,有 例例1 设U=0,100,且 求最大最小贴近度 N(A,B)图图3.1 模糊集
7、曲线模糊集曲线解解 不难求得A(x)和B(x)的交点坐标 x*=50,于是2 格贴近度格贴近度 定义2 设 A,B F(U),称为模糊集A,B的内积。内积的对偶运算为外积。称为模糊集A,B的外积。如果在闭区间0,1上定义“余”运算:a0,1,ac=1 a 那么有如下命题 命题命题1 证 先证第一式 再证第二式定义定义3 对A F(U),令称 为模糊集A的峰值;称 为模糊集A的谷值;模糊集A,B,C的内外积的性质 性质性质1性质性质2 性质性质3性质性质4 性质性质5性质性质6 且由性质1-6不难得出,给定模糊集A,让模糊集B靠近A,会使内积 增大而外积 减少,换句话说,当 较大且 较小时,A与
8、B比较贴近。所以,我们通常采取内积与外积相结合的“格贴近度”来刻画两个模糊集的贴近程度,即:定义2 设 A,B F(U),则称是模糊集A,B的贴近度,叫做A,B的格贴近度。当U为有限论域时当U为无限论域时,3.4 模糊模式识别的直接方法 最大隶属原则主要应用于个体的识别最大隶属原则最大隶属原则:设Ai F (U)(i=1,2,n)为n个标准模式,对u0 U是待识别对象,若存在i,使 则认为u0相对地隶属于Ai。例例1 考虑人的年龄问题,分为青年、中年、老年三类,分别对应三个模糊集A1,A2,A3,图图3.3 模糊集曲线模糊集曲线设论域U=(0,100,且对x(0,100,有 某人40岁,即x=
9、40,根据上式,A1(40)=0,A2(40)=1,A3(40)=0,则 A2(40)=maxA1(40)=0,A2(40)=1,A3(40)=0 =max0,1,0=1 按最大隶属原则,他应该是中年人。当x=35时,A1(35)=0.125,A2(35)=0.875,A3(35)=0,所以35岁的人应该是中年人。例例2 用电子计算机自动识别染色体或进行白细胞分类,往往把问题归结为对一些简单的几何图形的识别,最常用的是三角形的识别 三角形论域 U=(A,B,C)|A+B+C=180,ABC0 三角形分为:I 等腰三角形,R 直角三角形,IR 等腰直角三角形,E 等边三角形,T 非典型三角形。它
10、们的隶属函数分别定义为 等腰三角形 直角三角形 等腰直角三角形 等边三角形 非典型三角形 现在给定一个三角形,其内角为(85,50,45),试确定它属于哪种类型?解解 任意三角形U=(A,B,C),待识别的三角形记为 u0=(85,50,45),上述五类三角形是U上模糊集,对于u0=(85,50,45),按上述各式计算得:I(u0)=0.916,R(u0)=0.94,IR(u0)=0.916,E(u0)=0.7,T(u0)=0.05,根据最大隶属原则,应判断u0为近似直角三角形 例例3 通货膨胀识别 解解 设论域X=x|xX,x0,它表示价格指数集,对xX,x表示物价上涨x%,通货膨胀状态可分
11、为五个类型:通货稳定,轻度通货膨胀,中度通货膨胀,重度通货膨胀和恶性通货膨胀,这五个类型依次用X上的模糊集A1,A2,A3,A4,A5表示,根据统计资料分别取它的隶属函数为问x1=8,x2=40相对隶属于哪种类型?解解 A1(8)=0.3679,A2(8)=0.8521,A3(8)=0.0529,A4(8)=0.003,A5(8)=0;A1(40)=0.,A2(40)=0,A3(40)=0.0003,A4(40)=0.1299,A5(40)=0.6412.由最大隶属原则,x1=8应相对隶属于A2,即当物价上涨率为8,应 视为轻度通货膨胀;x2=40相对隶属于A5,即应视为恶性通货膨胀。例例4
12、癌细胞的模式识别 取论域 U=u|u=(NA,NL,A,L,NI,MI,ME 其中:NA核面积(拍照),NL核周长,A细胞面积,L细胞周长,NI核内总光密度,MI核内平均光密度,ME核内平均透光率。根据病理医生的实际经验,选出下列六种主要因素,它们都是U上的模糊集。:核增大 其中NA0是正常核面积 :核增深 :核浆比倒置 :染色体不均 :核畸变 :细胞畸变其中A0,L0是正常值。上面1,2,6是可以调整的参数。这六个因素的模糊集可以组成如下细胞识别中的几个标准模型:M:癌 N:重度核异质 R:轻度核异质 其中 表示一个模糊集,K:正常给定一个具体细胞,按最大隶属原则,鉴别它应归属M,N,R,K
13、中哪一种。例例5 取论域U=0,100,优、良、差分别表示为U上的三个模糊集:A,B,C,它们的隶属函数可以规定如下:A、B、C被看作三个标准模式,当李四的化学分数为86分时,u=86,问:李四的化学成绩是优,是良,还是差呢?这样的问题就是模式识别问题。我们把u=86代入三个隶属函数,A(86)=0.6,B(86)=0.4,C(86)=0,可以看出u=86属于A的程度最大,因此我们都能同意:李四的化学成绩相对于这三个模式归属A,即得评语“优”。图图3.4 优、良、差的隶属函数优、良、差的隶属函数模式识别还有另一类问题。若给出多个人的成绩,判定哪个最靠近“优”?把每个人的成绩代入“优”的隶属函数
14、A(u)中,可以看出谁属于“优”的程度高,就同意谁的成绩最靠近“优”。由此我们又总结出另一个原则:最大隶属原则最大隶属原则:设A F (U)为标准模式,是n个 待录取对象,若存在i,使 则应优先择取ui。也称为最大隶属度原则。例例 6 学生成绩的综合评价 设某班学生在某阶段共学了四门课:数学、物理、化学、外语,例5已给出了优、良、差的隶属度,现有三个学生张三、李四、王五的四门课成绩分别为:u1=(95,82,75,91),u2=(86,73,78,90),u3=(76,68,65,74),相对于这三个学生,看谁最接近优。解解:将u1,u2,u3,u4,分别代入优的隶属度A(u)中,计算 由最大
15、隶属原则知张三最接近优。阈值原则阈值原则设Ai F (U)(i=1,2,n),u0 U,取定水平0,1。若 则判别为不能识别,应查找原因另作分析;若i1,i2,ik,使得则判决为u0相对地隶属于 。该方法也可对u0与某一个标准模型Ai进行识别。如果Ai(u0),则认为u0相对地隶属于Ai;如果Ai(u0)0.75 0.550.75 0.300.60 0.40 0.600.400.600.300.500.200.400.160.40 6.0 0.6 0.5 0.3 2.03.0 5.0 3.75.2 3.04.5 1.53.5 2.0 建立洞库围岩模式建立洞库围岩模式Ai及具体围岩及具体围岩B的
16、隶属的隶属函数:函数:建立洞库围岩第建立洞库围岩第j个特性指标个特性指标uj(j=1,2,3,4)对对于洞库围岩模式于洞库围岩模式Ai(i=1,2,3,4,5)的隶属函数。的隶属函数。在这里选用正态型隶属函数,即在这里选用正态型隶属函数,即其中其中aij是表是表35中洞库围岩类别中洞库围岩类别Ai(i=1,2,3,4,5)的第的第j个特性指标个特性指标uj(j=1,2,3,4)值的值的均值均值,即:,即:ij是表是表35中洞库围岩类别中洞库围岩类别Ai(i=1,2,3,4,5)的的第第j个特性指标个特性指标uj(j=1,2,3,4)值的值的标准差标准差,即,即根据表根据表35中特性指标的数据,
17、用上面两公式中特性指标的数据,用上面两公式即可计算出即可计算出aij,ij(i=1,2,3,4,5,j=1,2,3,4)的值,的值,具体计算值列于表具体计算值列于表36中。中。表表36 各种洞库围岩类别的特性指标均值与标准差值表各种洞库围岩类别的特性指标均值与标准差值表类别 指 标 ai1 ai2 ai3 ai4 i1 i2 i3 i4 I0.8750.8009.0006.0000.0410.0671.0000.333 II0.6500.5009.0004.4500.0670.0331.0000.250 III0.0450.4008.5003.7500.0500.0330.1670.250 I
18、V0.2000.3007.5002.5000.0670.0331.5000.333 V 0.1750.2802.5001.0000.0580.0400.1670.333 对于某一具体洞库围岩对于某一具体洞库围岩B,选取,选取n个测试点,个测试点,在第在第i个测试点对这一洞库围岩个测试点对这一洞库围岩B 进行上述进行上述4个个特性指标的测试,测试值如下:特性指标的测试,测试值如下:(ui1,ui2,ui3,ui4),i=1,2,n。ui1,ui2,ui3和和ui4分别表示分别表示 第第i个测试点测得的洞库围岩个测试点测得的洞库围岩B的的 岩体完整性系数岩体完整性系数u1的值的值ui1,结构面摩擦
19、系数结构面摩擦系数u2的值的值ui2,饱合岩块的坚固性系数饱合岩块的坚固性系数u3的值的值ui3,和岩体纵波速度值和岩体纵波速度值u4的值的值ui4。构造第构造第j个特性指标个特性指标uj(j=1,2,3,4),对于洞库围,对于洞库围岩岩B的隶属函数的隶属函数B(uj)。对于论域。对于论域U上的模糊上的模糊集集B,同样选用正态型的隶属函数,即,同样选用正态型的隶属函数,即aj 在在n个测试点对洞库围岩个测试点对洞库围岩B进行测试而测进行测试而测得的第得的第j个特性指标值个特性指标值uj的均值,的均值,j在在n个测试点对洞库围岩个测试点对洞库围岩B进行测试而测进行测试而测得的第得的第j个特性指标
20、值个特性指标值uj的标准差。的标准差。确定具体洞库围岩确定具体洞库围岩B与洞库围岩模式与洞库围岩模式Ai的加的加权贴近度权贴近度 由格贴近度计算得到:由格贴近度计算得到:为了综合考虑为了综合考虑各特性指标对围岩类分类不同程各特性指标对围岩类分类不同程度的影响度的影响,再选取一组权值,即:,再选取一组权值,即:(1,2,3,4)。j 表示第表示第j个特性指标个特性指标uj(j=1,2,3,4)对洞库围岩对洞库围岩分类影响的分类影响的重要程度重要程度。对于权值的确定可用。对于权值的确定可用德尔斐方法。于是得到了具体洞库围岩德尔斐方法。于是得到了具体洞库围岩B与洞与洞库围岩类别库围岩类别Ai的加权贴
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模糊 模式识别
限制150内