模式识别-第八章-实例教学ppt课件.ppt
《模式识别-第八章-实例教学ppt课件.ppt》由会员分享,可在线阅读,更多相关《模式识别-第八章-实例教学ppt课件.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 实例教学实例教学8.1 应用统计决策的肤色提取应用统计决策的肤色提取 8.1.1图像基础知识 nHSI表色模型表色模型n面向彩色处理的最常用的模型,符合人类的视觉面向彩色处理的最常用的模型,符合人类的视觉感受。感受。H(Hue)色调(色相),表明物体是什么颜色。色调(色相),表明物体是什么颜色。S(Saturation)饱和度,表明该种颜色的浓淡。饱和度,表明该种颜色的浓淡。I(Intensity)亮度,与图像的彩色信息无关。亮度,与图像的彩色信息无关。nRGB模型与模型与HSI模型可以相互转换。模型可以相互转换。8.1.2样本获取 原始图像 H H分量分量 S S分量分量 I
2、I分量分量由于由于H H分量较好的区分了肤色与分量较好的区分了肤色与背景,因此选背景,因此选H H分量图像中的像分量图像中的像素点作为样本。素点作为样本。8.1.3样本学习样本学习 H分量 H分量的二值化图皮肤点数的先验概率:皮肤点数的先验概率:P P( 1 1)= =是皮肤的像素点是皮肤的像素点数数 / / 所有像素点数所有像素点数 = 7.99%= 7.99%非皮肤点数的先验概率:非皮肤点数的先验概率:P P( 2 2)= =不是皮肤的像不是皮肤的像素点数素点数 / / 所有像素点数所有像素点数= 92.01%= 92.01%(1 1)计算先验概率:)计算先验概率:图像二值化,为图像二值化
3、,为1 1的是的是皮肤,为皮肤,为0 0的是背景。的是背景。(2 2)计算类条件概率密度:)计算类条件概率密度:计算计算H H分量图像中皮肤区域的直方图,就是皮肤的类分量图像中皮肤区域的直方图,就是皮肤的类条件概率密度;计算条件概率密度;计算H H分量图像中非皮肤区域的直方分量图像中非皮肤区域的直方图,就是非皮肤的类条件概率密度。图,就是非皮肤的类条件概率密度。 非皮肤的类条件概率密度非皮肤的类条件概率密度 皮肤的类条件概率密度皮肤的类条件概率密度 横坐标是像素点可能的灰度值(将灰度量化成了横坐标是像素点可能的灰度值(将灰度量化成了8等分),纵坐标是相应区域中灰度值等分),纵坐标是相应区域中灰
4、度值为横坐标值的像素点数。为横坐标值的像素点数。 P(x| 1): 0.9855 0.0143 0 0 0 0 0 0.0002 P(x| 2): 0.0790 0.7820 0.0742 0.0192 0.0199 0.0074 0.0072 0.01088.1.4模式分类模式分类 输入下图,用最小误判概率准则和最小损失准输入下图,用最小误判概率准则和最小损失准则判决判断每个像素点是否是皮肤。则判决判断每个像素点是否是皮肤。 待分类的图像 H分量 a)最小误判概率准则最小误判概率准则判断每个像素点是否使皮肤。判断每个像素点是否使皮肤。两类问题的两类问题的Bayes最小误判概率准则为最小误判概
5、率准则为如果如果 ,则判,否则判,则判,否则判,x为为每个像素点的灰度值,若该点属于皮肤,置位每个像素点的灰度值,若该点属于皮肤,置位1;若不;若不是皮肤,置位是皮肤,置位0,得到下图。,得到下图。 最小误判概率准则的识别结果12121221( |)()( )( |)()p xPlxp xP1x2xb)b)最小损失准则最小损失准则 1111= 0,= 0, 1212=10=10, , 2121=1, =1, 2222=0=0 如果,则判,否则如果,则判,否则判。判。x x为每个像素点的灰度值,若该点为每个像素点的灰度值,若该点属于皮肤,置位属于皮肤,置位1 1;若不是皮肤,置位;若不是皮肤,置
6、位0 0,得到下,得到下图。图。 可以看出最小损可以看出最小损失准则得到的皮肤更失准则得到的皮肤更完整,漏检率下降,完整,漏检率下降,但是将更多非皮肤点但是将更多非皮肤点误判为皮肤,虚警率误判为皮肤,虚警率增加。增加。最小损失准则的识别结果 1221221212211211( |)()()( )( |)( )()p xPlxp xP 1x2x8.2 车牌识别车牌识别 8.2.1车牌相关知识 英文字母中的英文字母中的I I和和O O一般避而不用,以免和数字中的一般避而不用,以免和数字中的1 1和和0 0混淆。混淆。 车牌大小为车牌大小为440440* *140mm140mm。汉字字体为黑体,数字
7、和字母字体为国家公安部门开汉字字体为黑体,数字和字母字体为国家公安部门开发的特殊字体。发的特殊字体。8.2.2 图像采集 8.2.3车牌识别预处理(1)字符分割 (2)字符细化 1.特征选择与提取(1 1)特征空间向量的选择)特征空间向量的选择 由于车牌中字母和数字都有特定的字体,且作为汽车的由于车牌中字母和数字都有特定的字体,且作为汽车的“身份证身份证”,车牌制作过程严谨,相同字符形态区别不大,他们的差异性和共同点都很车牌制作过程严谨,相同字符形态区别不大,他们的差异性和共同点都很明显。基于上节描述的设计准则,综合考虑了提取特征的编程复杂度和特明显。基于上节描述的设计准则,综合考虑了提取特征
8、的编程复杂度和特征对不同字符的区分度,本系统分别从字符的形态、结构、笔画特点出发征对不同字符的区分度,本系统分别从字符的形态、结构、笔画特点出发,采用了,采用了4 4个类别共个类别共1010个特征值作为判断的矢量依据(特征提取时均以细个特征值作为判断的矢量依据(特征提取时均以细化后图像为基础)。化后图像为基础)。字符的重心判断:字符的重心判断: 字符重心位于上方字符重心位于上方/ /下方,分别计算字符上下半区的像素数目,如果下方,分别计算字符上下半区的像素数目,如果其差值在一个固定的小范围内其差值在一个固定的小范围内( (试验得出此差值在试验得出此差值在0-200-20像素内为最佳像素内为最佳
9、) ),则该特征值记为则该特征值记为2 2,上方偏多记为,上方偏多记为1 1,下方偏多记为,下方偏多记为3 3; 字符重心位于左方字符重心位于左方/ /右方,分别计算字符左右半区的像素数目,如果右方,分别计算字符左右半区的像素数目,如果其差值在一个固定的小范围内其差值在一个固定的小范围内( (试验得出此差值在试验得出此差值在0-200-20像素内为最佳像素内为最佳) ),则该特征值记为则该特征值记为2 2,左方偏多记为,左方偏多记为1 1,右方偏多记为,右方偏多记为3 3。 特定位置的扫描线特征:特定位置的扫描线特征: 图像垂直图像垂直1/31/3处扫描线穿越的线条数目;处扫描线穿越的线条数目
10、; 图像垂直图像垂直1/21/2处扫描线穿越的线条数目;处扫描线穿越的线条数目; 图像垂直图像垂直2/32/3处扫描线穿越的线条数目;处扫描线穿越的线条数目; 图像水平图像水平1/31/3处扫描线穿越的线条数目;处扫描线穿越的线条数目; 图像水平图像水平2/32/3处扫描线穿越的线条数目;处扫描线穿越的线条数目; 为了消除可能的细化算法不完善的影响,以上在计算穿越次数时均为为了消除可能的细化算法不完善的影响,以上在计算穿越次数时均为0-10-1改变次数。改变次数。 笔画特征:笔画特征: 字符中字符中“竖竖”的数目,计算图像在水平方向上的投影,投影点的像素数目的数目,计算图像在水平方向上的投影,
11、投影点的像素数目累加值超过累加值超过1/31/3图像高度且无超过图像高度且无超过5 5像素的中断,记为像素的中断,记为“竖竖”的数目加的数目加1 1; 字符中字符中“横横”的数目,计算图像在垂直方向上的投影,投影点的像素数目的数目,计算图像在垂直方向上的投影,投影点的像素数目累加值超过累加值超过1/31/3图像宽度且无超过图像宽度且无超过5 5像素的中断,记为像素的中断,记为“横横”的数目加的数目加1 1; 在实际情况中,由于车牌图像并不总是标准的,当出现倾斜、几何失真在实际情况中,由于车牌图像并不总是标准的,当出现倾斜、几何失真等情况时,字符中的横或竖不可能全部投影在一点上,而是在一个小范围
12、内等情况时,字符中的横或竖不可能全部投影在一点上,而是在一个小范围内密集分布。经过多次尝试,结合车牌字符本身特点,本文将判定存在竖密集分布。经过多次尝试,结合车牌字符本身特点,本文将判定存在竖/ /横笔横笔画的门限值设为图像高度画的门限值设为图像高度/ /宽度的宽度的1/31/3左右。左右。 为了消除可能的图像几何失真带来的影响,计算笔画数目时均不重复计为了消除可能的图像几何失真带来的影响,计算笔画数目时均不重复计算算2020像素点以内的笔画,既若该点存在横像素点以内的笔画,既若该点存在横/ /竖,则在该投影方向上向下竖,则在该投影方向上向下/ /后移后移动动2020像素继续判断。像素继续判断
13、。 结构特征:结构特征: 字符中存在闭合回路的数目。利用递归实现区域生长算法,对所有独立连字符中存在闭合回路的数目。利用递归实现区域生长算法,对所有独立连通区域进行标号处理,最后将连通区域个数减一通区域进行标号处理,最后将连通区域个数减一( (外围背景区域也作为一个连外围背景区域也作为一个连通区域被标号,需要在特征值中减去通区域被标号,需要在特征值中减去) )记为该特征值。记为该特征值。(2 2)模板数据的生成)模板数据的生成考虑到车牌字符的特殊性,无法使用Windows系统自带的普通字体来作为标准模板。我们对拍摄到的车牌图像进行如下处理,形成了标准的模版数据。为了杜绝可能的系统图像处理缺陷,
14、使用PhotoShop等商用软件将其调整为二值化图像;为了减少系统缩放函数可能存在的不完善对画面失真的影响,将不同字符做成140*440的标准图像,供系统提取特征值;使用程序中的细化模块细化图像,并以特征提取模块计算标准图像的特征值,将得出的数据结果作为模板数据,以矩阵的形式保存在template.ini文件中。 2.2.字符识别字符识别采用最小距离准则进行模板匹配的识别。判决的标准采用欧式距离最小准则,计算当前图形的特征向量与34个特征向量(除字母I和O以外的所有数字和字母,共34个)的欧式距离,取其中最小的为判决结果。于是待识别样品与模板k之间的欧式距离dk为: 10122|iiikyxd
15、33010122|minkiiiyxd其中距离最短者为:对每一个样品的判决过程为:遍历所有模板,计算其模板与样品间的欧式距离,取最小值作为最终判决结果。如果最短距离小于某个规定的阈值,则结果为这个最小值相对应的类别;否则判定为无法识别。识别结果如图所示 在本系统中,使用一个识别模块来识别当前样品,其算法流程图如下图:8.3 纸币识别器纸币识别器 、数据采集数据采集、特征提取特征提取、训练学习训练学习、分类识别分类识别8.3.1数据采集 纸币面额:5元,10元,20元,50元,100元8.3.2特征提取与选择 特征提取:长度、宽度、磁性、磁性特征提取:长度、宽度、磁性、磁性的位置,光反射亮度、光
16、透射亮度等的位置,光反射亮度、光透射亮度等8.3.38.3.3训练学习训练学习训练集:是一个已知样本集,在监督学习方法中,训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。图中给出了对一个样本用它来开发出模式分类器。图中给出了对一个样本进行特征提取、分类的学习过程进行特征提取、分类的学习过程8.3.4分类识别分类识别对测试集来进行分类识别,确定纸币的面额及真伪对测试集来进行分类识别,确定纸币的面额及真伪。为了更好地对模式识别系统性能进行评价,必须。为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。使用一组独立于训练集的测试集对系统进行测试。
17、图中是对图中是对1010元纸币分类识别的界面。元纸币分类识别的界面。8.4最近邻方法用于图像拼接最近邻方法用于图像拼接8.4.18.4.1图像获取图像获取获取有重叠区域的两幅图像,如下图所示: (a a) (b)(b)8.4.2 特征提取特征提取n分别在两副图中用分别在两副图中用SIFT算法提取特征点,算法提取特征点,(a)图中的特图中的特征点数为征点数为5793,(b)图中的特征点数为图中的特征点数为3199。nScale Invariant Feature Transform ,尺度不变量特,尺度不变量特征提取算法,简称征提取算法,简称 SIFT 算法,是一种提取控制点特征算法,是一种提取
18、控制点特征的经典算法(以下所说的的经典算法(以下所说的“关键点关键点”(Keypoint)是)是文献文献1中提到的说法,中提到的说法, 可以理解为控制点)。可以理解为控制点)。nSIFT算法提取的算法提取的SIFT特征向量具体具有如下特性:特征向量具体具有如下特性:SIFT特征是图像的局部特征,其对旋转、尺度缩放、特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定;独特性保持一定程度的稳定;独特性(Distinctiveness)好,信好,信息量丰富,适用于在海量特征数据库中进行快速、准确
19、息量丰富,适用于在海量特征数据库中进行快速、准确的匹配;多量性,即使少数的几个物体也可以产生大量的匹配;多量性,即使少数的几个物体也可以产生大量SIFT特征向量;高速性,经优化的特征向量;高速性,经优化的SIFT匹配算法甚至匹配算法甚至可以达到实时的要求;可扩展性,可以很方便的与其他可以达到实时的要求;可扩展性,可以很方便的与其他形式的特征向量进行联合。形式的特征向量进行联合。nSIFT SIFT 算法首先在尺度空间进行特征检测,并确定关算法首先在尺度空间进行特征检测,并确定关键点的位置和关键点所处的尺度,然后使用关键点键点的位置和关键点所处的尺度,然后使用关键点邻域梯度的主方向作为该点的方向
20、特征,以实现算邻域梯度的主方向作为该点的方向特征,以实现算子对尺度和方向的无关性。主要计算步骤如下:子对尺度和方向的无关性。主要计算步骤如下: n尺度空间极值检测:搜索整个尺度和图像位置。通尺度空间极值检测:搜索整个尺度和图像位置。通过使用高斯差分函数(过使用高斯差分函数(Difference of GaussianDifference of Gaussian)确定对尺度和方向具有不变性的兴趣点。以初步确确定对尺度和方向具有不变性的兴趣点。以初步确定关键点位置和所在尺度。定关键点位置和所在尺度。n关键点定位:在每一个候选位置,详细地模型拟合关键点定位:在每一个候选位置,详细地模型拟合以确定位置
21、和尺度。根据稳定性选择关键点。通过以确定位置和尺度。根据稳定性选择关键点。通过拟合三维二次函数以精确确定关键点的位置和尺度拟合三维二次函数以精确确定关键点的位置和尺度,同时消除低对比度的关键点和不稳定的边缘响应,同时消除低对比度的关键点和不稳定的边缘响应点点( (因为高斯差分算子会产生较强的边缘响应因为高斯差分算子会产生较强的边缘响应) ),以,以增强匹配稳定性、提高抗噪声能力。增强匹配稳定性、提高抗噪声能力。n方向分配:每一个关键点根据局部图像梯度方向分配一个或多个方向分配:每一个关键点根据局部图像梯度方向分配一个或多个方向。其后所有操作都根据分配的方向、尺度、位置。利用关键方向。其后所有操
22、作都根据分配的方向、尺度、位置。利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。算子具备旋转不变性。n关键点描述符:在每个关键点周围在选定的尺度下测量局部图像关键点描述符:在每个关键点周围在选定的尺度下测量局部图像梯度。为了增强匹配的稳健性,对每个关键点使用梯度。为了增强匹配的稳健性,对每个关键点使用44共共16个个种子点来描述,这样对于一个关键点就可以产生种子点来描述,这样对于一个关键点就可以产生128个数据,最个数据,最终形成终形成128维的维的SIFT特征向量。特征向量。n其中第一步骤里高斯差分函
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 第八 实例 教学 ppt 课件
限制150内