模式识别 第八章 实例教学优秀PPT.ppt
《模式识别 第八章 实例教学优秀PPT.ppt》由会员分享,可在线阅读,更多相关《模式识别 第八章 实例教学优秀PPT.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、你现在浏览的是第一页,共58页8.1 应用统计决策的肤色提取应用统计决策的肤色提取8.1.1图像基础知识nHSI表色模型表色模型n面向彩色处理的最常用的模型,符合人类的视觉感受。面向彩色处理的最常用的模型,符合人类的视觉感受。H(Hue)色调(色相),表明物体是什么颜色。色调(色相),表明物体是什么颜色。S(Saturation)饱和度,表明该种颜色的浓淡。饱和度,表明该种颜色的浓淡。I(Intensity)亮度,与图像的彩色信息无关。亮度,与图像的彩色信息无关。nRGB模型与模型与HSI模型可以相互转换。模型可以相互转换。你现在浏览的是第二页,共58页8.1.2样本获取 原始图像 H H分量
2、分量 S S分量分量 I I分量分量由于由于H H分量较好的区分了肤色与背景,分量较好的区分了肤色与背景,因此选因此选H H分量图像中的像素点作为样分量图像中的像素点作为样本。本。你现在浏览的是第三页,共58页8.1.3样本学习样本学习 H分量H分量的二值化图皮肤点数的先验概率:皮肤点数的先验概率:P P(1 1)=是皮肤的像素点数是皮肤的像素点数 /所有像素点数所有像素点数 =7.99%=7.99%非皮肤点数的先验概率:非皮肤点数的先验概率:P P(2 2)=不是皮肤的像素不是皮肤的像素点数点数 /所有像素点数所有像素点数=92.01%=92.01%(1 1)计算先验概率:)计算先验概率:图
3、像二值化,为图像二值化,为1 1的是的是皮肤,为皮肤,为0 0的是背景。的是背景。你现在浏览的是第四页,共58页(2 2)计算类条件概率密度:)计算类条件概率密度:计算计算H H分量图像中皮肤区域的直方图,就是皮肤的类分量图像中皮肤区域的直方图,就是皮肤的类条件概率密度;计算条件概率密度;计算H H分量图像中非皮肤区域的直方分量图像中非皮肤区域的直方图,就是非皮肤的类条件概率密度。图,就是非皮肤的类条件概率密度。非皮肤的类条件概率密度非皮肤的类条件概率密度 皮肤的类条件概率密度皮肤的类条件概率密度 横坐标是像素点可能的灰度值(将灰度量化成了横坐标是像素点可能的灰度值(将灰度量化成了8等分),纵
4、坐标是相应区域中灰度值为横坐标等分),纵坐标是相应区域中灰度值为横坐标值的像素点数。值的像素点数。P(x|1):0.9855 0.0143 0 0 0 0 0 0.0002 P(x|2):0.0790 0.7820 0.0742 0.0192 0.0199 0.0074 0.0072 0.0108你现在浏览的是第五页,共58页8.1.4模式分类模式分类 输入下图,用最小误判概率准则和最小损失准输入下图,用最小误判概率准则和最小损失准则判决判断每个像素点是否是皮肤。则判决判断每个像素点是否是皮肤。待分类的图像 H分量你现在浏览的是第六页,共58页a)最小误判概率准则最小误判概率准则判断每个像素点
5、是否使皮肤。判断每个像素点是否使皮肤。两类问题的两类问题的Bayes最小误判概率准则为最小误判概率准则为如果如果 ,则判,否则判,则判,否则判,x为每个为每个像素点的灰度值,若该点属于皮肤,置位像素点的灰度值,若该点属于皮肤,置位1;若不是皮;若不是皮肤,置位肤,置位0,得到下图。,得到下图。最小误判概率准则的识别结果你现在浏览的是第七页,共58页b)b)最小损失准则最小损失准则 1111=0,=0,1212=10=10,2121=1,=1,2222=0=0 如果,则判,否则如果,则判,否则判。判。x x为每个像素点的灰度值,若该点属于为每个像素点的灰度值,若该点属于皮肤,置位皮肤,置位1 1
6、;若不是皮肤,置位;若不是皮肤,置位0 0,得到下图。,得到下图。可以看出最小损可以看出最小损失准则得到的皮肤更失准则得到的皮肤更完整,漏检率下降,完整,漏检率下降,但是将更多非皮肤点但是将更多非皮肤点误判为皮肤,虚警率误判为皮肤,虚警率增加。增加。最小损失准则的识别结果你现在浏览的是第八页,共58页8.2 车牌识别车牌识别 你现在浏览的是第九页,共58页8.2.1车牌相关知识 英文字母中的英文字母中的I I和和O O一般避而不用,以免和数字中的一般避而不用,以免和数字中的1 1和和0 0混混淆。淆。车牌大小为车牌大小为440*140mm440*140mm。汉字字体为黑体,数字和字母字体为国家
7、公安部门开发的汉字字体为黑体,数字和字母字体为国家公安部门开发的特殊字体。特殊字体。你现在浏览的是第十页,共58页8.2.2 图像采集 你现在浏览的是第十一页,共58页8.2.3车牌识别预处理(1)字符分割 你现在浏览的是第十二页,共58页(2)字符细化 你现在浏览的是第十三页,共58页1.特征选择与提取(1 1)特征空间向量的选择)特征空间向量的选择 由于车牌中字母和数字都有特定的字体,且作为汽车的由于车牌中字母和数字都有特定的字体,且作为汽车的“身份证身份证”,车牌制作,车牌制作过程严谨,相同字符形态区别不大,他们的差异性和共同点都很明显。基于过程严谨,相同字符形态区别不大,他们的差异性和
8、共同点都很明显。基于上节描述的设计准则,综合考虑了提取特征的编程复杂度和特征对不同字符上节描述的设计准则,综合考虑了提取特征的编程复杂度和特征对不同字符的区分度,本系统分别从字符的形态、结构、笔画特点出发,采用了的区分度,本系统分别从字符的形态、结构、笔画特点出发,采用了4 4个类别个类别共共1010个特征值作为判断的矢量依据(特征提取时均以细化后图像为基础)。个特征值作为判断的矢量依据(特征提取时均以细化后图像为基础)。字符的重心判断:字符的重心判断:字符重心位于上方字符重心位于上方/下方,分别计算字符上下半区的像素数目,如果其差值在下方,分别计算字符上下半区的像素数目,如果其差值在一个固定
9、的小范围内一个固定的小范围内(试验得出此差值在试验得出此差值在0-200-20像素内为最佳像素内为最佳),则该特征值记为,则该特征值记为2 2,上方偏多记为,上方偏多记为1 1,下方偏多记为,下方偏多记为3 3;字符重心位于左方字符重心位于左方/右方,分别计算字符左右半区的像素数目,如果其差值在一个右方,分别计算字符左右半区的像素数目,如果其差值在一个固定的小范围内固定的小范围内(试验得出此差值在试验得出此差值在0-200-20像素内为最佳像素内为最佳),则该特征值记为,则该特征值记为2 2,左,左方偏多记为方偏多记为1 1,右方偏多记为,右方偏多记为3 3。特定位置的扫描线特征:特定位置的扫
10、描线特征:图像垂直图像垂直1/31/3处扫描线穿越的线条数目;处扫描线穿越的线条数目;图像垂直图像垂直1/21/2处扫描线穿越的线条数目;处扫描线穿越的线条数目;图像垂直图像垂直2/32/3处扫描线穿越的线条数目;处扫描线穿越的线条数目;图像水平图像水平1/31/3处扫描线穿越的线条数目;处扫描线穿越的线条数目;图像水平图像水平2/32/3处扫描线穿越的线条数目;处扫描线穿越的线条数目;你现在浏览的是第十四页,共58页 为了消除可能的细化算法不完善的影响,以上在计算穿越次数时均为为了消除可能的细化算法不完善的影响,以上在计算穿越次数时均为0-10-1改变次数。改变次数。笔画特征:笔画特征:字符
11、中字符中“竖竖”的数目,计算图像在水平方向上的投影,投影点的像素数目累的数目,计算图像在水平方向上的投影,投影点的像素数目累加值超过加值超过1/31/3图像高度且无超过图像高度且无超过5 5像素的中断,记为像素的中断,记为“竖竖”的数目加的数目加1 1;字符中字符中“横横”的数目,计算图像在垂直方向上的投影,投影点的像素数目累加值的数目,计算图像在垂直方向上的投影,投影点的像素数目累加值超过超过1/31/3图像宽度且无超过图像宽度且无超过5 5像素的中断,记为像素的中断,记为“横横”的数目加的数目加1 1;在实际情况中,由于车牌图像并不总是标准的,当出现倾斜、几何失真在实际情况中,由于车牌图像
12、并不总是标准的,当出现倾斜、几何失真等情况时,字符中的横或竖不可能全部投影在一点上,而是在一个小范围内等情况时,字符中的横或竖不可能全部投影在一点上,而是在一个小范围内密集分布。经过多次尝试,结合车牌字符本身特点,本文将判定存在竖密集分布。经过多次尝试,结合车牌字符本身特点,本文将判定存在竖/横笔横笔画的门限值设为图像高度画的门限值设为图像高度/宽度的宽度的1/31/3左右。左右。为了消除可能的图像几何失真带来的影响,计算笔画数目时均不重复计算为了消除可能的图像几何失真带来的影响,计算笔画数目时均不重复计算2020像素像素点以内的笔画,既若该点存在横点以内的笔画,既若该点存在横/竖,则在该投影
13、方向上向下竖,则在该投影方向上向下/后移动后移动2020像素继续像素继续判断。判断。结构特征:结构特征:字符中存在闭合回路的数目。利用递归实现区域生长算法,对所有独立连字符中存在闭合回路的数目。利用递归实现区域生长算法,对所有独立连通区域进行标号处理,最后将连通区域个数减一通区域进行标号处理,最后将连通区域个数减一(外围背景区域也作为一个连通区外围背景区域也作为一个连通区域被标号,需要在特征值中减去域被标号,需要在特征值中减去)记为该特征值。记为该特征值。你现在浏览的是第十五页,共58页(2 2)模板数据的生成)模板数据的生成考虑到车牌字符的特殊性,无法使用Windows系统自带的普通字体来作
14、为标准模板。我们对拍摄到的车牌图像进行如下处理,形成了标准的模版数据。为了杜绝可能的系统图像处理缺陷,使用PhotoShop等商用软件将其调整为二值化图像;为了减少系统缩放函数可能存在的不完善对画面失真的影响,将不同字符做成140*440的标准图像,供系统提取特征值;使用程序中的细化模块细化图像,并以特征提取模块计算标准图像的特征值,将得出的数据结果作为模板数据,以矩阵的形式保存在template.ini文件中。你现在浏览的是第十六页,共58页2.2.字符识别字符识别采用最小距离准则进行模板匹配的识别。判决的标准采用欧式距离最小准则,计算当前图形的特征向量与34个特征向量(除字母I和O以外的所
15、有数字和字母,共34个)的欧式距离,取其中最小的为判决结果。于是待识别样品与模板k之间的欧式距离dk为:其中距离最短者为:你现在浏览的是第十七页,共58页对每一个样品的判决过程为:遍历所有模板,计算其模板与样品间的欧式距离,取最小值作为最终判决结果。如果最短距离小于某个规定的阈值,则结果为这个最小值相对应的类别;否则判定为无法识别。识别结果如图所示 在本系统中,使用一个识别模块来识别当前样品,其算法流程图如下图:你现在浏览的是第十八页,共58页8.3纸币识别器纸币识别器 、数据采集、数据采集、特征提取特征提取、训练学习训练学习、分类识别分类识别你现在浏览的是第十九页,共58页8.3.1数据采集
16、 纸币面额:5元,10元,20元,50元,100元你现在浏览的是第二十页,共58页8.3.2特征提取与选择特征提取:长度、宽度、磁性、磁性特征提取:长度、宽度、磁性、磁性的位置,光反射亮度、光透射亮度等的位置,光反射亮度、光透射亮度等你现在浏览的是第二十一页,共58页8.3.38.3.3训练学习训练学习训练集:是一个已知样本集,在监督学习方法中,用训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。图中给出了对一个样本进行它来开发出模式分类器。图中给出了对一个样本进行特征提取、分类的学习过程特征提取、分类的学习过程你现在浏览的是第二十二页,共58页8.3.4分类识别分类识别对测
17、试集来进行分类识别,确定纸币的面额及真伪。对测试集来进行分类识别,确定纸币的面额及真伪。为了更好地对模式识别系统性能进行评价,必须使为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。用一组独立于训练集的测试集对系统进行测试。图中是对图中是对1010元纸币分类识别的界面。元纸币分类识别的界面。你现在浏览的是第二十三页,共58页8.4最近邻方法用于图像拼接最近邻方法用于图像拼接8.4.18.4.1图像获取图像获取获取有重叠区域的两幅图像,如下图所示:(a a)(b)(b)你现在浏览的是第二十四页,共58页8.4.2 特征提取特征提取n分别在两副图中用分别在两副图
18、中用SIFT算法提取特征点,算法提取特征点,(a)图中的特征点图中的特征点数为数为5793,(b)图中的特征点数为图中的特征点数为3199。nScale Invariant Feature Transform,尺度不变量特征提,尺度不变量特征提取算法,简称取算法,简称 SIFT 算法,是一种提取控制点特征的经典算法,是一种提取控制点特征的经典算法(以下所说的算法(以下所说的“关键点关键点”(Keypoint)是文献)是文献1中中提到的说法,提到的说法,可以理解为控制点)。可以理解为控制点)。nSIFT算法提取的算法提取的SIFT特征向量具体具有如下特性:特征向量具体具有如下特性:SIFT特特征
19、是图像的局部特征,其对旋转、尺度缩放、亮度变化保持征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定;独特性定;独特性(Distinctiveness)好,信息量丰富,适用于在海好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配;多量性,即使少数量特征数据库中进行快速、准确的匹配;多量性,即使少数的几个物体也可以产生大量的几个物体也可以产生大量SIFT特征向量;高速性,经优特征向量;高速性,经优化的化的SIFT匹配算法甚至可以达到实时的要求;可扩展性,匹配算法甚至可以达到实时的
20、要求;可扩展性,可以很方便的与其他形式的特征向量进行联合。可以很方便的与其他形式的特征向量进行联合。你现在浏览的是第二十五页,共58页nSIFT SIFT 算法首先在尺度空间进行特征检测,并确定关键点的算法首先在尺度空间进行特征检测,并确定关键点的位置和关键点所处的尺度,然后使用关键点邻域梯度的主位置和关键点所处的尺度,然后使用关键点邻域梯度的主方向作为该点的方向特征,以实现算子对尺度和方向的无方向作为该点的方向特征,以实现算子对尺度和方向的无关性。主要计算步骤如下:关性。主要计算步骤如下:n尺度空间极值检测:搜索整个尺度和图像位置。通过尺度空间极值检测:搜索整个尺度和图像位置。通过使用高斯差
21、分函数(使用高斯差分函数(Difference of GaussianDifference of Gaussian)确定对)确定对尺度和方向具有不变性的兴趣点。以初步确定关键点位置尺度和方向具有不变性的兴趣点。以初步确定关键点位置和所在尺度。和所在尺度。n关键点定位:在每一个候选位置,详细地模型拟合以确定关键点定位:在每一个候选位置,详细地模型拟合以确定位置和尺度。根据稳定性选择关键点。通过拟合三维二次位置和尺度。根据稳定性选择关键点。通过拟合三维二次函数以精确确定关键点的位置和尺度,同时消除低对比度函数以精确确定关键点的位置和尺度,同时消除低对比度的关键点和不稳定的边缘响应点的关键点和不稳定
22、的边缘响应点(因为高斯差分算子会产因为高斯差分算子会产生较强的边缘响应生较强的边缘响应),以增强匹配稳定性、提高抗噪声,以增强匹配稳定性、提高抗噪声能力。能力。你现在浏览的是第二十六页,共58页n方向分配:每一个关键点根据局部图像梯度方向分配一个或多个方方向分配:每一个关键点根据局部图像梯度方向分配一个或多个方向。其后所有操作都根据分配的方向、尺度、位置。利用关键点邻向。其后所有操作都根据分配的方向、尺度、位置。利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。备旋转不变性。n关键点描述符:在每个关键点
23、周围在选定的尺度下测量局部图像关键点描述符:在每个关键点周围在选定的尺度下测量局部图像梯度。为了增强匹配的稳健性,对每个关键点使用梯度。为了增强匹配的稳健性,对每个关键点使用44共共16个种个种子点来描述,这样对于一个关键点就可以产生子点来描述,这样对于一个关键点就可以产生128个数据,最终形成个数据,最终形成128维的维的SIFT特征向量。特征向量。n其中第一步骤里高斯差分函数是这样定义的:其中第一步骤里高斯差分函数是这样定义的:n高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺度空间定义为:度空间定义为:n n其中其中 是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 第八章 实例教学优秀PPT 第八 实例 教学 优秀 PPT
限制150内