计算机视觉的手势跟踪与识别技术的分析研究 .docx
《计算机视觉的手势跟踪与识别技术的分析研究 .docx》由会员分享,可在线阅读,更多相关《计算机视觉的手势跟踪与识别技术的分析研究 .docx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结基于运算机视觉的手势跟踪与识别技术的争论1 绪论 21. 1手势识别争论的意义 21. 2手势识别国内外争论现状21.3基于视觉的手势跟踪与识别流程图32 基于运算机视觉的手势识别基础理论32. 1模式识别概述 32 2基于运算机视觉的手势跟踪理论42 3基于运算机视觉的手势识别理论52 3 1神经网络算法 52 3 2基于模板匹配的算法 62 3 3统计分析算法 72 3 4隐马尔可夫模型 HMM72. 4基于运算机视觉的手势跟踪与识别系统83 手势图像预处理及特点提取 83. 1手势图像预处理 83 1 1图像平滑 93 1 .2图像颜色空间转换 103. 1 .3图像二值
2、化 113.1 .4图像外形学处理 123. 2手势图像特点提取 134 手势跟踪算法争论 134. 1 Kalman 跟踪算法 134. 2 Camshift 跟踪算法 154. 2 1颜色概率模型 155 基于运算机视觉的手势跟踪与识别算法试验165. 2手势图像预处理及特点提取试验结果175 2 1手势图像猎取及手势样本库的建立175 2 .2手势图像的预处理 195 2手势跟踪试验结果及分析 205 3实时手势识别试验结果及分析 215 3 1手势识别系统流程 215.4 手势跟踪与识别在人机交互中的应用216 总结与展望 237 附录: 247.1 程序重要部分代码 247.2 手势
3、识别的视频 277.3 国内外生产手势识别软件的厂家28可编辑资料 - - - 欢迎下载精品名师归纳总结1 绪论1.1 1 手势识别争论的意义在人机交互的进展过程中先后显现了基于文本方式的键盘、基于图形方式的鼠标等交互接,然而从某种程度上说,这些机械设备在人机交互方面是不便利和不和谐的。它把机器作为人机交互的中心,在人机交互时人需要去适应机器的输入输出设备,对机器没有主动掌握的才能。随着运算机科学的快速进展,争论符合人类沟通习惯的人机交互技术成为国内外关注的热点,这些争论包括人脸识别、面部表情识别、头部运动跟踪、眼睛识别、手势识别以及人体姿态识别等。总体来说,人机交互的争论已经从以运算机为中心
4、转移到以人为中心,大大提高了人机交互的效率。手势作为人类最自然的表达方式之一,在日常生活中得到了广泛的应用。手势生动、形象、直观,而且蕴涵着丰富的信息,是人与人沟通的重要媒介。目前基于手势的交互已经成为人机交互的重要内容。手势识别的应用前景特别宽阔:1 对于聋哑人而言,特殊是文化程度比较低的聋哑人,使用手语和正常人沟通更加便利和高效。手语是用手势表示意思的语言,对不熟识手语的一般人来说,懂得手语是特别困难的。假如有一套可以翻译手语的系统,就将大大便利聋哑人与正常人之间的沟通。2利用手势对虚拟现实中的智能设备进行掌握。比如在虚拟场景内利用手势实现虚拟钢琴的演奏,又如用机器人的虚拟手抓取物体等。
5、3争论人类对于视觉语言的懂得规律,提高运算机对人类语言的懂得才能。4手势交互是虚拟现实中多通道接口的重要组成部分之一。1.2 2 手势识别国内外争论现状依据外围设备采集手势图像方式的不同可以把手势识别分为两种:基于数据手套的手势识别和基于视觉的手势识别。基于数据手套的手势识别是通过数据手套和位置跟踪来测量手势运动的轨迹和时序信息,其优点是系统的识别率高,缺点是输入设备昂贵,并且要求打手势的人穿戴复杂的数据手套,给人带来很多不便,因此这种方式不能成为将来进展的趋势。基于视觉的手势识别是运算机通过对摄像头拍照的手势图像进行分析和处理提取出手的位置及外形。这种方法在实现时无需购买昂贵的设备,仅需要廉
6、价的摄像头和低端处理才能的PC机即可。并且在操作时更加自然、便利,符合以人为本和自由性的要求,是手势识别将来进展的趋势。但是这种方法的识别效率比基于数据手套的手势识别低,而且能够识别的手势种类受到很大的限制,是目前亟待解决的问题。国外很早就开头了对手势识别的争论工作。Huang 创建的手语识别系统使用3D神经网络的方法识别了 15个不同的手势。 Stamert51等人使用隐马尔可夫模型HMM 对输入视频序列中的美国手势中带有词性的40个词汇随机组成的句子进行了识别,其中HMM 参数的估量采纳的是 EM 算法。系统对分别单词的识别和由5个单词组成的句子 句子的结构限定为代词+动词+名词+形容词
7、+代词 的识别分别进行了测试,识别正确率达90。 Zhu6 使用主成分分析方法创建统计结构,从而识别活跃对象的外形,即模型化系统和弹性对象的识别。Vogler和MetaxastTl 开发的手语懂得系统通过固定在人身上的物理传感器和一个能够对手臂进行精确定位的摄像机来猎取手臂位置信息。系统采纳独立的语言模型对包括53个单词的可编辑资料 - - - 欢迎下载精品名师归纳总结手语集进行了测试,识别率也达到90。我国对手势识别的争论起步较晚,但近年来也取得了显著的成果。例如文献f81 中使用神经网络方法和 Hough 变换对中国手语中的 20种手势进行识别。在文献 91q丁采纳基于表观的手势模型,提取
8、八个手势特点组成特点向量,采用二次分类 粗分类和细分类 的方法对 10个常用的静态手势进行识别。张秋余、姚开博等采纳矩形特点描述手势,用改进的AdaBoost 算法训练分类器,在复杂背景下对手势的跟踪与识别取得了不错的成效。中科院的单彩峰提出了结合均值漂移的粒子滤波 The Mean ShiftEmbeddedParticle Filter ,MSEPF ,通过在时序模板中引入时空轨迹,提出了时序模板轨迹概念,将跟踪得到的手势运动轨迹压缩到单幅图像中,实现了对预先定义的动态手势的识别。山东高校的徐立群等提出了一种基于颜色概率模型并融合运动信息进行手势跟踪的新方法。利用肤色概率查找表将图像序列转
9、换为肤色概率分布图,用运动信息和肤色概率分布对搜寻窗口进行初始化,然后对肤色概率分布图进行迭代运算,得到手势的位置和大小,从而实现了对六种孤立手势的识别。1.3 基于视觉的手势跟踪与识别流程图本课题的主要内容是争论基于运算机视觉的手势跟踪与识别。第一对手势跟踪与识别各个阶段的算法进行了分析,提出基于Hu 矩特点和 “一对多 径向基核函数支持向量机相结合的手势识别算法,并在MicrosoftVisualC+6 0开发环境下,借助 OpenCV开源库,实现了对从摄像头输入的10个常用手势的识别,以验证提出算法的可行性,并以此为基础建立了一个简洁的手势交互系统。基于视觉的手势跟踪与识别流程图见图1-
10、1。图1-1 基于视觉的手势跟踪与识别流程图2 基于运算机视觉的手势识别基础理论在人与人的交际过程中,常常会用到手势,手势的语义强大并且直观,可以很好的表达思想,与自然语言形成互补。所以近些年来,手势识别的争论得到了很大的关注和进展。本章主要介绍基于视觉的手势识别的一些基础理论。可编辑资料 - - - 欢迎下载精品名师归纳总结2.1 1 模式识别概述模式识别产生于 20世纪 20岁月,随着 40岁月运算机的显现, 50岁月人工智能的兴起, 模式识别在 60岁月初快速进展成 -f 学科 1131。它所争论的理论和方法在很多科学和技术领域中得到了广泛的重视,推动了人工智能的进展,扩大了运算机应用的
11、可能性。几十年来,模式识别争论取得了大量的成果,在很多方面都得到了广泛的应用。但是,由于模式识别涉及到很多复杂的问题,现有的理论和方法对于解决这些问题仍有很多不足之处。通常,我们把通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息称为模式,把各模式所属的类别称为模式类。模式识别是对表征事物或者现象的各种形式的信息进行分析和处理,来实现对事物或现象进行描述、辨认、分类和说明,是信息科学和人工智能的重要组成部分。人们为了把握客观事物,就将事物依据相像度组成类别。模式识别的作用和目的就在于面对某一具体事物时将其 J下确的归入某一类别。有两种基本的模式识别方法,即统计模式识别方法和结构模式识
12、别方法。与此相应的模式识别系统都由两个过程组成,即设计与实现。设计是指用肯定数量的样本叫做训练集或学习集 进行分类器的设计。实现是指用所设计的分类器对待识别的样本进行分类决策。基于统计方法的模式识别主要由4个部分组成:数据猎取、预处理、特点提取和选择、分类决策,如图 2-1所示。图2-1 模式识别系统的基本构成1. 数据猎取为了使运算机能够对各种现象进行分类识别,要用运算机可以运算的符号来表示所研究的对象。通常输入对象的信息有一维波形、物理参量和规律值、二维图像3种类型,通过测量、采样和量化,可以用矩阵或向量表示二维图像或一维波形。这就是数据猎取的过程。2. 预处理预处理的目的是去除噪声,加强
13、有用的信息,并对输入测量仪器或其他因素所造成的退化现象进行复原。3. 特点提取由图像或波形所获得的数据量是相当大的。例如,一个文字图像可以有几千个数据, 一个心电图波形也可能有几千个数据。为了有效的实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特点。这就是特点提取和选择的过程。一般我们把原始数据组成的空间叫测量空间,把分类识别赖以进行的空间叫做特点空间,通过变换,可把在维数较高的测量空间中表示的模式变为在维数较低的特点空间中表示的模式。 4分类决策分类决策就是在特点空间中用统计方法把被识别对象归为某一类别。基本做法是在样本训练集基础上确定某个判决规章,使按这种判决规章对被识别对象
14、进行分类所造成的错可编辑资料 - - - 欢迎下载精品名师归纳总结误识别率最小或引起的缺失最小。2.2 基于运算机视觉的手势跟踪理论手势分割与跟踪是手势识别的基础,其好坏将影响识别率的大小。手势分割的方法大体分为三种:基于运动信息的、基于运动模板的和基于颜色信息的。基于运动信息的手势分割是通过对前后两帧图像做差分运算来检测手势的,当手势运动时就图像发生变化。运动估量的依据是图像强度发生变化,用图像序列中相邻图像的差 来表示强度的变化。图像差运算特别简洁,这是由于在图像差运算中仅仅涉及到了像素强 度的相减。在实际的手势识别系统中,摄像机的位置是固定的,对手势序列中相邻两帧图 像做差分运算便能有效
15、的保留运动的部分即手势 ,滤除图像中保持不变的背景区域。基于运动模板的手势分割是用模板匹配方法查找运动的手势,一般把二维可变形模板作为插值节点去近似物体轮廓。模板由平均点集合、点可变性参数和外部变形构成,平均点集合描述的是某一组外形的平均外形,点可变性参数描述的是可变形模板的全局运动。通常用基于可变形模板的人手模型来跟踪人手。二维模板实现简洁,但对手的姿念有肯定限制。三维模板就不受手的姿态的限制,但其参数过多使得实现困难。基于颜色信息的分割在图像分割中占有重要位置。颜色分割与其他两种方法相比,具 有高效性和鲁棒性等特点,得到了广泛的应用。但是在复杂背景的情形下或者光照变化快 时,基于颜色的分割
16、成效不好,为明白决这个问题,目前众多争论者尝试利用融合多种信 息的技术进行手势分割。国内外对手势跟踪的争论很多,例如利用粒子滤波ParticleFilter 对手势跟踪获得了较好的成效。Camshift 巧JContinuouslyAdaptiveMean Shift 是一种基于颜色概率模型的跟踪算法,它是MeanShift 算法的改进与扩展,可以处理动态变化的分布。当视频序列一帧一帧变化时,Camshif t能够自动调剂搜寻窗的大小和位置,定位被跟踪目标的中心和大小,并且用当前帧定位的结果来猜测下一帧图像中目标的中心和大小,每帧图像都这样处理,就形成了连续的跟踪。2.3 3 基于运算机视觉的
17、手势识别理论基于视觉的手势识别可以分为基于单目视觉的手势识别和基于多目视觉的手势识别。基于单目视觉的手势识别就是通过单个摄像机来采集手势图像,从而建立平面手势模型。这种方法处理的数据量较小,识别速度快,但是对于用户手势的输入限制较大。基于多目视觉的手势识别是通过两个或两个以上的摄像机来采集图像,建立的是立体模型。这种方法对于用户手势的输入限制较小,可以实现更加自然的人机交互,但由于立体模型的复杂性,需要处理大量的数据,识别时间长,无法实现实时的识别。基于视觉的手势识别算法可分为神经网络算法、模板匹配,统计分析算法、和隐马尔可夫模型 Hidden Markov Model HMM 等。2.3.1
18、 神经网络算法对人工神经网络的争论早在20世纪 40岁月就已经开头了。有人以包含0-1和1-0变化的随机模型作为模型化神经系统的基础。到了50岁月中期和 60岁月初期,人们已设计出称为感知机 perceptrons 的学习机器,引起了模式识别理论界人士的重视。80岁月中期可编辑资料 - - - 欢迎下载精品名师归纳总结提出的对多层感知机的新训练算法称为以反扩散学习的广义德尔塔Delta 规章 是特别有效的。广义德尔塔规章在很多实际问题中得到了胜利的应用,使得多层感知机类机器成为目自玎使用神经网络的主要模型之一。神经网络是指利用工程技术手段模拟人脑神经网络的结构和功能的一种技术,其目的是使机器具
19、有人脑那样的感知、学习和推理功能。神经网络方法在手势识别领域得到了广泛的使用。它对信息处理具有自组织、自学习等特点,有较强的抗干扰才能。它是由很多具有非线性映射才能的神经元组成的一种大规模并行处理网络,神经元之间通过权相连。文献 16qbM Yeasin采纳了 TDNNTimeDelayNeutral Network 时延神经网络 的手势识别技术。BP神经网络模型实现了多层网络学习的设想。它是一种单向传播的多层前向神经网络,除输入输出节点外仍有一层或多层隐层节点,同层节点之I 、日 J没有耦合,输入信号从输入层节点依次传过各层节点,最终到达输出层节点。每一层节点的输出只影响下一层节点的输出。
20、BP神经网络结构分三层:输入层、隐含层和输出层。图2-2是一个三层前馈神经网络模型,输入层、中间隐含层和输出层的神经元个数分别为5、50和9。图2-2 三层前馈神经网络模型BP网络学习是典型的有导师学习。训练集包含M 个样本,对第 P个训练样本 P=1,2 , , M,单元的实际输出为郇,它的第i 个输入 也即第 i个神经元的输入 为,就:2-1BP算法中大多项用 S型函数作为输出函数,即:2-22.3.2 基于模板匹配的算法模板匹配算法就是将输入的原始数据与预先储备的模板进行匹配,通过测量两个模板之间的相像度进行识别。模板匹配的方法多用于静态手势识别中,如 CuiYuntao通过运算模板的相
21、关系数来进行猜测匹配。文献f181 中张良国、吴江琴、高文等人可编辑资料 - - - 欢迎下载精品名师归纳总结第一改进了 Hausdorff 距离,接下来通过比较预处理后的输入图像的Hausdorff 距离和标准模板库中各种图像的 Hausdorff 距离进行判定。Hausdorff 距离是描述两组点集之间相像程度的一种量度,它是两个点集之间距离的一种定义形式【 191:假设有两组集合A= , B= ,就这两个点集之上的Hausdorff 距离定义为:2-32-42-5是点集 A和点集 B间的距离范式这里,式 2-3 称为双向 Hausdorff 距离,是 Hausdorff 距离的最基本形式
22、。式2-42-5中的 hA , B 和hB , A 分别称为从 A 集合到 B集合和从 B集合到 A 集合的单向 Hausdorff 距离。即 hA , B实际上第一对点集A 中的每个点到距离此点最近的B 集中点 b,之间的距离进行排序,然后取该距离中的最大值作为hA ,B 的值, hB ,A 同理可得。由式 2-3 知,双向 Hausdorff 距离 HA,B 是单向距离 hA , B 和hB , A 两者中的较大者,它度量了两个点集之间的最大不匹配程度。2.3.3 统计分析算法统计分类算法是在模式识别进展的过程中建立的经典方法,它用概率统计模型得到各类别的特点向量分布,以达到分类的目的。统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机视觉的手势跟踪与识别技术的分析研究 计算机 视觉 手势 跟踪 识别 技术 分析研究
限制150内