人体姿态估计的研究-毕业论文.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《人体姿态估计的研究-毕业论文.docx》由会员分享,可在线阅读,更多相关《人体姿态估计的研究-毕业论文.docx(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、摘要摘要人体姿态估计是计算机视觉领域中的一个关键问题,可以应用于人体活动分析,人机交互以及视频监视等方面。人体姿态估计主要是指从图像中检测出人体各部位位置、方向以及尺度信息。人体姿态估计常常被人们在视频跟踪环境中提起,由于基于单目图像的人体姿态估计的基础性和方便性,近年来国内外学者将人体姿态估计的研究重点开始转到静态图片人体姿态估计。本文正是从计算机视觉出发,对于基于视觉的静态图片中人体姿态估计进行了研究,主要做了以下工作:(1) 了解了Kinect技术的一些主要工作原理和在人体姿态估计当中的应用;(2) 研究了一些基本的图像特征提取,包括:深度信息,梯度直方图(Histogram of Gr
2、adients)和形状上下文(Shape Context)的算法原理及应用现状;(3) 研究了主成分分析法算法(PCA)的主要原理,并且利用该算法对输入输出数据进行降维处理;(4) 最后,针对上述不同的三种图像特征分别进行实验,从得到的实验结果中,根据平均绝对误差的大小,分析比较了三种不同特征下的人体姿态估计之间的效果。关键字:人体姿态估计,Kinect,深度信息,梯度直方图,形状上下文,主成分分析法59AbstractABSTRACTHuman pose estimation is an essential issue in computer vision area since it has
3、 many applications such as human activity analysis, human computer interaction and visual video surveillance, it main purpose of human pose estimation is that detect the position、scale and direction of parts of people .Human pose estimation is often approached in a video setting, within the context
4、of tracking. Recent focus in the area has expanded to single-image pose estimation, because of its foundation and convenience . In this dissertation, vision-based human body estimation is investigated. Main contributions of this thesis are follows:(1) We get to know some main principals about the te
5、chnology of the Kinect,and its real application in the human pose estimation.(2) We do some research about the extract of picture features,such as depth information、histogram of gradient(Histogram of Gradients)and shape context(Shape Context).In particular,we explain the main principals of all these
6、 methods and their statement of applications.(3) We do some research about the principal of PCA and we use it to reduce our datas dimensions;(4) At last,we perform a lot of experiments with respect to the picture features mentioned above ,judging from the results obtained from experiments,we analyse
7、 these three different experimentsabsolute average errors used in human pose estimation. Keywords:human body estimation,Kinect,depth information,histogram of gradient ,shape context,PCA目录目 录第1章 引言11.1 绪论11.2 人体姿态估计的研究意义11.3 人体姿态估计研究现状31.3.1 人体姿态估计分类31.3.2 静态图片中的人体姿态估计31.4 人体姿态估计研究难点41.5 本文的研究内容和结构安排
8、51.5.1 本文的研究内容51.5.2 本文的结构安排5第2章 图像深度信息72.1 深度图像的研究现状72.1.1 深度图像的概念与特征72.1.2 深度图像研究现状82.2 Kinect技术82.2.1 Kinect简介82.2.2 Kinect深度成像的基本原理92.3 实验数据预处理112.3.1 PCA算法的概念与应用112.3.2 PCA算法的原理112.3.3 输入输出数据降维152.4 本章小结17第3章 梯度直方图算法183.1 梯度直方图特征描述符183.1.1 梯度直方图183.1.2 矩形梯度直方图描述符193.2 梯度计算203.2.1 线性算子与核算子203.2.
9、2 图像卷积203.2.3 梯度大小和方向计算213.3 分配权值213.3.1 高斯滤波权值分配213.3.2 三线插值233.4 梯度直方图特征向量233.5 梯度直方图人体检测算法243.6 本章小结25第4章 形状上下文264.1 形状匹配简述264.1.1 形状匹配的相关概念264.1.2 形状的表示方法274.1.3 基于全局特征的形状匹配284.1.4 基于局部特征的形状匹配284.2 形状的轮廓点集表示294.2.1 引言294.2.2 形状的轮廓点集表示294.3 形状上下文的定义304.3.1 形状上下文的具体定义304.3.2 基于形状上下文的形状匹配334.3.3 不变
10、性分析334.4 本章总结34第5章 线性回归模型355.1 线性回归模型355.1.1 线性基函数模型355.1.2 极大似然法和最小二乘法385.1.3 最小二乘法的几何解释405.2 规范化的最小二乘法415.3 多个输出425.4 实验结果比较分析435.4.1 回归模型在实验中的应用435.4.2 不同实验误差的比较分析445.4.3 实验效果展示475.5 本章小结48第6章 总结与展望496.1 全文总结496.2 未来工作展望49参考文献50致谢52外文资料原文53外文资料译文56第1章 引言第1章 引言1.1 绪论人机交互(Human-Computer Interaction
11、,HCI)是一门研究系统与用户之间互动关系的一门学科。这里的系统可以是各种各样的机器,也可以是计算机化的系统和软件。人类获取的外部世界信息,其中是通过人的眼睛即视觉感知得到的超过80以上,让机器能够拥有像人类一样的视觉是人类社会多年的梦想。随着人机交互技术的快速发展,人与机器之间自然的、多模态的交互将成为人与机器之间交互的主要方式。这里首先遇到的问题就是需要机器能够正确地认识和理解人的行为,正是在这种背景情况下,姿态估计被人们提出。姿态估计是指检测和估计目标(通常是人)的姿态动作,需要将这些姿态动作转化成为数字形式的“抽象运动”的技术,输出的结果表示当前人体的姿态动作。1.2 人体姿态估计的研
12、究意义过去二十多年里,自动理解图像以及视频序列中的人体姿态,一直都是机器视觉研究的重点。除了人类自己对探索和仿造自身的兴趣外,促使人体姿态估计成为研究重点的最主要原因还是电子设备的迅速发展以及由它所产生的巨大应用市场。最近几年,数字照相机、智能手机、平板电脑、网络摄像头、监控摄像头等数码产品渐渐融入人们的日常生活,地球上每时每刻都会产生大量新的数字图片和视频数据,其中人类活动必然是人们想从这些数据中获得的最主要内容。有效的处理和理解数据中的人类活动,将会为人类社会的发展带来深远影响。概括来讲,人体姿态估计的应用领域主要包括:(1)高级人机交互人们都希望机器能够理解人类活动并与人进行自然交互,这
13、是人类由来已久的科技追求目标。随着科技的发展,人类生活离不开各种各样的机器设备,从智能手机到数字电视,从个人电脑到平板电脑,但是传统的键盘鼠标以及现在触摸的交互方式还是占主要部分。2010年微软后来居上,发布 Kinect(如图1-1),其是一种3D 感知体态的摄影机,它具有即时语音识别、麦克风输入、辨识影像、动态捕捉信息、社区互动等其他功能。玩家可以在游戏中打球、开车、分享信息等。由此能够预见的是,当人体姿态估计技术走向成熟时,人机交互方式的革命性变化必然会被人类迅速接受,使得人与机器的交互自然而友好,并且使人们控制机器的方式变的更加容易以及更易接受。图1-1 Kinect游戏(2)智能监控
14、视频监控目前已经成为保障人类财产、生命安全、维护社会秩序稳定的主要手段之一。越来越多的监控设备安装在办公楼、广场、车站等人群相对聚集的社会公共场所。(3)人体姿态捕捉人体姿态数据的捕捉现在主要应用在制作动画、工业测量、医疗分折和控制等领域。精准的人体姿态数据能够用来驱动动画角色,减轻动画设计师的负担;同时也可以帮助运动员分析自己的运动特点,并有针对性的制定训练计划、治疗方法;也可帮助车辆设计师分析和改进产品,有效预防事故、减少伤害等。1.3 人体姿态估计研究现状正是由于人体姿态估计的重要应用价值,所以它吸引着越来越多工业以及学术研究人员的目光。1.3.1 人体姿态估计分类人体姿态可以分为二维和
15、三维两类情形:二维的人体姿态是指人体关节在图像二维平面分布的一种描述,一般使用线段或者矩形等来描述人体关节在图像二维平面的投影,线段长度和线段角度分布或者矩形大小和矩形方向就描述了人体二维姿态,二维姿态中不存在二义性问题;三维人体姿态是指人体在三维空间中的位置和角度信息,一般用关节树模型来描述估计的姿态,也有一些研究者采用更加复杂的模型,一般使用模型反投影的方法获取三维姿态。由1.2节知,人体姿态估计可以应用于人体活动分析、人机交互以及视觉监视等领域,是近期计算机视觉领域中的一个热门问题。人体姿态估计常常被人们在视频跟踪环境中提起,近年来人体姿态估计开始转到静态图片人体姿态估计,这是因为这一问
16、题对视频运动捕捉的初始化非常有用。人体姿态估计面向的人体对象在广义上比较宽泛,既包括整体的人体,也包括人体的其他局部肢体,如脸部、肩膀、胳膊、腿部等。本文只关注人体作为整体时在静态图片(人体姿态的二维情形)中的姿态估计,而不考虑其他身体部位的局部姿态。1.3.2 静态图片中的人体姿态估计现有的人体姿态估计工作可以分为无模型(model-free)、基于模型(model-based)的两类方法。1.3.2.1 无模型人体姿态估计无模型的人体姿态估计方法又可以划分为基于学习的方法(learn-based)和基于样本(sample-based)方法。(1)基于学习的方法:使用训练样本学习从图像特征空
17、间到人体姿态空间的回归模型,将大量训练样本浓缩表达为紧致的函数,从新观测图像中提取图像特征代入学习得到的回归模型,这样即可估计当前的人体姿态1。例如,文献2中使用人体轮廓的形状关联作为特征,采用 Relevance Vector Machine 作为回归器,用稀疏贝叶斯非线性回归方法学习得到一个紧凑的映射模型,并将特征空间映射到参数空间,对输入特征直接输出其相应的人体姿态参数;文献3中则是将输入空间分成许多简单的小区域,这里的每个小区域都有相对应的映射函数,并使用了一种反馈匹配机制对姿态进行重构,由于训练数据范围较小,映射函数有较好的拟合效果,所以这种方法能够很大程度上提高估计准确度。虽然基于
18、学习的方法执行速度快,不需要专门初始化,具有较小的存储代价,且无需保存样本数据库,但是基于学习方法的估计结果往往受训练样本规模的影响较大。(2)基于样本的方法:首先需要建立模板库,其中存储大量特征以及已知的人体姿态训练样本。当输入估计测试图像时,提取相应特征再用某种度量与模板库里的样例进行比较,即找到和估计图像相似的训练样本,再使用最近邻(KNN)或者其他算法估计测试图像的人体姿态。人体姿态十分复杂,不同的姿态所投影得到的图像特征描述符可能非常相似,即特征描述符与姿态空间之间是一对多的关系。1.3.2.2 基于模型的人体姿态估计基于模型方法将人体划分成一些相互联系的部件,用图模型(Pictor
19、ial Model)表示人体架构,并使用图推理(inference)方法优化人体姿态,即在进行人体姿态估计的过程中使用先验的人体模型,并且模型的参数也随着当前状态的变化而更新。基于模型的人体姿态估计中主要由三部分组成图模型、优化算法、部件的观测模型。图模型用来表示部件连接之间的约束关系,其中树模型最常用的模型,树形模型是根据部件之间的连接情况来定义,相对直观。基于模型的人体姿态估计具有较强的通用性,它减少了训练样本的制作成本同时也减少了训练样本的存储代价。1.4 人体姿态估计研究难点静态图片中人体姿态估计是运用学习、推断算法结合图像处理过程来获得人体的姿态参数并重建人体结构和姿态,最终目标是达
20、到能够对人体姿态做出正确理解与合理应用。本文研究的静态图片姿态估计则是直接利用图片信息进行人体姿态参数的获取、估计。人体作为一个被分析对象,相对于其他物体(比如汽车、人脸等),具有特殊内在属性,且在静态图片中缺少三维信息,这样使得静态图片中的人体姿态估计在视觉研究中显得尤为困难。(1)高维度状态空间。每一个静止人体姿态都是根据关节的运动枢轴的旋转角度所决定,它是多参数的状态变量。而在人体实际运动尺度上,该变量的维度会高达几十甚至上百,建立以及求解高维状态的数学模型是一个很大挑战。(2)非刚体特性。机器视觉中可以将研究对象划分为刚体、非刚体两大类。人体是典型的非刚体目标,每一时刻人体中每个肢体运
21、动都不相同。非刚体模型通常情况下很难建立,因此非刚体目标的运动、姿态估算以及识别都很困难,对人体目标也是一样。(3)姿态复杂。虽然人体和人脸一样都是非刚体物体,但是人体的分析难度远高于人脸,这主要因为人脸面部五官的变化仅仅是由肌肉驱动产生,而人体姿态的形成则是由多个关节旋转产生,又由于人体各肢体部位活动灵活,肢体部件之间存在很多的自遮挡情况,这使得二义性问题变的异常复杂。另外,图像作为人体姿态估计的观测数据,对于其处理目前尚仍存在困难。1.5 本文的研究内容和结构安排1.5.1 本文的研究内容本文的主要研究内容是基于学习的方法进行人体姿态估计,把基于Kinect设备得到的深度图像信息作为图像特
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人体 姿态 估计 研究 毕业论文
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内