基于人体运动预测算法的研究.docx
《基于人体运动预测算法的研究.docx》由会员分享,可在线阅读,更多相关《基于人体运动预测算法的研究.docx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本页为“5毕业论文摘要(1页或2页)”,点击菜单“USTB本科论文各部分”中的本部分菜单进行相应操作。本提示信息为非打印信息,可一直保留,不影响打印。摘 要数字人体模型(DHMs)领域内的研究,对于在工作中防止可能的危险,优化工作内容等是至关重要的,同时,在计算机视觉与图形学交叉领域的研究中, 人体运动建模也是一个经典问题,其应用领域包括人机交互、运动同步、虚拟和增强再现的运动预测等。虽然在该领域内,有很多的技术正在不断成熟,但是发展空间还是非常大的,尤其是近些年来发展很快的运动预测问题。近年来,计算机视觉领域研究中将深度学习算法引入,越来越多的研究开始来使用循环神经网络(RNNs)来模拟人的
2、运动,其目标是学习具有时间依赖性的表征,执行短期运动预测和长期人体运动合成等任务。本文通过查阅相关资料、论文,了解了目前最先进的算法中所使用的架构、损失函数和训练过程,研究了并分析了最新的RNN算法在运动预测方面的应用。本文采用了一种经优化的RNN算法,该算法对通常用于人体运动的标准RNN模型进行三处修改,从而得到一个简单的、可伸缩的RNN架构,该架构可以获得极其优秀的人体运动预测性能。总的来说,本文研究的内容是循环神经网络(RNN)在数字人运动预测的计算方面的应用。具体来说,本文采用的是RNN循环神经网络的优化算法,LSTM长短期记忆网络,并且是基于MXNet深度学习框架搭建的,通过使用公用
3、人体运动捕捉数据集来训练算法模型。同时采用诺亦腾(Noitom)公司的Perception Neuron动作捕捉设备采集自己的人体运动数据,输入预测算法模型,得到预测数据,从而验证算法的准确性。并且通过使用Unity软件,将运动数据可视化,即使用运动数据在Unity中驱动数字人运动。关键词:数字人,深度学习,循环神经网络,长短期记忆网络,动作捕捉- I -Research on human motion prediction algorithmAbstractDigital Human Models(DHMs) are critical to improving design, prevent
4、ing injury, and better understanding of human behavior. Human motion modeling is a classic problem at the intersection of graphics and computer vision, and its applications include human-computer interaction, motion synchronization, and virtual and augmented motion prediction.While many capabilities
5、 in this field are maturing, there are still opportunities for improvement, particularly in the area of motion prediction.With the success of deep learning methods in some computer vision tasks, recent work has focused on the use of deep recurrent neural networks (RNN) to simulate human motion. Lear
6、ning time-dependent representations and perform tasks such as short-term motion prediction and long-term human motion synthesis is the main goal. This paper examined and analyzed the most recent RNN methods by looking at the architecture, loss functions, and training processes used in the most advan
7、ced methods.This paper uses an optimized RNN algorithm that makes three modifications to the standard RNN model commonly used for human motion to produce a simple, scalable RNN architecture that achieves the most advanced performance in predicting human motion. In general, this paper studies the use
8、 of artificial neural networks (ANN), especially recurrent neural networks (RNN), to provide real-time computation of DHM motion prediction.This paper adopts the optimization algorithm of RNN recurrent neural network, LSTM long-term and short-term memory network, and builds the algorithm model based
9、 on MXNet deep learning framework by using the common human motion capture data set.At the same time, Noitoms Perception Neuron motion capture device is used to collect its own human movement data, input the prediction algorithm model, and obtain the prediction data, so as to verify the accuracy of
10、the algorithm.And through the use of Unity software, the movement data will be visualized, that is, using the movement data to drive the movement of digital human in Unity.Key Words:Digital Human Models, Deep Learning, RNN,LSTM, Motion Capture- III -本页为“7毕业论文目录(1页或若干页)”,点击菜单“USTB本科论文各部分”中的本部分菜单进行相应操
11、作。本提示信息为非打印信息,可一直保留,不影响打印。北京科技大学本科生毕业设计(论文)目 录摘 要IAbstractIII1 绪 论11.1 引言11.2 课题背景及意义11.3 国内外研究现况21.4 论文主要研究内容与安排31.4.1 主要研究内容31.4.2 本文组织安排32 人体运动数据捕捉与处理42.1 相关理论基础与工具平台42.1.1 动作捕捉技术的种类42.1.2 人体运动数据的采集92.1.3 BVH文件102.2 诺亦腾设备112.2.1 动作捕捉设备介绍112.2.2 Axis Neron软件112.3 动作捕捉123 基于神经网络的人体运动预测算法143.1 RNN循环
12、神经网络143.2 LSTM长短期记忆网络与GRU163.3 基于MXNet深度学习框架的人体运动预测算法173.3.1 Apache MXNet深度学习框架173.3.2 LSTM模型的搭建183.3.3 训练集与测试集193.3.4 算法有效性的验证204 Unity224.1 Unity介绍224.2 MotionBuilder软件244.3 数字人建模264.4 Fbx文件在Unity中驱动数字人运动275 总结30参考文献33附录A程序代码35在学取得成果41致 谢43- VI -北京科技大学本科生毕业设计(论文)绪 论引言人体仿真领域的研究已为诸多领域带来了质量、时间和成本管理方面
13、的巨大进步,例如军事、体育设备以及汽车领域。但是,领域内迫切需要能够实时运行的人体仿真模型,特别是那些大规模数据问题,如运动预测(单个运动问题就包含了500-700个预测输出)1。课题背景及意义人体运动预测问题非常重要, 主要内容是预测一个人在未来一段时间内最有可能的动作,已知这个人在过去和当前的动作,这是一项重要且具有挑战性的任务。由于它是基于计算模拟,避免了困难、昂贵、不安全和潜在的侵入性测量的需要,以及物理实验中可能发生的相应伤害0,导致了许多领域中研究人员的重视,如基于手部运动特征的驾驶员疲劳检测Error! Reference source not found.、通过手指运动训练对老
14、年人握力提高的干预研究Error! Reference source not found.、研究通过感知手指运动创建数字语义Error! Reference source not found.,基于视觉的人手信息采集与建模Error! Reference source not found.、心理学中的生物运动建模、工业工程中的人机工程学等,具有十分重要的意义。研究人体运动预测,更多的是将其应用到人机交互中,改善人机交互的安全性,增强整体人机效能。此外,研究人体运动预测技术,在其他很多领域都具有十分重要的意义。在医学康复领域,患者在康复过程中经常会有不恰当的动作,对患者康复过程中的动作趋势进行预
15、测,与正确的康复动作进行对比分析,可以及时调整康复治疗过程,制定更加准确和有效的理疗方案;在专业体育运动领域,对运动员的动作趋势进行分析预测,可以发现动作中的错误并及时纠正分析制定合适的训练计划。在未来社会,人类同机器人的交流与协作将日益频繁,作为连接人与机器人交流渠道的人机交互技术必将会承担起至关重要的任务。社会需求和机器人技术、智能控制和机器学习的发展推动着机器人走进我们的日常生活。依靠人的感知能力和机器人执行能力的互补优势,人与机器人协同完成各种任务。物理人机交互发生在人类机器人协作任务中,如神经康复、物体运输等。随着服务机器人被期望在人类生活环境中执行任务,工业机器人被期望与人类共同协
16、作完成任务,越来越多的研究者对于人是如何移动的表示出越来越多的关注。为了让机器人更有效地与人协作,常常需要近距离的物理交互,因此,需要开发技术和方法来支持安全、有效的物理人机交互。只有深入了解人的运动机制并预测人的运动,才能设计出安全有效的人机交互技术。国内外研究现况人类有一种非凡的能力,可以基于之前的事件对周围的世界做出精确的短期预测,预测其他人类的运动是这些预测的一个重要方面。神经科学研究人员通过人脑神经网络结构分析人类的运动和行为7。人脑是一个高度灵活的计算系统,因为一个人的能量和资源是有限的,所以在做出动作之前,大脑总是会分析未来可能的动作。它可以预测未来的结果,并在不可能达到预期结果
17、的情况下改变运动。科学家证明,人类的运动是可以预测的。这些研究工作为人体运动预测在其他领域的应用奠定了理论基础。机器人如何探测人类试图,从而了解人类正在做的事情,是一个非常大的挑战。如果机器人不知道人类的运动意图,它们在工作中,就又可能会成为人类的额外负荷。相反,如果机器人知道人类的运动意图,机器人可以主动主动地移动,人类引导机器人的花费精力就会减少,从而提高工作效率。8因此,如何估计人类的运动意图,即人体运动预测,一直是研究人员关注的问题。由B. Corteville等人发现9,对人的运动意图进行估计,使机器人能够跟随人完成快速的点对点任务。M.S. Erden等人在没有力传感器的情况下,通
18、过控制力的变化来获得对人体运动意图的估计10。J. Huang等人定义了意图到达方向,用于在外骨骼中实时描述人的上肢运动意图11。在12中,提出了一种全向行走机器人的行走意图估计方法。人类运动意图在文献中有不同的定义。在13中,人体运动意图被定义为人体的当前位置,通过多模态界面提供反馈。在14中,人体运动意图被定义为目标位置或时变期望轨迹,由在线神经网络(NNs)基于可获得的感知信息进行估计。如何使机器人根据环境的阻抗15或人的阻抗16来调整其所需的阻抗也是中的一个关键问题。在17中,作者提出了一种阻抗学习方法,使机器人能够与未知环境进行交互,以避免较大的交互力。一种名为GAN-Poser的基
19、于generatordiscriminator框架的方法被用于在输入三维人体骨架序列后预测人体运动。具体地说,与传统的Euclidean loss相比,frame-wise geodesic loss被用于几何意义上更精确的距离测量。在这篇论文中,使用了一个双向GAN框架和一个递归预测策略来避免模式崩溃和进一步规范化训练。为了能够在给定起始序列的条件下生成多个可能的人体姿态序列,还引入了一个随机外部因子H。对鉴别器进行训练,使其回归到外部因子H,并与内部因子(编码的起始位姿序列)一起生成特定的位姿序列。尽管在概率框架中,改进的鉴别器结构允许预测位姿序列的中间部分,作为预测序列的后半部分的条件。
20、这种基于对抗性学习的模型考虑了随机性,双向建立的模型为评价给定测试序列的预测质量提供了一个新的方向。由此得到的新方法,GAN-Poser,在标准NTU-RGB-D和Human3.6 M数据集上进行评估时,取得了非常优秀的性能。论文主要研究内容与安排主要研究内容人工神经网络(Artificial Neural Network)已经成功应用于各种实际问题。虽然各种不同类型的人工神经网络为了提高性能已经进行了广泛的改进,但是每个人工神经网络设计仍然会有其自身的局限性。现有的数字人体模型已经足够成熟,可以为不同条件下的不同任务和方案提供精确与有用的结果。但是,目前非常需要使这些模型实时运行,尤其是那些
21、有较大运算量的大规模问题,如运动预测。然而,即使是非常小的条件的改变,运动仿真就需要运行相对较长的时间(几分钟到几十分钟)。因此,由于运算时间以及收集训练数据所耗费的成本,训练案例的数量十分有限。另外,运动问题就输出数量而言相对较大,仅仅是预测单个问题就有数百个输出(在500-700个输出之间)。因此,在运动问题中使用了诸如人工神经网络之类的工具。本文组织安排 本文采取了诺亦腾(Noitom)公司研发Perception Neuron动作捕捉设备来采集人体运动数据。然后基于MXNet深度学习框架下搭建了RNN(Recurrent Neural Networks)循环神经网络的优化算法,LSTM
22、(Long Short Term Memory)长短期记忆网络,并通过公用人体动作捕捉数据集来训练模型,最终达到了较为理想的结果。然后用自己通过Perception Neuron动作捕捉设备采集的运动数据测试验证预测的准确性。最终,采用Unity软件,使用源运动数据与预测生成运动数据分别驱动两个数字人运动,即将结果可视化。人体运动数据捕捉与处理在进行人体运动预测模型搭建之前,一项重要的工作就是相关数据的采集与处理。一组正确的优质的数据是完成预测网络有效训练的前提和基础。本章分别对比了不同的动捕技术的优缺点,确定了捕捉人体运动的设备,论述了采集数据的原理与流程。相关理论基础与工具平台随着世界科学
23、技术的发展,来自世界各地的研究人员的运动越来越重视动作捕捉技术。世界各地的实验室在其广泛的应用领域投入了大量资源,加快这个行业的发展。之后经过几十年的不断发展,在灵敏度和精密度方面都取得了很大的进步实现。动作捕捉技术的种类目前有很多种不同的动作捕获系统,一般而言,根据技术原则,可以区分五大类:机械、声学、电磁、惯性传感器和根据不同类型的目标特性可以分为两大类:标记点和无标记点式的光学式。近年来,在市场上出现了所谓的热运动捕获系统,这基本上是无标记光学运动捕获的一部分。光学成像传感器主要在近红外或红外波段中工作。机械式一般情况下,该类运动捕捉系统系统由几个关节和刚性连接杆组成,其中角度传感器存在
24、于可以旋转的关节中,用于测量关节角度的变化,总的来说,是基于机械装置来跟踪运动和测量运动的路径的。如果设备移动,目标对象必须每个身体部位都有一系列的刚性支撑固定。如果目标移动,身上的刚性支架一起移动,目标各部位的角度变化会由支架上的传感器测得,刚性杆的位置和运动路径可以由角度变化和杆的长度得出。该类产品在成本、精度和采样频率方面具有很高的优势。但是,最大的缺点是缺乏操作方便和灵活性。连杆结构和检测电缆对艺术家的行动施加了很大的限制和限制,特别是在连贯性运动被阻断的情况下,这使得真正的动态运动不做变得难以完成。代表产品有 Gypsy 6 Motion Capture System。图2-1 Gy
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 人体 运动 预测 算法 研究
限制150内