《应用了AI的机器人运动控制会有着如何的变化?.docx》由会员分享,可在线阅读,更多相关《应用了AI的机器人运动控制会有着如何的变化?.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用了AI的机器人运动控制,会有着如何的变化?应用了AI的机器人运动控制,会有着如何的变化?导语:为了搞清楚VR、AI等新技术怎样在机器人控制领域应用,本文根据一些相关论文和公开资料,包括Pieter Abbeel的演讲,对VR和AI在机器人控制方面的应用进展了简单梳理,发现AI和VR等在机器人控制等方面还是有实在的应用,只不过离获得本质性打破,还有相当长的间隔 。 【应用了AI的机器人,会有着如何的变化?】复杂机器人的运动控制,一直是阻挡机器人产业开展的老大难问题,迟迟没有得到很好的解决。即便是代表机器人最高程度的波士顿动力,其机器人离实用也还远。近两年开展迅猛的AI,俨然如万金油般,被用在
2、各种地方,自然也包括机器人控制领域,而且似乎获得了不错的效果。前段时间,UCberkely的强化学习专家PieterAbbeel创办了EmbodiedIntelligence,业务更是直接涵盖了VR、AI、机器人三大热门。 为了搞清楚VR、AI等新技术怎样在机器人控制领域应用,本文根据一些相关论文和公开资料,包括PieterAbbeel的演讲,对VR和AI在机器人控制方面的应用进展了简单梳理,发现AI和VR等在机器人控制等方面还是有实在的应用,只不过离获得本质性打破,还有相当长的间隔 。 机器人控制的几种类型 很多机器人的研究目的很多是模拟人的智能,所以研究人的控制系统,对于机器人有很大的借鉴
3、意义。人体的神经系统由大脑、小脑、脑干、脊髓、神经元等共同构成,复杂而又完善。人体神经系统包括中枢神经系统和四周神经系统。中枢神经系统由脑和脊髓组成,是人体神经系统的最主体局部。四周神经系统是从脑和脊髓发出的分布到全身各处的神经。无数的神经元存在于神经系统各处,构成神经网络。 中枢神经网络负责运动控制,主要分成三层: 大脑:居于最高层,负责运动的总体筹划,各种任务的下达。 小脑:居于中间层,负责运动的协调组织和施行。人体平衡由小脑控制。 脑干和脊髓:属于最低层,负责运动的执行,详细控制肌肉的骨骼的运动,由脑干和脊髓完成。 三层对运动的调控作用不同,由高到低,低层接收高层的下行控制指令并详细实现
4、。大脑可直接也可间接的通过脑干控制脊髓运动神经。 假如把机器人与人进展类比,机械臂控制器就类似于人的脊髓,负责控制电机肌肉和机械机构骨骼的详细运动,多足机器人的运动控制器,就类似于人的小脑,负责控制平衡和协调。而机器人的操纵系统层,那么类似于人的大脑,感悟和认知世界,并下达各种复杂的运动目的。 基于以上类比,参照目前的各类机器人的情况,机器人的运动控制大概可以分成4种任务: 脊髓控制机械臂运动的根底控制。工业机器人,各类机械臂,无人机的底层运动控制等面临的主要是这类问题。 小脑控制多足机器人的平衡和运动协调控制。这块目前是机器人控制仍未打破的难点,目前做的最好的显然是波士顿动力。 脑干控制环境
5、的感悟。主要是扫地机器人、无人机等底层运动控制已经封装好的机器人的导航和途径规划。需要通过环境感悟,对自身和目的进展定位、导航和运动规划。 脊髓控制环境的认知和交互,也就是机器人详细执行交互任务,如控制机械臂抓取物体,执行操纵等。这是效劳机器人需要打破的重要问题。 几种详细控制的AI应用情况 01脊髓控制类 脊髓控制的两种典型的应用是机械臂途径规划和无人机的飞行控制。这类问题属于传统自动控制理论,以数学和动力学建模为根底,开展了很多年,已经有了非常完备的理论和理论根底,也获得了很好的效果。固然深度学习在最近很热,理论上也可以用于这类控制。但目前在这类根底控制领域,并没有应用。主要原因可能有:
6、1工业机器人高精度重复特定动作等,基于自动控制理论已经能从数学上很好的解决,且由于理解原理,属于白盒系统。既然有可靠的白盒方案,没必要换成黑盒的神经网络控制系统。 2工业机器人等应用领域,对控制算法稳定性要求很高。而作为黑盒方案的神经网络控制系统,数据上还无法证实其稳定性。神经网络控制器一旦发生问题,难以进展解释和改良。 3神经网络算法基于大量数据训练,而现有的运动控制中,比方飞控,拿到实际实验数据的本钱高,大量数据的获取非常困难。 02小脑控制类 小脑控制典型问题是类人型双足和多足机器人的平衡和运动协调控制问题。这方面一直是基于传统控制理论在进展研究,不过由于相比于机械臂或者无人机,其运动的
7、自由度高很多,难度很大。双足类人机器人给人大多数的印象还是运动缓慢、僵硬、站不稳。波士顿动力的Altas、大狗等已经是在这方面最先进的,波士顿动力学公司并未公布他们使用的技术,但谷歌工程师EricJang表示,根据从演讲得来的信息,BD的机器人控制策略使用基于模型的控制器,并不涉及神经网络相关算法。 03环境感悟类 主要的场景是效劳机器人的途径规划、无人机目的追踪、工业机器人的视觉定位等,通过感悟环境,给封装好的运动控制系统下达目的运动指令。 目的识别 环境感悟经过中的目的识别,如无人机目的的识别和追踪等,有神经网络的帮助,可以识别的更准确,已经在大疆等无人机上应用。 定位导航和途径规划 目前
8、机器人的定位导航,主要基于流行的vSLAM或者激光雷达SLAM技术。主流的激光雷达方案大概可以分三步,中间局部环节可能涉及到一些深度学习,大局部内容并不涉及深度学习相关。 第一步:SLAM,构建场景地图,用激光雷达构建场景的2D或者3D点云,或重建出3D场景。 第二步:构建语义地图,可能会对物体进展识别和分割,对场景中的物体进展标记。有的可能略过这一步 第三步:基于算法进展途径规划,并驱动机器人的运动。 04环境交互 典型应用场景:机械臂抓取目的物体等。与环境的交互,一直是传统自动控制难以解决的问题。近年来,以强化学习为根底,AI相关技术用在了这类问题上,获得了一定的研究进展,但是否是将来的主
9、流方向,仍存在很大争议。 强化学习 强化学习框架中,有一个包含神经网络的Agent负责决策。Agent以当前机器人传感器所收集到的环境为输入,输出控制机器人的行动命令action,机器人行动后,再观察新的环境状态和行动带来的结果Reward,决定下一步新的行动action。Reward根据控制目的进展设置,并有正反向之分。例如,假如以自动驾驶为目的,正向的Reward的就是到达目的地,反向就是不能到达目的地,更不好的Reward就是出车祸。然后重复这个经过,目的是最大化Reward。 强化学习的控制经过,本来就是个正向反应的控制经过,是AI用于机器人控制的根底。以此为根底,强化学习在机器人控制
10、方面出现了一些研究成果。 环境中寻找目的 16年,李飞飞组放出了一篇论文,基于深度强化学习,在以目的图像为输入的情况下,不建图去找东西。大致思路是:根据机器看到的图,决定怎么走,然后再看图,再决定新走的一步,直到找到东西。论文将目的图像作为输入,训练出来的神经网络具有通用性。 这种方式找东西更接近人的思维。训练出的控制器并没有记住物体的位置,更不知道房屋的构造。但它记住了在每一个位置,通向各个物体应该怎么走。 机器人抓取 传统的机器人学研究以为,需要非常清楚要抓取的物体的三维几何外形,分析受力位置和力的大小,再反向计算机器手怎样一步步挪动到这些位置。但这种方式抓取不规那么外形和柔性物体会很困难
11、。例如毛巾,可能需要看成一系列刚体的链接,再进展动力学建模分析,但是计算量比拟大。而小黄鸭那样的橡胶,外部并不能看出弹性程度,难以计算出需要施加的正确的力。 PieterAbbeel、DeepMind和OpenAI关于机器人控制的研究,都以此深度强化学习为根底。基于强化学习进展机器人抓取,以机器视角看到的图像为输入,以机器最终抓到物体为目的,不断对机器进展训练,进而在不建模和不做受力分析的情况下,实现对物体的抓取。PieterAbbeel已经展示过机器人叠毛巾,开瓶盖,装玩具等复杂的动作。 不过基于强化学习也仍有很多问题,如效率低、推理经过长、任务难以描绘、不能终身学习、不能最大限度从真实世界
12、获取信息等。其中一些通过meta学习,one-shot学习,迁移学习,VR示教等方法的引入得到了改善,有些那么还暂时难以解决。 05DexterityNetwork 鉴于深度强化学习的各种问题,PieterAbbeel在UCBerkeley的同事KenGoldberg,那么采用了叫做DexterityNetworkDex-Net的研究思路。首先通过传统机器人学中分析受力和建模的思路,建立一个包含大量数据的数据集,这个数据集里的每一项数据包含一个物体的模型和这个物体在不同姿态下可以被稳定抓起来的施力方式,这些施力方式是通过物体模型计算出来的。有了数据之后,用这些数据训练一个神经网络。然后给出一个
13、新物体,通过神经网络判定这个物体和数据集里哪个物体最相似,然后根据最相似的物体的数据集里包含的施力方式计算出这个新物体的最稳定施力方式。 KenGoldberg的方案的一个重要弊端,是计算量过于庞大。整个算法占用了Google云效劳器上的1500台虚拟机的计算量。此方法也让“云机器人这个概念受到了关注。 目前PieterAbbeel和KenGoldberg的两种方法还处于学术争议阶段,新的研究成果还在不断出现,也还有很多问题没有解决,尤其是稳定性和鲁棒性是各方争议的焦点。不同于语音识别音箱出了错,无非是闹个笑话,机器人系统对稳定性和可靠性的要求非常高,系统一旦出错,轻那么毁物,重那么造成人类的生命危险。PieterAbbeel也成认目前还没考虑鲁棒性和稳定性问题,似乎整体还没到达商用产品级。 总结 总体而言,以强化学习为代表,AI在机器人控制领域近两年获得了一些进展,尤其是在过去研究方法难以打破的环境交互问题方面获得了进展。但基于神经网络的控制系统,在鲁棒性等方面短期似乎难以得到解决,因此离实际应用还有很远的间隔 。在多种研究方法的共同努力下,我们也期待机器人控制问题可以早日有所打破。
限制150内