人工智能的核心技术(共8页).docx
《人工智能的核心技术(共8页).docx》由会员分享,可在线阅读,更多相关《人工智能的核心技术(共8页).docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上人工智能的核心技术是什么?人工智能标准化白皮书(2018)1 机器学习 机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、 神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机 怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识 结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是 现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用 这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及 算法的不同,机器学习存在不同的分类方法。 (1)根据学习模
2、式将机器学习分类为监督学习、无监督学习和强化学习等。 监督学习 监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一 个模型,实现对新数据/实例的标记(分类)/映射,最典型的监督学习算法包括 回归和分类。监督学习要求训练样本的分类标签已知,分类标签精确度越高,样 本越具有代表性,学习模型的准确度越高。监督学习在自然语言处理、信息检索、 文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应用。 无监督学习 无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律, 最典型的非监督学习算法包括单类密度估计、单类数据降维、聚类等。无监督学 习不需要训练样本和人工标注数据,便于
3、压缩数据存储、减少计算量、提升算法 速度,还可以避免正、负样本偏移引起的分类错误问题。主要用于经济预测、异 常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社 交网络分析、市场分割、天文数据分析等。 强化学习 强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大。 由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。强化 学习的目标是学习从环境状态到行为的映射,使得智能体选择的行为能够获得环 境最大的奖赏,使得外部环境对学习系统在某种意义下的评价为最佳。其在机器 人控制、无人驾驶、下棋、工业控制等领域获得成功应用。 (2)根据学习方法可以将机器学习
4、分为传统机器学习和深度学习。 传统机器学习 传统机器学习从一些观测(训练)样本出发,试图发现不能通过原理分析获 得的规律,实现对未来数据行为或趋势的准确预测。相关算法包括逻辑回归、隐 马尔科夫方法、支持向量机方法、K 近邻方法、三层人工神经网络方法、Adaboost 算法、贝叶斯方法以及决策树方法等。传统机器学习平衡了学习结果的有效性与 学习模型的可解释性,为解决有限样本的学习问题提供了一种框架,主要用于有 限样本情况下的模式分类、回归分析、概率密度估计等。传统机器学习方法共同 的重要理论基础之一是统计学,在自然语言处理、语音识别、图像识别、信息检 索和生物信息等许多计算机领域获得了广泛应用。
5、 深度学习 深度学习是建立深层结构模型的学习方法,典型的深度学习算法包括深度置 信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深 度神经网络(指层数超过 3 层的神经网络)。深度学习作为机器学习研究中的一 个新兴领域,由 Hinton 等人于 2006 年提出。深度学习源于多层神经网络,其实 质是给出了一种将特征表示和学习合二为一的方式。深度学习的特点是放弃了可 解释性,单纯追求学习的有效性。经过多年的摸索尝试和研究,已经产生了诸多 深度神经网络的模型,其中卷积神经网络、循环神经网络是两类典型的模型。卷 积神经网络常被应用于空间性分布数据;循环神经网络在神经网络中引入了记
6、忆 和反馈,常被应用于时间性分布数据。深度学习框架是进行深度学习的基础底层 框架,一般包含主流的神经网络算法模型,提供稳定的深度学习 API,支持训练 模型在服务器和 GPU、TPU 间的分布式学习,部分框架还具备在包括移动设备、云平台在内的多种平台上运行的移植能力,从而为深度学习算法带来前所未有的 运行速度和实用性。目前主流的开源算法框架有 TensorFlow、Caffe/Caffe2、CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。 (3)此外,机器学习的常见算法还包括迁移学习、主动学习和演化学习等。 迁移学习 迁移学习是指当在某些领域无
7、法取得足够多的数据进行模型训练时,利用另 一领域数据获得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到 新的模型指导新模型训练,可以更有效的学习底层规则、减少数据量。目前的迁 移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位,文 字分类和图像分类等。未来迁移学习将被广泛应用于解决更有挑战性的问题,如 视频分类、社交网络分析、逻辑推理等。 主动学习 主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记, 然后用查询到的样本训练分类模型来提高模型的精度。主动学习能够选择性地获 取知识,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性 准则和差异
8、性准则选取有效的样本。 演化学习 演化学习对优化问题性质要求极少,只需能够评估解的好坏即可,适用于求 解复杂的优化问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、 多目标演化算法等。目前针对演化学习的研究主要集中在演化数据聚类、对演化 数据更有效的分类,以及提供某种自适应机制以确定演化机制的影响等。 2 知识图谱 知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结 构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体 关系实体”三元组,以及实体及其相关“属性值”对。不同实体之间通过 关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界
9、的 “实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度 去分析问题的能力。 知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需 要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜 索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但 是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或 者数据存在冗余。随着知识图谱应用的不断深入,还有一系列关键技术需要突破。 3 自然语言处理 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向
10、,研究能 实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较 多,主要包括机器翻译、机器阅读理解和问答系统等。 (1)机器翻译 机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语 言的翻译过程。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的 局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一 些场景的成功应用已经显现出了巨大的潜力。随着上下文的语境表征和知识逻辑 推理能力的发展,自然语言知识图谱不断扩充,机器翻译将会在多轮对话翻译及 篇章翻译等领域取得更大进展。 目前非限定领域机器翻译中性能较佳的一种是统计机器翻译,包括训练及解
11、码两个阶段。训练阶段的目标是获得模型参数,解码阶段的目标是利用所估计的 参数和给定的优化目标,获取待翻译语句的最佳翻译结果。统计机器翻译主要包 括语料预处理、词对齐、短语抽取、短语概率计算、最大熵调序等步骤。基于神 经网络的端到端翻译方法不需要针对双语句子专门设计特征模型,而是直接把源 语言句子的词串送入神经网络模型,经过神经网络的运算,得到目标语言句子的 翻译结果。在基于端到端的机器翻译系统中,通常采用递归神经网络或卷积神经 网络对句子进行表征建模,从海量训练数据中抽取语义信息,与基于短语的统计 翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的效果。(2)语义理解 语义理解技术是指
12、利用计算机技术实现对文本篇章的理解,并且回答与篇章 相关问题的过程。语义理解更注重于对上下文的理解以及对答案精准程度的把控。 随着 MCTest 数据集的发布,语义理解受到更多关注,取得了快速发展,相关数 据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问 答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。 在数据采集方面,语义理解通过自动构造数据方法和自动构造填空型问题的 方法来有效扩充数据资源。为了解决填充型问题,一些基于深度学习的方法相继 提出,如基于注意力的神经网络方法。当前主流的模型是利用神经网络技术对篇 章、问题建模,对答案的开始和终止位置进行预测,抽取
13、出篇章片段。对于进一 步泛化的答案,处理难度进一步提升,目前的语义理解技术仍有较大的提升空间。 (3)问答系统 问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是 指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用 自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有 了不少应用产品出现,但大多是在实际信息服务系统和智能手机助手等领域中的 应用,在问答系统鲁棒性方面仍然存在着问题和挑战。 自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同 层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可 预测性;三是数
14、据资源的不充分使其难以覆盖复杂的语言现象;四是语义知识的 模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大 的非线性计算。 4 人机交互 人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算 机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、 操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术 除了传统的基本交互
15、和图形交互外,还包括语音交互、情感交互、体感交互及脑 机交互等技术,以下对后四种与人工智能关联密切的典型交互手段进行介绍。 (1)语音交互 语音交互是一种高效的交互方式,是人以自然语音或机器合成语音同计算机 进行交互的综合性技术,结合了语言学、心理学、工程和计算机技术等领域的知 识。语音交互不仅要对语音识别和语音合成进行研究,还要对人在语音通道下的 交互机理、行为方式等进行研究。语音交互过程包括四部分:语音采集、语音识 别、语义理解和语音合成。语音采集完成音频的录入、采样及编码;语音识别完 成语音信息到机器可识别的文本信息的转化;语义理解根据语音识别转换后的文 本字符或命令完成相应的操作;语音
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 核心技术
限制150内