2022年人工智能的核心技术.docx
《2022年人工智能的核心技术.docx》由会员分享,可在线阅读,更多相关《2022年人工智能的核心技术.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品学习资源人工智能的核心技术是什么?人工智能标准化白皮书20211 机器学习机器学习 Machine Learning 是一门涉及统计学、系统辨识、靠近理论、神经网络、优化理论、电脑科学、脑科学等诸多领域的交叉学科,讨论电脑怎样模拟或实现人类的学习行为,以猎取新的学问或技能,重新组织已有的学问结构使之不断改善自身的性能,是人工 智能技术的核心;基于数据的机器学习是现代智能技术中的重要方法之一,讨论从观测数 据样本动身查找规律,利用这些规律对将来数据或无法观测的数据进行猜测;依据学习模式、学习方法以及算法的不同,机器学习存在不同的分类方法;1依据学习模式将机器学习分类为监督学习、无监督学习和强
2、化学习等;监督学习监督学习是利用已标记的有限训练数据集,通过某种学习策略/ 方法建立一 个模型, 实现对新数据 / 实例的标记分类/ 映射,最典型的监督学习算法包括回来和分类;监督学习要 求训练样本的分类标签已知,分类标签精确度越高,样本越具有代表性,学习模型的精确 度越高;监督学习在自然语言处理、信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等 领域获得了广泛应用;无监督学习无监督学习是利用无标记的有限数据描述隐匿在未标记数据中的结构/ 规律, 最典型的非监督学习算法包括单类密度估量、单类数据降维、聚类等;无监督学习不需要训练样本和人工标注数据,便于压缩数据储备、削减运算量、提升算法速度,仍可
3、以防止正、负样本偏 移引起的分类错误问题;主要用于经济猜测、异常检测、数据挖掘、图像处理、模式识别 等领域,例如组织大型电脑集群、社交网络分析、市场分割、天文数据分析等;强化学习强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大;由于外部环境供应的信息很少,强化学习系统必需靠自身的经受进行学习;强化学习的目标是学习从环境状态到行为的映射,使得智能体挑选的行为能够获得环境最大的奖赏,使得外部环境对 学习系统在某种意义下的评判为最正确;其在机器人掌握、无人驾驶、下棋、工业掌握等 领域获得胜利应用;2依据学习方法可以将机器学习分为传统机器学习和深度学习;传统机器学习传统机器学习从一些观
4、测训练样本动身,试图发觉不能通过原理分析获得的规律,实现对将来数据行为或趋势的精确猜测;相关算法包括规律回来、隐马尔科夫方法、支持向欢迎下载精品学习资源量机方法、 K 近邻方法、三层人工神经网络方法、Adaboost算法、贝叶斯方法以及决策树方法等;传统机器学习平稳了学习结果的有效性与学习模型的可说明性,为解决有限样本的学习问题供应了一种框架,主要用于有限样本情形下的模式分类、回来分析、概率密度估量等;传统机器学习方法共同的重要理论基础之一是统计学,在自然语言处理、语音识 别、图像识别、信息检索和生物信息等很多电脑领域获得了广泛应用;深度学习深度学习是建立深层结构模型的学习方法,典型的深度学习
5、算法包括深度置信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等;深度学习又称为深度神经网络指层数超过 3 层的神经网络 ;深度学习作为机器学习讨论中的一个新兴领域,由Hinton等人于2006 年提出; 深度学习源于多层神经网络,其实 质是给出了一种将特点表示和学习合二为一的方式;深度学习的特点是舍弃了可说明性,单纯追求学习的有效性;经过多年的摸索尝试和讨论,已经产生了诸多深度神经网络的模型,其中卷积神经网络、循环神经网络是 两类典型的模型;卷积神经网络常被应用于空间性分布数据;循环神经网络在神经网络中 引入了记忆 和反馈,常被应用于时间性分布数据;深度学习框架是进行深度学习的基础底层 框
6、架,一般包含主流的神经网络算法模型,供应稳固的深度学习API,支持训练 模型在服务器和 GPU、TPU 间的分布式学习,部分框架仍具备在包括移动设备、云平台在内的多种平台上运行的移植才能,从而为深度学习算法带来前所未有的运行速度和有用性;目前 主 流 的 开 源 算 法 框 架 有TensorFlow 、 Caffe/Caffe2 、 CNTK、MXNet 、 Paddle-paddle 、Torch/PyTorch、Theano 等;3此外,机器学习的常见算法仍包括迁移学习、主动学习和演化学习等;迁移学习迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另一领域数据获得的关系进
7、行的学习;迁移学习可以把已训练好的模型参数迁移到新的模型指导新模型训练,可以更有效的学习底层规章、削减数据量;目前的迁移学习技术主要在变量有限的小 规模应用中使用,如基于传感器网络的定位,文字分类和图像分类等;将来迁移学习将被 广泛应用于解决更有挑战性的问题,如视频分类、社交网络分析、规律推理等;主动学习主动学习通过肯定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到的样本训练分类模型来提高模型的精度;主动学习能够挑选性地获取学问,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性准就和差异性准就选取有效的样 本;演化学习演化学习对优化问题性质要求极少,只需能够评估解
8、的好坏即可,适用于求解复杂的优化问题,也能直接用于多目标优化;演化算法包括粒子群优化算法、多目标演化算法等;目前针对演化学习的讨论主要集中在演化数据聚类、对演化数据更有效的分类,以及供应某欢迎下载精品学习资源种自适应机制以确定演化机制的影响等;2 学问图谱学问图谱本质上是结构化的语义学问库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是 “实体 关系实体” 三元组, 以及实体及其相关“属性值”对;不同实体之间通过关系相互联结,构成网状的学问结 构;在学问图谱中, 每个节点表示现实世界的“实体”,每条边为实体与实体之间的 “关系”;通俗地讲, 学问
9、图谱就是把全部不同种类的信息连接在一起而得到的一个关系网络,供应了从“关系”的角度去分析问题的才能;学问图谱可用于反欺诈、不一样性验证、组团欺诈等公共安全保证领域,需要用到反常分析、静态分析、动态分析等数据挖掘方法;特殊地,学问图谱在搜索引擎、可视化展现和精准营销方面有很大的优势,已成为业界的热门工具;但是,学问图谱的进展仍有很大的 挑战,如数据的噪声问题,即数据本身有错误或者数据存在冗余;随着学问图谱应用的不 断深化,仍有一系列关键技术需要突破;3 自然语言处理自然语言处理是电脑科学领域与人工智能领域中的一个重要方向,讨论能实现人与电脑之间用自然语言进行有效通信的各种理论和方法,涉及的领域较
10、多,主要包括机器翻译、机器阅读懂得和问答系统等;1机器翻译机器翻译技术是指利用电脑技术实现从一种自然语言到另外一种自然语言的翻译过程;基于统计的机器翻译方法突破了之前基于规章和实例翻译方法的局限性,翻译性能取得巨大提升;基于深度神经网络的机器翻译在日常口语等一些场景的胜利应用已经显现出了巨大 的潜力;随着上下文的语境表征和学问规律推理才能的进展, 自然语言学问图谱不断扩充, 机器翻译将会在多轮对话翻译及篇章翻译等领域取得更大进展;目前非限定领域机器翻译中性能较佳的一种是统计机器翻译,包括训练及解码两个阶段;训练阶段的目标是获得模型参数,解码阶段的目标是利用所估量的参数和给定的优化目标, 猎取待
11、翻译语句的最正确翻译结果;统计机器翻译主要包括语料预处理、词对齐、短语抽 取、短语概率运算、最大熵调序等步骤;基于神经网络的端到端翻译方法不需要针对双语 句子特地设计特点模型,而是直接把源语言句子的词串送入神经网络模型,经过神经网络的运算,得到目标语言句子的翻译结果;在基于端到端的机器翻译系统中,通常采纳递归神经网络或卷积神经网络对句子进行表征建模,从海量训练数据中抽取语义信息,与基于短语的统计 翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的成效;2语义懂得语义懂得技术是指利用电脑技术实现对文本篇章的懂得,并且答复与篇章相关问题的过程;语义懂得更留意于对上下文的懂得以及对答案精准程
12、度的把控;随着 MCTest 数据集的发欢迎下载精品学习资源布,语义懂得受到更多关注,取得了快速进展,相关数据集和对应的神经网络模型层出不穷;语义懂得技术将在智能客服、产品自动问答等相关领域发挥重要作用,进一步提高问答与对话系统的精度;在数据采集方面,语义懂得通过自动构造数据方法和自动构造填空型问题的方法来有效扩充数据资源;为明白决填充型问题,一些基于深度学习的方法相继提出,如基于留意力的神经网络方法;当前主流的模型是利用神经网络技术对篇章、问题建模,对答案的开头和 终止位置进行猜测,抽取出篇章片段;对于进一步泛化的答案,处理难度进一步提升,目 前的语义懂得技术仍有较大的提升空间;3问答系统问
13、答系统分为开放领域的对话系统和特定领域的问答系统;问答系统技术是指让电脑像人类一样用自然语言与人沟通的技术;人们可以向问答系统提交用自然语言表达的问题,系统会返回关联性较高的答案;尽管问答系统目前已经有了不少应用产品显现,但大多是在 实际信息服务系统和智能助手等领域中的应用,在问答系统鲁棒性方面仍旧存在着问题 和挑战;自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不行猜测性;三是数据资源的不充分使其难以掩盖复杂的语言现象;四是语义学问的模糊性和错综复杂的关联性难以 用简洁的数学模型描述,语义运算需要参数巨大的
14、非线性运算;4 人机交互人机交互主要讨论人和电脑之间的信息交换,主要包括人到电脑和运算机到人的两部分信息交换,是人工智能领域的重要的外围技术;人机交互是与认知心理学、人机工程学、多媒体技术、 虚拟现实技术等亲密相关的综合学科;传统的人与电脑之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备, 以及打印机、 绘图仪、 显示器、 头盔式显示器、 音箱等输出设备;人机交互技术除了传统的基本交互和图形交互外,仍包括语音交互、情感交互、体感交互及脑 机交互等技术,以下对后四种与人工智能关联亲密的典型交互手段进行介绍;1语音交互语音
15、交互是一种高效的交互方式,是人以自然语音或机器合成语音同电脑进行交互的综合性技术,结合了语言学、心理学、工程和电脑技术等领域的知识;语音交互不仅要对语音识别和语音合成进行讨论,仍要对人在语音通道下的交互机理、行为方式等进行讨论;语 音交互过程包括四部分:语音采集、语音识别、语义懂得和语音合成;语音采集完成音频 的录入、采样及编码;语音识别完成语音信息到机器可识别的文本信息的转化;语义懂得依据语音识别转换后的文本字符或命令完成相应的操作;语音合成完成文本信息到声音信息的转换;作为人类沟通和猎取信息最自然便利的手段,语音交互比其他交互方式具备更多优势, 能为人机交互带来根本性变革, 是大数据和认知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 人工智能 核心技术
限制150内