2023年中国人工智能行业概览-头豹-2023-WN6.pdf
-
资源ID:95793392
资源大小:2.85MB
全文页数:33页
- 资源格式: PDF
下载积分:15金币
快捷下载
![游客一键下载](/images/hot.gif)
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2023年中国人工智能行业概览-头豹-2023-WN6.pdf
12023LeadL400-072-55882023年年中国人工智能行业概览中国人工智能行业概览Overview of Chinas Artificial Intelligence Industry in 20232023年中国人工知能業界概要年中国人工知能業界概要报告提供的任何内容报告提供的任何内容(包括但不限于数据包括但不限于数据、文字文字、图表图表、图像等图像等)均系均系头豹研究院独有的高度机密性文件头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外在报告中另行标明出处者除外)。未经头豹研究院事先书面许可未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制任何人不得以任何方式擅自复制、再造再造、传播传播、出版出版、引用引用、改编改编、汇编本报告内容汇编本报告内容,若有违反上述约定的行若有违反上述约定的行为发生为发生,头豹研究院保留采取法律措施头豹研究院保留采取法律措施,追究相关人员责任的权利追究相关人员责任的权利。头头豹研究院开展的所有商业活动均使用豹研究院开展的所有商业活动均使用“头豹研究院头豹研究院”或或“头豹头豹”的商号的商号、商标商标,头豹研究院无任何前述名称之外的其他分支机构头豹研究院无任何前述名称之外的其他分支机构,也未授权或也未授权或聘用其他任何第三方代表头豹研究院开展商业活动聘用其他任何第三方代表头豹研究院开展商业活动。2023/报告报告标签:标签:人工智能、工业质检、自动驾驶、人工智能、工业质检、自动驾驶、MLOps、AutoML、博瀚智能、博瀚智能2人工智能行业现处于核心硬件发展阶段,数据、算力、算法是三大核心发展要素,推动着人工智能的技术迭代和商业化落地。中国人工智能企业处于发展初期,大多数企业对于人工智能的发展主要以框架搭建和应用解决方案为主,在打造高质量产品和降低成本方面持续创新。政策环境的优化,也将助力 AI 产业高速发展。中国人工智能行业发展势头强劲中国人工智能行业发展势头强劲,赋能千行百业赋能千行百业01对比以模型为中心的 AutoML,以数据为中心的 MLOps 具有把数据的质量和数量置于主要位置的特点,能提供更有优势的解决方案,使组织规模化、高质量、高效率、可持续地生产机器学习模型,有效缓解 AI 生产过程的管理问题,提升 AI生产的转化效率。目前,MLOps 行业应用稳步推进,落地实践成果颇丰。02近年来,中国人工智能开发平台市场规模持续增长。在应用场景端,传统 AI 模型痛点突出,亟待人工智能协助转型,中国制造业人工智能解决方案的市场规模呈现快速增长态势。AI 与各产业深度融合,精准解决各场景痛点,未来增长潜力巨大,尤其在制造行业和交通行业,AI 的渗透率有较大增长空间。MLOps 以数据为中心的技术成为人工智能生产落地的重要推动力以数据为中心的技术成为人工智能生产落地的重要推动力03乘人工智能行业发展东风乘人工智能行业发展东风摘要摘要2023 LeadL400-072-5588近期近期 ChatGPT 的出现掀起了又一波人工智的出现掀起了又一波人工智能发展热潮能发展热潮,中国人工智能行业发展势头强中国人工智能行业发展势头强劲劲,市场规模持续上升市场规模持续上升,正逐步进入效率化正逐步进入效率化生产阶段生产阶段。MLOps 技术作为人工智能生产落技术作为人工智能生产落地的重要推动力地的重要推动力,重要性愈加凸显重要性愈加凸显。博瀚智博瀚智能作为国内私有云能作为国内私有云 AI 平台第一梯队服务商平台第一梯队服务商,采用数据闭环驱动采用数据闭环驱动+MLOps 的技术路线的技术路线,提供丰富的产品精准解决传统方案痛点提供丰富的产品精准解决传统方案痛点,赋赋能人工智能行业发展能人工智能行业发展,未来前景相当广阔未来前景相当广阔。中国人工智能行业市场规模持续上升中国人工智能行业市场规模持续上升,与各产业深度融合与各产业深度融合国内私有云国内私有云AI 平台第一梯队服务商平台第一梯队服务商博瀚智能博瀚智能04博瀚智能是业内领先的人工智能综合平台和智能化数据处理方案提供商,近几年营收增速较快,研发能力强劲,公司坚持以数据为中心的技术路线,精准解决传统方案痛点。其打造的多维度数据 AI 管理平台 AIstudio 是业内领先的轻量级私有化平台,实现用户友好的深度学习和模型快速部署,合作生态十分繁荣。32023LeadL400-072-5588名词解释名词解释-07中国人工智能行业发展概述中国人工智能行业发展概述-08 人工智能行业发展历程,AI 产业正逐步进入效率化生产阶段-09 行业规模不断扩大,市场以政府端为主带动企业端应用落地-10 AI 技术赋能各行各业,落地多种应用场景-11 落地需求为市场主要驱动力,政府的行业持续发展-12 下游行业量增驱动人工智能应用,需求有望较大提升-13 政策环境持续优化,助力AI 产业创新发展-14MLOps 技术成为人工智能生产落地重要推动力技术成为人工智能生产落地重要推动力-15 数据为中心的技术路径潜力较大,将成未来发展趋势-16 以数据为中心的 MLOps 提供优质解决方案,助力组织保障生产质量-17 AutoML优势与痛点并存,整体表现逊于 MLOps-18 MLOps 有效缓解AI 生产过程管理问题,提升AI 生产转化率-19 MLOps 工具不断创新,落地实践成果颇丰-20中国人工智能行业市场规模持续上升,与各产业深度融合中国人工智能行业市场规模持续上升,与各产业深度融合-21 传统AI 模型痛点突出,亟待人工智能协助转型-22 AI 基础设施成长迅速,资源整体效能水平不断进化-23 中国AI 行业与开发平台市场规模高速增长-24 人工智能基础数据服务众多下游场景,精准解决痛点-25目录目录CONTENTS42023LeadL400-072-5588目录目录CONTENTS国内私有云国内私有云AI 平台第一梯队服务商平台第一梯队服务商博瀚智能博瀚智能-26 企业概况:业内领先的人工智能综合平台和智能化数据处理方案提供商-27 经营情况:强劲的研发能力强劲与过硬的产品质量支持企业持续发展-28 核心业务:形态丰富、设计先进,构建全栈、可扩展的云边端平台体系-29 企业生态:深度合作业内头部企业,并拥有百余落地案例-30方法论方法论-31法律声明法律声明-32企业介绍及宣传页企业介绍及宣传页-3352023LeadL400-072-5588图表1:人工智能行业定义及特征-09图表2:2018-2022 年全球企业应用 AI 产品的平均数量-09图表3:人工智能行业落地场景-09图表4:人工智能行业发展历程-10图表5:中国人工智能技术架构-11图表6:AI 技术三大核心底层基础-12图表7:中国人工智能企业突破与创新-12图表8:AI 在各个行业的渗透情况-13图表9:2016-2022 年人工智能产业相关政策梳理-14图表10:以数据为中心将成行业发展方向-16图表11:平台对于数据驱动的AI 重要性-16图表12:AutoML 和 MLOps 技术路径对比-17图表13:数据为中心与模型为中心的不同-17图表14:AutoML的特征及痛点-18图表15:AutoML 发展历程-18图表16:MLOps 的特征及价值-19图表17:MLOps 发展历程-19图表18:以数据为中心:MLOps-20图表19:MLOps 发展现状-20图表20:MLOps 的意义和价值-20图表图表目录目录List of Figures and Tables62023LeadL400-072-5588图表21:AI 模型落地的痛点-22图表22:人工智能基础层进阶之路-23图表23:一站式基础层资源平台-23图表24:中国人工智能行业市场规模及渗透率,2021-2027E-24图表25:AI 开发平台市场规模-24图表26:人工智能应用场景-25图表27:博瀚智能公司介绍-27图表28:博瀚智能团队背景-27图表29:博瀚智能发展历程-27图表30:公司经营状况-28图表31:AI 质检解决的痛点问题-28图表32:博瀚智能的主要产品-29图表33:AIStudio:一站式 AI 开发+大数据分析平台-29图表34:博瀚智能各领域合作伙伴-30图表图表目录目录List of Figures and Tables72023LeadL400-072-5588人工智能:人工智能:Artificial Intelligence,英文缩写为 AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。DevOps:一种软件开发和运维的文化、方法和实践,旨在通过自动化、协作和跨职能团队的整合,实现更快、更可靠和更高效的软件开发、测试、部署和运维。生成式生成式AI:AI-Generated Content,人工智能生成内容,是指基于人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术,可以生成常见的如图像、文本、音频、视频等内容。ChatGPT:基于GPT-3.5架构训练的大型语言模型,由 OpenAI 开发。可以进行对话、回答问题、生成文本等任务。利用自然语言处理和机器学习技术,可以处理广泛的语言任务,包括文本分类、语义理解、文本生成、对话建模等。MLOps:通过构建和运行机器学习流水线(Pipeline),统一机器学习(ML)项目研发(Dev)和运营(Ops)过程的一种方法。目的是提高 AI 模型生产质效。AutoML:一种机器学习过程,旨在通过一系列算法和启发式方法实现从数据选择到建立模型的自动化。DataOps:一种数据运营(Data Operations)的方法论,其目的是改进和加速数据管道(Data Pipeline)的开发、测试、部署和运行,以确保数据在组织内部流动的可靠性、一致性和质量。自然语言处理:自然语言处理:Natural Language Processing(NLP),是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。算法:算法:算法是计算机专业中的一种算法,就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。基于内容的信息推荐方法的理论依据主要来自信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。算法是互联网运作的基础,是大数据、人工智能、云计算等一切网络活动的内部规则,是电子商务、信息传播、互动交流、游戏活动、未成年人权益保护等网络运营的起点。名词解释名词解释82023LeadL400-072-558801中国人工智能行业发展势头强劲,现处于“核心硬件发展中国人工智能行业发展势头强劲,现处于“核心硬件发展阶段”阶段”时期,应用前景广阔时期,应用前景广阔概况与特点概况与特点92023LeadL400-072-55881.1 行业概况行业概况 人工智能技术为千行百业赋能,实现各类应用场景落地,现阶段已发展成为主流趋势,人工智能技术为千行百业赋能,实现各类应用场景落地,现阶段已发展成为主流趋势,AI 技术商业价值不断技术商业价值不断增长,产品形态和应用边界也在持续拓宽。增长,产品形态和应用边界也在持续拓宽。1.92.33.13.93.8201820192020202120222018-2022 年全球企业应用年全球企业应用AI 产品的平均数量产品的平均数量 企业应用企业应用 AI 技术比重持续提升技术比重持续提升,AI 技技术商业价值不断增长术商业价值不断增长。据调查,2017年企业应用 AI 技术比重约占 20%,2022 年企业至少在一个业务领域采用AI 技术比率增至 50%。2018 年应用 AI产品平均仅 1.9 个,2022 年增至 3.8 个。应用数量提升以外,AI 商业价值不断增长,企业部署AI 动力显著。机器人流程自动化机器人流程自动化(RPA)和计算机视和计算机视觉是人工智能领域每年最常用的技术觉是人工智能领域每年最常用的技术,自然语言文本理解已经从 2018 年的中间位置上升到仅次于计算机视觉的第三位。算力算力算法算法数据数据人工智能基础层人工智能基础层数据基础服务与治理平台数据基础服务与治理平台智能模型敏捷开发工具智能模型敏捷开发工具智能计算集群智能计算集群发展三大要素发展三大要素来源:头豹研究院编辑整理人工智能人工智能行业定义及特征行业定义及特征人工智能定义:人工智能定义:人工智能产业是指以人工智能关键技术为核心的、由基础支撑和应用场景组成的、覆盖领域极为广阔的行业群。智能产品是指用人工智能技术赋能的产品。设计过程中需要具备较强的仿真能力和失效模式分析能力。价值性、通用性、效率化为产业发展战略方向价值性、通用性、效率化为产业发展战略方向 人工智能赋能产业发展已成为主流趋势,下游应用场景丰富。人工智能赋能产业发展已成为主流趋势,下游应用场景丰富。基于软件服务、云服务、硬件基础设施等产品形式,结合消费、制造业、互联网、金融、元宇宙与数字孪生等各类应用场景,人工智能赋能各个产业发展。人工智能的产品形态和应用边界不断拓宽人工智能的产品形态和应用边界不断拓宽;2022 年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。商业价值塑造、通用性提升和效率化应用是 AI 技术助力产业发展、社会进步和自身造血的要义。AI+农业农业AI+泛安防泛安防AI+制造制造AI+政务政务AI+教育教育AI+医疗医疗AI+互联网互联网AI+交通交通AI+能源能源人工智能人工智能行业落地场景行业落地场景102023LeadL400-072-55881.2 行业发展历程行业发展历程 人工智能行业现处于“核心硬件发展阶段,算力、数据、算法全面突破”人工智能行业现处于“核心硬件发展阶段,算力、数据、算法全面突破”时期,产业未来发展将基于大规模时期,产业未来发展将基于大规模数据识别、预测、学习和决策,逐步进入效率化生产阶段。数据识别、预测、学习和决策,逐步进入效率化生产阶段。始于 1970s,分析之后,进行智能决策;近年来才开始真正兴盛始于 1980s,起源于分析式 AI,生成新的内容;2022 年迎来突破生成式生成式 AI分析式分析式 AI人工智能人工智能行业发展历程行业发展历程规则导向规则导向机器学习机器学习深度学习深度学习自主学习自主学习1950s1980s感知机、专家系统感知机、专家系统1980s21 世纪初期世纪初期支持向量机、神经网络、决策树支持向量机、神经网络、决策树21 世纪初期至今世纪初期至今多层圣经网络模型多层圣经网络模型未来发展方向未来发展方向基于大规模数据识别、预测、学习、决策基于大规模数据识别、预测、学习、决策感知式感知式 AI运营营销决策、金融风险评估、医疗诊断等生成式生成式 AI 生成各种数据、图像、生成各种数据、图像、语音等内容后,决策式语音等内容后,决策式AI 对生对生成内容进行分析和决策,实现成内容进行分析和决策,实现更加全面和智能的应用更加全面和智能的应用 AI 产生的商业价值不断增产生的商业价值不断增长,企业部署长,企业部署AI 的动力显的动力显著。著。企业在业务领域扩大采用AI 技术,应用的AI 产品数量增加。落地AI 应用对企业业务运营的商业价值与战略意义越来越明确。人工智能的产品形态和应人工智能的产品形态和应用边界不断拓宽用边界不断拓宽;2022 年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。自然语言生成图像生成音乐生成等文本识别语音识别图像识别等理论发展理论发展硬件奠基,算法发展硬件奠基,算法发展核心硬件发展,算法突破核心硬件发展,算法突破算力、数据、算法全面突破算力、数据、算法全面突破决策式决策式 AI始于 1960s,利用逻辑推理等方法进行分析和解决;兴盛于机器学习、数字挖掘技术兴起始于 1950s,让计算机感知和理解现实世界,兴盛于计算机硬件发展与大数据出现来源:智东西、头豹研究院编辑整理2022 年年 11 月,月,ChatGPT 发布点发布点燃燃AI 浪潮。浪潮。2023 年年 3 月月 OpenAI发布发布 GPT-4,直接升级,直接升级 ChatGPT多模态能力。多模态能力。112023LeadL400-072-5588能力层能力层应用层应用层终端层终端层企业级用户政府机构用户大众消费者用户文字生成音频生成图像生成视频生成虚拟人/场景生成代码生成策略生成多模态生成政策规划政策规划基础层基础层生成式人工智能服务管理办法(意见稿)“十四五”数字经济发展规划数字中国建设整体布局规划其他企业服务零售电商传媒/影视教育/科研工业游戏医疗政务金融服务数据资源数据资源硬件设施硬件设施技术层技术层人工智能人工智能智能语音机器学习计算机视觉知识图谱自然语言理解多模态大模型多模态大模型智能文档理解视觉-语言语音-语言多模态检测与分割CVCV大模型大模型图像生成图像表征视频表征视频生成图像分类图像与物体检测语义分割因果推断NLPNLP大模型大模型语音语义理解多语言模型语言理解与生成多模态对话文本语义与图结构开放域对话信息抽取与检索代码生成和理解AIAI模型生产工具模型生产工具深度学习框架/开源模型模型训练/AI开发平台预训练大模型AIAI算力基础算力基础外部合规数据数据标注结构化数据整合第三方合规数据网络资源安全资源算力资源储存资源AI芯片云计算与云服务智能计算平台智能服务器 在人工智能相关政策规划支撑下在人工智能相关政策规划支撑下,技技术架构链条逻辑上可分为基础层术架构链条逻辑上可分为基础层、技技术层术层、能力层能力层、应用层应用层、终端层五大终端层五大板块板块。基础层:基础层:涉及硬件基础设施和数据、算力、算法模型三大核心要素。随着AI 大模型规模的不断扩大,对计算资源的需求也在增加。因此,高性能的硬件设备、海量场景数据、强大的算力基础和升级迭代的算法模型成为了支持AI 大模型发展的关键。技术层:技术层:主要涉及模型构建。目前,Transformer 架构在 AI 大模型领域占据主导地位,如 BERT、GPT 系列等。能力层能力层、应用层及终端层:应用层及终端层:在基础层和技术层的支持下,AI 大模型拥有了文字、音频、图像、视频、代码、策略、多模态生成能力等,具体应用于金融、电商、传媒、教育、游戏、医疗、工业、政务等多个领域,为企业级用户、政府机构用户、大众消费者用户提供产品和服务。中国人工智能技术架构中国人工智能技术架构1.3 行业应用场景行业应用场景 人工智能技术架构逻辑上分为基础层、技术层、能力层、应用层、终端层五大板块,其中核心技术层涵盖人工智能技术架构逻辑上分为基础层、技术层、能力层、应用层、终端层五大板块,其中核心技术层涵盖 AI 技术群和模型的融合创新,为各行业领域提供相关产品及服务。技术群和模型的融合创新,为各行业领域提供相关产品及服务。来源:CNKI,百度文心,弗若斯特沙利文,头豹研究院编辑整理122023LeadL400-072-55881.4 市场驱动因素市场驱动因素 数据、算力、算法三大核心要素推动人工智能技术迭代和商业化落地,中国人工智能企业处于发展初期,基数据、算力、算法三大核心要素推动人工智能技术迭代和商业化落地,中国人工智能企业处于发展初期,基于技术创新及成本控制等优势,中国人工智能行业将快速发展,前景广阔。于技术创新及成本控制等优势,中国人工智能行业将快速发展,前景广阔。来源:头豹研究院编辑整理中国企业具备实现中国企业具备实现 AI 的的商业化落地的商业基础商业化落地的商业基础中国人工智能企业创新能力不断提升,具备优质的工程成本控制能力,并能够结合自身业务特点和场景的理解沉淀,为下游行业提供高效智能的解决方案,帮助企业降本增效。中中国企业能够响应新型工业化建设的需求,结合具体的场景加快融合创新,目前在智慧城市、国企业能够响应新型工业化建设的需求,结合具体的场景加快融合创新,目前在智慧城市、智慧安防的落地率和普及率较高。智慧安防的落地率和普及率较高。中国企业加强中国企业加强 AI 底层基础设施的国产化突破底层基础设施的国产化突破数据数据方面,中国企业积极提高训练数据标记质量提高训练数据标记质量,提高模型的准确程度。同时,中国人工智能企业加强与政府及相关事业单位的合作加强与政府及相关事业单位的合作,取得权威的训练数据,通过数据孪生等方式解决小样本数据不足等问题。算算力力方面,政府积极支持 AI 相关硬件的国产化,华为、寒武纪、商汤科技、地平线等国内企业推出自主研发的人工智能芯片,目前整体市场对海外的人工智能芯片依赖程度略有降低。国产化算力的逐步升高国产化算力的逐步升高,能够有效支撑 AI 产业的发展。算法算法方面,国内人工智能企业在自然语言处理、智能语音、视觉计算等领域均有所突破,能够根据细分场景的痛点持续进行算法优化迭代。中国人工智能企业加大技术创新和中国人工智能企业加大技术创新和AI 布局力度布局力度 中国中国 AI 产业处于发展初期产业处于发展初期,成长速度较成长速度较快快,发展空间广阔发展空间广阔国内人工智能产业仍处于初步发展阶段初步发展阶段,大多数企业对于人工智能的发展主要以框架搭建和应用主要以框架搭建和应用解决方案为主解决方案为主。行业内领先企业专业技术能力过硬,其 AI 产品在语音语义、翻译、文字识别等方面有较大优势,能够在智慧城市、智慧交通、智慧安防等细分场景实现商业化落地。2020 年3,751 亿亿人民币人民币797 家家2019 年2205 家家中国人工智能企业数量中国人工智能企业数量2022 年人工智能整体产业规模年人工智能整体产业规模算力是算力是AI AI 的的“基建”“基建”数据是数据是 AI AI 的“燃料”的“燃料”算法是算法是 AI AI 的“引擎”的“引擎”智能交互智能交互边缘计算实时算力实时算力云计算硬件算力硬件算力本地化高精高精度训度训练集练集大数大数据语据语料库料库投喂投喂计算任务计算任务训训练练标标注注核心技术突破核心技术突破多模态认知计算多模态认知计算全息立体应用场景全息立体应用场景数数字字孪孪生生虚虚拟拟现现实实感知+交互数据数据算力算力算法算法数据、算力、算法三大核心要素推动数据、算力、算法三大核心要素推动 AI AI 技术迭代和商业化落地技术迭代和商业化落地AI 技术演化和迭代离不开数据、算力、算法三大核心底层基础技术演化和迭代离不开数据、算力、算法三大核心底层基础132023LeadL400-072-55881.5 市场发展机遇市场发展机遇 AI 广泛应用于各行各业,未来人工智能的应用需求仍有望实现较大提升,尤其在制造行业和交通行业,广泛应用于各行各业,未来人工智能的应用需求仍有望实现较大提升,尤其在制造行业和交通行业,AI 的渗透率仍有较大增长空间。的渗透率仍有较大增长空间。高高低低高高IT基础设施基础设施AI技技术术渗渗透透率率农业农业制造制造医疗医疗零售零售交通交通安防安防金融金融To C例如 ChatGPT教育教育政务政务 在制造业在制造业,中国正从低成本的玩具和服装制造中心中国正从低成本的玩具和服装制造中心,转型成为处理器转型成为处理器、芯片芯片、发动机发动机和其他高端零部件等精密制造领域的领导者和其他高端零部件等精密制造领域的领导者,人工智能有利于促进制造业从生产执行生产执行向制造创新制造创新转型,创造超过千亿美元超过千亿美元*的经济价值,其中 1,000 亿美元来自于流程设流程设计研发计研发,利用数字孪生和机器学习模拟、测试和验证生产流程的结果,150 亿美元来自于产品研发产品研发,验证新产品设计,快速预测设计结果制造行业制造行业 2021 年中国制造业增加值高达制造业增加值高达 4.87 万亿美元万亿美元,占全球的 29.8%,已连续 13 年居世界首位。从 2021 年到 2026 年,中国制造业 IT 市场投资规模将从 7,841.12 亿元人民币增长至 1.586 万亿元,将成为全球主要经济体中制造业制造业 IT 支出增长速度最高的国家支出增长速度最高的国家交通行业交通行业 2022 年中国新能源汽车产销分别完成了 705.8 万辆和万辆和 688.7 万辆万辆,同比增长了96.9%和 93.4%,连续 8 年保持全球第一;新能源汽车新车的销量占汽车新车总销量的 25.6%新能源车的持续渗透新能源车的持续渗透为人工智能在交通领域的渗透的占提供了一片沃土,人工智能有望创造超过创造超过 3,800 亿美元的经济价值亿美元的经济价值,主要来自于三个方面:自动驾驶自动驾驶(3,350 亿)、智能座舱智能座舱(300 亿美元)、运行管理优化运行管理优化(150 亿美元)AI 在各个行业的渗透情况在各个行业的渗透情况来源:麦肯锡、头豹研究院编辑整理142023LeadL400-072-55881.6 行业相关政策分析行业相关政策分析 政策环境持续优化,助力政策环境持续优化,助力 AI 行业高速发展。从“十二五”到“十四五”规划,国家从宏观层面上对人工智能行业高速发展。从“十二五”到“十四五”规划,国家从宏观层面上对人工智能新技术、新产业给予巨大支持,顶层设计从方向性引导到强调落地应用与场景创新。新技术、新产业给予巨大支持,顶层设计从方向性引导到强调落地应用与场景创新。发布时间发布时间政策名称政策名称主要内容主要内容2022 年年 12 月月关于规范和加强人工智能司法应用的意见到 2025 年,基本建成较为完备的司法人工智能技术应用体系,为司法为民、公正司法提供全方位智能辅助支持。到 2030 年,简称具有规则引领和应用示范效应的司法人工智能技术应用和理论体系,为司法为民、公正司法提供全流程高水平智能辅助支持,应用效能充分彰显。2022 年年 9 月月中国共产党第十九次全国代表大会十九大报告推动互联网、大数据、人工智能和实体经济深度融合,建设数字中国、智慧社会。推进数字产业化和产业数字化,推动数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。2022 年年 8 月月关于支持建设新一代人工智能示范应用场景的通知围绕构建全链条、全过程的人工智能行业应用生态,支持一批基础较好的人工智能应用场景,加强研发上下游配合与新技术继承,打造形成一批可复制、可推广的标杆型示范应用场景。2022 年年 7 月月关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见强化主题培育,加大应用示范,创新体制机制、完善场景生态,探索人工智能发展新模式新路径。以人工智能高水平应用促进经济高质量发展。2016 年年2017 年年2021 年年2018 年年2019 年年对人工智能芯片发展方向提出多项要求,并促进智能终端可穿戴设备的推广落地国务院国务院新一代人工智能发展规划新一代人工智能发展规划按照“系统布局、重点突破、协同创新、开放有席”的原则,在深入调研基础上研究提出重点发展智能传感器、神经网络芯片、开源开放平台等关键环节,夯实人工智能产业发展的软硬件基础。工信部工信部关于促进新一代人工智能产关于促进新一代人工智能产业发展三年行动计划业发展三年行动计划发改委发改委互联网互联网+”人工智能人工智能三年行动实施方案三年行动实施方案重点突破高效能、可重构类脑计算芯片和具有计算机成像功能的类脑视觉传感器技术,研发具有学习能力的高效能类脑神经网络架构和硬件系统,实现具有多媒体感知信息理解和智能增长、尝试推理能力的类脑智能系统。把握新一代人工智能的发展特点,结合不同行业,不同区域特点,探索创新成果应用转化的路径和方法,构建数据驱动、人机协同、跨界融合的智能经济形态。中央全面深化改革委员会第中央全面深化改革委员会第七次会议七次会议关于促进人工智能和实体关于促进人工智能和实体经济深度融合的指导意见经济深度融合的指导意见新一代人工智能产业将着重构建开源算法平台,并在学习推理与决策、图像图形等重点领域进行创新,聚焦高端芯片等关键领域。十三届全国人大四次会议十三届全国人大四次会议“十四五”规划纲要和十四五”规划纲要和2035 远景目标纲要远景目标纲要来源:国务院、工信部、发改委、头豹研究院编辑整理2016-2022 年人工智能产业相关政策梳理年人工智能产业相关政策梳理152023LeadL400-072-558802MLOps 以数据为中心的技术路线是人工智能生产落地的以数据为中心的技术路线是人工智能生产落地的重要推动力,为行业缔造更多商业价值重要推动力,为行业缔造更多商业价值技术与应用技术与应用162023LeadL400-072-55882.1 数据为中心的技术路径潜力较大数据为中心的技术路径潜力较大 以数据为中心的以数据为中心的 AI 提高性能,降低成本,发展潜力巨大。而模型驱动的提高性能,降低成本,发展潜力巨大。而模型驱动的 AI 应用资源要求高,无法有效助力应用资源要求高,无法有效助力AI落地。平台为数据驱动的落地。平台为数据驱动的 AI 提供了一个统一、集成的环境,简化任务,降本增效作用显著。提供了一个统一、集成的环境,简化任务,降本增效作用显著。以数据为中心的以数据为中心的AI拥有巨大的能量和潜力。拥有巨大的能量和潜力。2022年,吴恩达在接受 IEEE Spectrum 采访时表示,模型为中心无法有效助力模型为中心无法有效助力AI落地。落地。过去十年人工智能最大的转变是向深度学习转变,此后十年将向以数据为中心转百年。随着神经网络架构的成熟,许多实际应用的瓶颈将成为“如何获取、开发所需要的数据”。同时,基于平台的解决方案是目前的一大需求和趋势。模型驱动的 AI 通常涉及具有大量参数的复杂模型复杂模型。训练和部署这些模型需要大量的计算能力大量的计算能力,导致硬件和基础设硬件和基础设施的成本较高施的成本较高。模型驱动的 AI 中复杂模型的训练需要时需要时间长间长,特别是深度学习模型。延长训练时间增加了对计算资源增加了对计算资源的需求的需求,从而导致成成本提高本提高。模型驱动的 AI 中的模型通常更复杂模型通常更复杂,因此为应对不断变化的需求,使用新数据更新或修改需要大量资需要大量资源源,导致更高的成本更高的成本和更长的开发周期和更长的开发周期。以数据为中心将成行业发展方向以数据为中心将成行业发展方向以模型为中心的以模型为中心的 AI 应用痛点:资源应用痛点:资源、成本、成本要求高等要求高等复杂性复杂性训练时间训练时间模型更新模型更新可解释可解释/理解性理解性模型驱动的 AI 中的复杂模型通常较难解模型通常较难解释和理解释和理解,这可能需需要额外的资源要额外的资源来开发工具和技术以提高透提高透明度和可信度明度和可信度。提高泛化能力提高泛化能力数据驱动的 AI 强调拥有多样化、高质量的数据的重要性。数据驱动的 AI 可以提高泛化能力,并使模型在新数据上表现更好可以提高泛化能力,并使模型在新数据上表现更好。减少对模型复杂性减少对模型复杂性的依赖的依赖数据驱动的 AI 侧重于使用高质量数据来使简单模型实现相似甚至更好的性能,从而降低计算和资源需求降低计算和资源需求。更容易进行微调更容易进行微调数据驱动的 AI 使通过扩充或优化用于训练的数据来微调模型更容易。无需大幅修改模型架构或重新训练模型即可提高特定任务性能。对抗性攻击的鲁棒对抗性攻击的鲁棒性性通过使用多样化的数据集,数据驱动的 AI 协助模型抵抗对抗性攻击。高质量数据训练的模型难以被输入欺骗难以被输入欺骗。迁移学习迁移学习数据驱动的 AI 鼓励迁移学习,在大型数据集预训练的模型为较小的特定任务数据集微调。拥有缩短训练时间并提高性能的优势拥有缩短训练时间并提高性能的优势。以数据为中心的以数据为中心的 AI 应用优势显著应用优势显著平台对于数据驱动的平台对于数据驱动的AI 重要性重要性提供提供统一、集成的统一、集成的环境环境简化简化AI 生命周期中的生命周期中的任务任务确保数据确保数据和模型的高效和模型的高效管理管理提高数据提高数据科学家、工程科学家、工程师等的生产力师等的生产力和效果和效果集中的数据集中的数据管理管理可拓展性可拓展性协作协作工作流自动工作流自动化化监控和维护监控和维护集成集成实验跟踪和实验跟踪和可重复性可重复性为存储、访问和管理数据提供集中位置。有助于实现数据的一致高效处理,使团队能够使用高质量的数据集进行训练和评估。有助于管理数据驱动AI 解决方案的可扩展性。允许用户扩展数据处理、存储和计算资源,确保处理大数据量和复杂模型。提供简化通信、共享见解和共同处理数据和模型的工具和功能,促进成功实施数据驱动AI 解决方案所必需的协作环境。平台可以自动化数据驱动AI 生命周期中的各种任务。有助于节省时间、减少错误并确保始终遵循最佳实践。平台提供用于监控模型性能、数据质量等相关指标的工具。使团队能够快速发现和解决问题,确保 AI 系统继续提供最佳结果。平台可以与组织使用的其他工具、系统和基础设施集成,简化将AI 解决方案纳入现有工作流程和流程的过程。平台可以帮助跟踪实验、管理模型版本并确保结果的可重复性。有助于比较不同模型技术、选择针对最佳方法和遵守法规要求。来源:中国信通院、头豹研究院编辑整理172023LeadL400-072-55882.2 人工智能技术路径人工智能技术路径 对比以模型为中心的对比以模型为中心的 AutoML,以数据为中心的,以数据为中心的 MLOps 将数据的质量和数量置于主要位置,能提供更加有优将数据的质量和数量置于主要位置,能提供更加有优势的解决方案,助力组织建立标准化管理体系,保障模型生产质量。势的解决方案,助力组织建立标准化管理体系,保障模型生产质量。来源:中国信通院、头豹研究院编辑整理方法方法涉及过程涉及过程目标目标MLOps以数据数据为中心通常涉及数据管理、数据治理和数据工程,以确保数据的可用性、准确性和可靠性侧重于用于训练和评估侧重于用于训练和评估 ML 模型的数据模型的数据。这种方法优先考虑收集、清理和组织高质量的数据,作为建立有效的 ML 模型的基础。在这种方法中,数据被认为是 ML 模型准确性和性能的主要驱动力,数据的质量和数量被数据的质量和数量被认为比使用的具体算法或架构更关键认为比使用的具体算法或架构更关键。AutoML以模型模型为中心通常涉及优化 ML 模型架构、超参数调整和模型选择专注于建立最佳的专注于建立最佳的 ML 模型架构模型架构。这种方法优先考虑寻找最佳算法或神经网络架构来解决手头的问题,而数据被视为模型设计的次要因素。在这种方法中,模型的准确性和性能被认为比用于训练它的数据的质量或数量更关键。数据为中心与模型为中心的不同数据为中心与模型为中心的不同AutoML 和和 MLOps 技术路径对比技术路径对比需求分析与开发需求/问题 提出可行性分析 技术选型数据&算法 设计方案算法/数据脚本/服务开发数据工程流水线数据接入数据探索数据处理特征工程模型试验流水线数据分析模型训练模型评估模型导出DevOps代码仓扫描-翻译-测试-打包发布持续集成流水线触发 CI 流水线(代码+数据+模型持续集成)数据处理持续训练流水线模型(重)训练模型评估持续部署流水线模型部署流量管理效果评估模型仓库持续监控流水线操作记录流水线监控模型监控数据监控资源监控 MLOpsAutoML数据准备特征工程模型生成模型评估 AutoML 发展路径上仍存在部分难点需要解决。发展路径上仍存在部分难点需要解决。自动机器学习,也称为 AutoML,是基于架构、数据和超参数自动化找到理想模型配置的过程。AutoML 是一种更是一种更高级的模型优化方法,但并不总是适用。高级的模型优化方法,但并不总是适用。首先,AutoML 仍需要大量算力仍需要大量算力,因此企业仍需要在研发过程中尝试更多的解决方案;其次,AutoML 在提升处理复杂度的同时,仍需保持一定的透明度,以允许模型