2022年汽车行业之语音交互车端应用系列研究.docx
-
资源ID:52250108
资源大小:445.17KB
全文页数:16页
- 资源格式: DOCX
下载积分:10金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2022年汽车行业之语音交互车端应用系列研究.docx
2022年汽车行业之语音交互车端应用系列研究1.语音交互车端应用综述语音交互赋能车载智能终端,成为智能座舱生态构建的核心功能目前,语音交互功能作为汽车座舱智能化的标志性代表,与车内多种应用相结合,成为座舱生态构建的核心功能。 2011年中国首个智能汽车语音助理概念出现,可实现命令词语音识别的同时,也标志着智能语音交互应用于汽车产业的开始。 随着语音的智能化发展,语音交互在车端的应用已经度过萌生期与探索期,正处于快速发展的黄金期。语音交互链条涉及学科广泛,ASR、NLP与TTS成为车端应用关键语音交互所涉及的流程繁琐,涉及到从语言学到声学理论等多方面内容,同时在车端的使用需对特殊驾乘场景进行相应适配。 在语音交互在车端应用过程中,ASR(包含信号输入、降噪以及音素选取等流程)、NLP(包含NLU与NLG,涉及词性标注与文本信息处理)、 TTS(包含语音的后端拼接合成,同时也是语音拟人化核心环节)成为三个关键环节,同样也是当前行业发展仍需深耕的单点技术模块。行业、技术与市场等多方因素驱动,语音交互车端应用正处发展黄金期据亿欧智库预测在高级别自动驾驶功能落地前,驾驶员在驾驶过程中依然无法做到完全“解放双手”。在当前的“人机共驾”阶段,语音交互 仍然是车内最直接、最人性化、最安全的交互方式。 随着语音交互技术的成熟,语音识别准确率大幅提升,已为语音交互功能上车提供了技术验证与支持,因此智能AI科技企业开始纷纷加码语音 交互在驾乘场景当中的应用与落地。 汽车用户对于语音交互的需求与兴趣高涨,驱动主机厂在语音交互功能上的智能化与差异化发展。语音交互车端应用产业链错综复杂,供需界限趋于模糊中国语音交互车端应用产业链可分为上游:数据/语料/标注供应商、语音芯片/模块供应商、云服务及架构供应商以及车企;中游:语音处理引 擎及应用供应商、平台服务与整合供应商;以及下游车企。 随着语音交品产品智能化与差异化的发展,不同供应商之间,产品与业务也逐渐产生交集,传统自上而下的单一供应关系也逐渐转变为合作与 共建关系。车企作为产业链下游与需求方,在自研发展过程中,同样担当了供给方的角色。中国语音交互车端应用产业图谱智能语音处理引擎及应用供应商位于产业链中游,作为上游的需求方,业务范围逐渐向上延展;作为下游的供应方,合作模式逐渐向下深入。 随着产业链中游企业的业务发展向上延展与向下深入,产业链上中下游的边界趋于模糊,产业竞争结构正在发生重组。2.语音交互车端应用市场现状与典型案例语音交互车端应用市场持续增长,语音交互功能已成汽车座舱标配语音交互车端应用市场正在呈现出多元化的发展趋势,本地+云端、ASR、NLP、TTS、多元化内容及服务生态都在持续快速升级。经亿欧智库 测算,2021年中国语音交互车端应用的市场规模为22.2亿元,2022年预计可以到达25.1亿元,2019年-2022年复合增长率达到20.8%。 2021年中国新发布乘用车当中,语音交互功能在座舱内的渗透率已经位于第4位,高达86%。显然,语音交互功能已经成为中国乘用汽车座舱 内的标配功能。主机厂、智能AI科技企业与互联网科技企业合作助推市场发展随着中国语音交互车端应用市场规模的增大以及车内语音交互功能的渗透率提升,越来越多的供应商纷纷瞄准了这一存在巨大潜力的市场。 中国语音交互车端应用市场参与主体根据企业特征可以划分为三类:产业下游选择自研或半自研发展路线的主机厂,如“蔚小理”等;细分种 类繁多的智能AI科技企业,这当中专注语音交互的AI处理引擎供应商与平台服务商为主要参与主体,如科大讯飞,思必驰、博泰车联网等;具 有生态优势的互联网科技企业,如华为、腾讯、阿里、百度等。主机厂篇新势力注重产品智能化与差异化的可持续发展,传统车企追求方案性价比对于语音交互功能的理解与发展模式,造车新势力与传统车企有各自不同的考量因素与决策方向。 对于造车新势力而言语音交互产品是其打造品牌差异化的重要利器,自研框架可以帮助主机厂更灵活地定制各种不同的功能,拥有不受制于供 应商的开放能力,实现长久可持续发展;对于传统车企而言,语音交互产品的差异化与智能化并非是其吸引用户的关键因素,因此采用相对高 性价比,低投入的通用方案是其所青睐的发展方向。头部造车新势力倾向自研路线,产品智能化较传统车企存在一定优势造车新势力将语音交互功能作为其产品智能化与差异化的核心体现,因此通常会选择自研搭建智能语音技术框架,以提高智能语音助手的功能 迭代与优化的频率以及便捷性。从当前各车企语音交互功能的智能化配置来看,造车新势力的语音交互功能的智能化水平依然存在一定优势。 传统主机厂通常选择外部合作的发展模式,但头部的传统主机厂也开始逐渐发力,全双工、多音区覆盖等核心功能也已搭载上车。小鹏首创全系统功能覆盖、连续对话等多功能,优秀智能化表现成其标签小鹏在产品设计上,基于全车扬声器分布,推出的全系统功能覆盖、连续对话等多种行业首创功能为其取得行业领先地位,符合其极客定位。 对于语音交互功能的更新迭代也通过“OTA+云端”的高频迭代方式,实现用户无感情况下的语音助手优化。智能语音交互助手小P更像是用户专属的助理与朋友,通过定制装扮、多种音色选择与定制化语音暗号建立小P与客户的独有联系。之后小鹏将 继续优化提升语音交互的基础能力与语音包与应用场景的丰富度,同时也将座舱内部分语音相关的软件应用通过“软件收费”的方式进行开放。蔚来赋予NOMI具有情感的拟人化形象,助其成为“蔚来的灵魂”蔚来智能语音交互助手NOMI,源于蔚来对于语音交互体验的理解“Know me”,其集成了语音交互系统和智能情感引擎,被赋予了具有感 情的拟人化形象,使蔚来的汽车产品从机器演变成了具有生命的驾乘伙伴 。蔚来的NOMI智能语音交互助手的语音技术是在科大讯飞的支持基础上进行了个性化设计与改造。NOMI听音辨位、免打扰独立音区交互等功 能,可帮助其后排乘客进行语音交互的体验。理想智能语音交互产品“理想同学”另辟蹊径,产品定位契合车型定位理想智能语音交互助手“理想同学”的产品定位完美契合理想ONE中高端家庭用车的车型定位,以全车语音覆盖、座舱全成员平等交互权利等 特点,满足家庭出行场景的语音交互需求。 理想同学基于其产品用户画像,深耕4音区以及开拓多音区覆盖,使车内所有人员均可通过语音进行人机交互,同时也将从整车交互的角度进行 场景化的思考,贴合家庭出行用户使用习惯。传统车企亦有亮点表现,聚合力与适配力成为其打造产品力的关键因素不同于新势力的自研发展路线与产品个性化定位,传统车企通常选择合作的方式发展语音交互相关业务。 目前,部分较为开放的传统车企已经摒弃整包的一体化解决方案,而是选择接受不同供应商的服务。传统车企需要将各个领域最优秀的技术整 合在一起,完成个性化的语音产品设计,更好地赋能其提升跨垂类生态打通的灵活度。在此过程中,车企的强大的聚合能力与适配力成为核心 竞争力。智能AI科技企业篇行业巨头凭技术优势已俘获众多客户,新秀企业持性价比与定制化奋起直追AI科技类企业数量众多且竞争激烈,有已经深耕车载语音交互多年的行业巨头,也有伴随着汽车智能化发展浪潮涌现出来的行业新秀。 于科大讯飞、思必驰、云知声等行业巨头而言,其客户涵盖范围广泛,产品技术水平与业务涵盖范围是其可以占据高市占率的核心优势,但对 于众多客户而言,无法全部提供高定制化的解决方案。而对于语音交互车端应用市场的行业新秀,产品的价格优势与极具定制化的解决方案成 为吸引客户的关键因素。智能AI语音行业巨头以技术服务立足,客户需求加速其多元化发展以科大讯飞为首的AI智能语音行业巨头依托自身单点功能模块的技术优势在语音交互车端应用行业中占据优势,同时在用户需求、客户需求、 行业发展以及技术发展的驱动下逐渐从单一的智能语音技术服务商转型为全方位人工智能技术服务商。目前科大讯飞与思必驰已累积多家车企客户,而云知声则主要通过与车载应用开发商以及车企孵化的Tier0.5进行合作,间接布局语音交互车端 应用的市场。行业巨头技术差距逐渐缩小,定制化服务与性价比亦是企业关注焦点科大讯飞、思必驰与云知声三家企业作为国产AI智能语音科技公司的优秀代表,各自均有不同维度的优势。 在技术层面,通过MOS评分的方式进行多维度对比;在降噪处理、语音自然度、相似度、准确率、可懂度、种类以及可离线程度等技术维度, 科大讯飞依然存在不同程度的优势。其中,降噪处理、语音相似度、准确率以及可懂度,三家企业已无明显的技术差距。 在价格与定制化服务层面,通过行业访谈与公开资料分析,可见思必驰在价格层面具有一定优势,而云知声则通过优秀的定制化服务能力打造 业内口碑。科大讯飞算法与硬件深度融入,数据与技术成为其立足根本大讯飞自2011年发布第一代智能汽车语音助理至今,以其AI技术、软件质量、数据积累以及定制化服务能力等各方面优势取得了当前中国语 音交互车端应用行业的领先位置。 科大讯飞未来将持续深耕软硬件结合的发展模式,充分发挥其AI优势融合特殊芯片,控制成本,为低配车型提供高性价比的解决方案。同时利 用自身快速集成与开发的能力优势以满足客户快速更新需求。新秀企业来势汹汹,性价比优势与多元化发展模式为破局思路车内智能语音交互随着自动驾驶功能的发展逐渐成为刚需,行业已经进入发展黄金时期。众多车载AI智能语音新秀企业入局,其中不乏主机厂 孵化的车载语音科技公司,以及将车载场景应用作为新业务领域拓展的AI智能语音科技公司。 相较于科大讯飞这类在行业深耕多年的老玩家,新秀企业以单点功能的极致技术、性价比更高的解决方案以及更具创新的合作模式,在行业内 展露锋芒。平台服务供应商为主机厂提供解决方案,单点功能模块的集成适配成主流无论是选择自研技术框架的造车新势力,还是通过外部合作提升语音交互体验的传统主机厂,都希望可以集各家之所长,将行业内最领先的单 点功能模块搭载于自家语音交互产品当中,适配各个不同的操作系统。可以通过语音来实现全链条打通的基础平台服务商为其提供了解题思路。 对于传统主机厂而言,一个完整的研发体系与一个具有可配置能力的语音平台,可以为其提供一个更加开放、更加多样化以及更加定制化的语 音交互解决方案,软件能力不足的劣势也可以通过这类平台服务与整合供应商的产品进行弥补。互联网科技企业篇数据积累与应用生态赋能语音交互,互联网企业平台之战已开始相较于智能AI语音公司与主机厂,以BAT为首的互联网科技企业拥有更多用户数据与流量,更加了解用户习惯,同时凭借其完善的生态应用、 齐全的链条服务打入语音交互在车端的应用市场。 自2015年阿里与上汽联手孵化了车载平台斑马网络之后,百度与腾讯已陆续进行了车载智能语音业务的相关布局。车载智能语音的竞争,一方 面是由AI智能语音科技公司为参与主体的更强的大数据处理和学习能力的竞争,另一方面,随着BAT的入局,平台之战也已经开始。斑马具备产品代差优势,自研+多供应商结构提供优质服务及丰富创新斑马成立于2015年,业务布局较早。2016年开始发力语音交互产品,前期借力阿里达摩院IDST语音全线资源,自建技术框架,接入阿里部分 语音能力,2018年后为维持斑马语音持续迭代能力,引入思必驰、科大讯飞等供应商。 前期斑马语义交互产品更新以云端+OTA为主,虽然当前语音产品更新与整车OTA同步进行,但斑马语音交互产品与其他互联网科技企业已形成 代差优势,并通过T+1框架实现云端丰富且快速的语音功能创新。DuerOS语音解决方案+鸿鹄语音芯片,百度“软+硬”布局语音交互百度DuerOS智能车载解决方案,是DuerOS针对前装车机、车载导航仪、智能后视镜、行车记录仪等车载设备打造的智能语音解决方案,针对 车端语音交互解决方案上识别不准确、回复不智能、操作不方便等问题进行解决。百度同时打造的鸿鹄语音芯片是专门为车内语音交互场景设计的超低功耗远场语音交互芯片,具有远场阵列信号实时处理、高精度超低误报语 音唤醒、离线语音识别等核心能力。腾讯以智能平台语音能力为基础,微信成为其交互车端应用市场“杀手锏”腾讯语音交互车端应用业务随起步较晚,但基于其智能平台的语音能力以及车载微信的强大吸引力与捆绑销售的模式,依然成为车企选择合作 的对象。目前,微信车载版在汽车出厂前已完成适配,而未适配车型暂不支持单独下载安装。针对语音交互产品,腾讯已基本具备自研能力,目前仅部分业务模块选择与科大讯飞、思必驰等供应商合作。未来腾讯也将继续深耕自研发展 路线,将提高基础能力体验为发展核心,基于用户ID,逐渐提升语料泛化能力与打造虚拟化语音形象。市场总结主机厂与供应商发展模式持续多样化,良好契合度成为合作开展机会点语音业务目前对于功能的更新与迭代要求比较高,主机厂与供应商的发展模式更加开放,因此传统的车企与供应商单一项目制供应关系不适用 于当前的语音交互业务。取而代之的新型合作模式需要供应商与车企之间达成长期战略合作。 在当前业务合作过程中,主机厂销量不足使其很难获得较大的价格优惠,而供应商定制化服务能力不足也已成为普遍痛点。 因此,对于供应商而言,目前正处于扩充市场份额的最佳时段。供应商在提升自身底层技术的同时,需要针对不同量级客户提供定制化且具有 性价比的解决方案,力争与主机厂形成良好的合作契合度,从而达成长久的战略合作关系。3.语音交互车端应用发展趋势预测趋势一:多模交互、主动交互、情感化交互将成车载交互2.0典型特征当前用户已经可以通过语音做垂类领域信息查询以及基础车辆控制等功能交互,但仍有诸多问题尚未解决。未来人工智能、大数据以及云平台 的发展将推动多模交互、生物识别以及高级语音交互的实现,车载智能交互将升级至2.0版本。 车载智能交互2.0的演变过程中,高级语音交互随之而来。随着虚拟语音助手的普及,车内语音交互也将与其他模态进行融合,为用户提供更加 形象化、情感化以及主动性的人机交互体验。趋势二:声纹识别+视觉交互将提供抑制冗余,避免交互安全隐患未来汽车将成为可移动的巨型手机,人机交互将由车内逐渐向车外延伸,主机厂在追求极致智能化体验的过程中,同样需要充分考虑对特殊驾 乘场景的应用适配,以降低潜在的安全隐患。例如,随着语音交互进行车控的功能逐渐落地,陌生人可在窗外进行车窗操控。 各模态人机交互方式之间难以完全相互取代,因此主机厂未来不仅需提升声纹识别技术,还需与视觉以及其他多模交互相结合,提供抑制冗余, 精确定位指令发起人,避免因语音交互而带来的安全隐患。趋势三:自动驾驶功能升级,语音交互应用场景与驾乘相关性将逐渐减弱随着自动驾驶功能的升级,驾驶员在驾驶过程中将逐渐解放双手与眼睛,开始进行一定程度沉浸式的娱乐、生活与社交。 除了手机的使用之外,车端的语音交互应用场景也逐渐扩展,开始由与驾乘相关性较强的基础车控、信息娱乐向社交、金融以及游戏等方向扩 展。实现车内外生态的联动,全方位满足用户的使用需求。趋势四:伴随应用拓展与技术发展,车内语音交互助手将成为“贾维斯”随着高级别自动驾驶的落地,车载应用将不多扩展,人机交互技术将逐渐成熟,语音交互会与其他模态交互进行深度的融合适配,确保在没有 方向盘、没有驾驶位与副驾驶位的情况下,可以精确的识别与执行用户进行的任何定制化指令与应用。 应用拓展与技术发展的加持下,语音交互助手还将具备自主学习能力和进化能力,根据用户的使用习惯来进行自我的学习和迭代,不断优化自 动驾驶及智能座舱体验实现自我成长的能力。对于用户主动式与被动式服务需求进行精准的判断、建议与执行,并通过语音进行传导(而非提 示音),语音交互在车端应用的终极产品形态将如同电影钢铁侠当中的“贾维斯”一样。