基于AI的高速公路智能语音平台建设.docx
基于AI的高速公路智能语音平台建设摘要:浙江省内机动车保有量不断上涨,高速公路报警或咨询服务的需求也随之增加,传统的人工客服系统已无法满足当前的业务需求。为响应国家促进人工智能与服务业深入融合的号召,同时结合目前高速公路客服系统业务现状和需求,本文通过探究目前高速语音服务现状与需求,提出一种基于AI技术,集国家高速公路政策、业务知识和路况信息“三位一体”的高速公路智能语音平台。该平台上线之后大幅度缓解了接警压力,提升了高速公路服务的效率和质量。随着经济的发展,浙江省内机动车保有量不断增长,高速公路出行逐渐成为人们日常出行的重要一环。在高度信息化的今天,如何实时高效地共享国家政策和高速公路路况等信息成为了亟需解决的难题。车主查询高速公路信息的需求和接入量日益增加,现有的传统客服系统无法满足日趋多元和庞大的需求。随着AI、大数据等技术发展,一种更智能的语音服务系统呼之欲出。一建设现状目前浙江省高速公路对外服务电话12122主要服务对象是车主,其传统的IVR系统菜单层级过多,语音播报内容冗长,选择流程完全依赖按键输入,流程过于繁琐,不利于用户使用,客户使用体验较差。由于该系统无法适应新时代的多元需求,很多用户因此转向了人工客服通道,进而增加了人工客服的运营压力和投入成本。另一方面,对人工客服来说,随着服务类型和业务量的增多,系统逐渐趋于复杂化,工作人员需要记忆的内容越来越多,工作流程的难度越来越高。员工大量的精力花费在判断和查找适合的文档中,无法完全发挥服务能力,并且容易因为主观原因造成错误引导。随着智能语音科技的发展,建设一个结合多种智能语音交互技术的智能语音客服系统将能更好地服务客户,提升业务的精度、效率和满意度。二建设目标通过引入客户服务行业中较为广泛使用的人工智能、语音交互技术,打造全国高速公路智能化客户服务第一品牌,提升高速公路客户服务能力,提高公众出行满意度,提高信息交互共享能力。为了满足客户查询道路相关信息的需求,智能客服系统要实现对高速公路业务知识的智能问答以及与客户之间的聊天问答,提供智能客服机器人管理平台,实现对业务知识库的管理、参数设置、机器人管理,最终建成一个多渠道、多业务的道路信息智能自助应答系统。三建设内容(一)语音识别语音识别技术,是让机器听懂人类语言的技术。其主要研究语音对象,能让机器通过语音信号处理和模式识别的方式自动识别和理解人类口述的语言。系统的主要实现功能是实时语音和语音文件的识别。语音识别技术是信息技术中人机交互的关键技术,包括前端语音处理和后端识别处理两方面的内容,对语音识别需要达到以下要求:检测语音并作降噪等预处理;识别人类语音,包括置信度输出、多识别结果处理、多槽识别等。(二)自然语义理解提供自然语言处理能力,以完成各类人机交互任务,具体包括但不限于智能问答、知识查询、信息核对、信息抽取等。自然语言处理技术根据输入的文本判断其所表达的意图,并依照预先设定的交互方式进行后续处理。语义解析服务是对自然语言进行文法和词法分析,结合对上下文的理解,得知用户的表达意图,需要包含下列功能。(1)实现残缺意图关键语义抽取、基于上下文信息的理解,多轮人机互动机制;(2)针对模糊语义,实现结果可选、可信和拒识三种置信策略;(3)建立持续积累支撑语义理解和智能问答的效果优化机制;(4)实现支持特殊输入的智能化处理,包括全局命令词、字符表情错别字、敏感词、拼音、乱码等输入、优化用户体验。(三)知识库语音客服系统对问题做出回答依赖知识库,无法对知识库以外的内容进行应答。技术原理是通过意图匹配的方式完成问答。知识库中包含数个知识点,以文本形式存在,同时每个知识点可以包含与其语意相同的若干相似问法。在进行问答时,系统对输入问题与知识库中的标准知识和相似问法依次计算相似度,选取相似度最高的问题作为用户意图,返回对应的答案。在拥有对话记录时,可以通过引擎提供的数据挖掘功能进行扩展问答以及新知识点的挖掘。若没有对话记录,则需要人工进行知识库编辑。得到知识库后,可以使用知识库进行语意模型训练,得到准确率更高的语意模型。知识发现功能用于从原始问答、人工坐席问答记录、机器问答记录发现提取知识,交给知识库加工人员处理。设计的目的是为了大大降低传统知识加工的工作量,解放知识运维人员的大量机械劳动。通过此功能,知识运维人员不需要专门编写扩展,而是挑选项目实际的用户问法,自动加为扩展问题即可。此外,系统也设计了忽略功能,即知识运维人员可忽略无意义的用户问法,以后就不会再被发现出来,从而避免被反复干扰。知识淘汰用于对一定的问答周期内,调用次数较少的知识按照预置规则进行提示,交人工选择进行删除。设计的目的主要是为了精简知识库,避免项目长年运转之后,知识库变得越来越臃肿繁杂,效率低下。知识库管理系统用于管理业务知识库,为智能搜索提供支持。主要功能是知识的录入、审核、发布、修改、移动、删除,定制化各类知识录入模板,知识维度管理,知识自动关联、人机知识检测界面功能。对于知识库系统要建成高速路况、政策咨询、紧急救援、高速诚信、生活服务五大知识分类体系。(四)语音合成语音合成是通过机械和电子的方式将文本信息转化为语音的技术。TTS技术(又称文语转换技术)是将计算机自己产生或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。语音合成是让机器对输入文字进行词法分析和语法分析,按照一定的业务规则和人类的习惯语言进行声音输出,需要包含的功能有:准确进行分词,并近似按人类习惯语言进行语音输出;语音输出保证连续性;输出的声纹可定制。(五)后台管理后台管理模块主要是实现系统的监控、营运,主要的功能需求有:敏感词过滤、词库管理、知识管理、渠道管理、用户管理、系统监控等。四建设架构(一) 逻辑架构智能语音平台逻辑架构如图1所示,整个平台架构是在高速信息安全体系与高速业务标准体系之下运行的。该平台完全建立在浙江省交通集团的安全云之上,并在内网运行,能保证系统安全可靠可控。平台通过对接IVR对用户的语言进行识别和语义解析,并在后台通过AI进行结果生成并反馈。通过收集国家高速公路政策、业务知识和路况信息“三位一体”构建智能应答系统的数据仓库,在进行语音服务的同时提供接口服务,供智慧高速、微型公众号等第三方平台调用。图1 平台逻辑架构图(二)业务流程架构与传统IVR相比,该平台直接使用语音代替在手机上按键操作,简化了与机器人客服的交互。通过改变交互方式,客户不是在语音提示下一步步操作最终进入各项服务,而是通过语音直接匹配到最符合要求的服务模块,当不满意时,可以在不同模块之间切换服务,节约了服务成本。整体系统业务流程如图2所示,用户拨打12122之后会听到语音提示语,按照语音提示转入智能语音客服系统。智能客服员系统进行提示播报:“欢迎进入智慧高速智能语音客服系统,您可以说出您要查询路况的高速公路名称”,用户可以通过自然语言的方式说出“杭金衢高速堵不堵”等,系统进行语音识别及语义理解,播报杭金衢高速公路相关路况信息等。除此之外,平台还有政策咨询、紧急救援、生活服务等功能。当用户需要人工服务或者语意都不匹配时,则根据按键提示直接进入人工服务阶段;当用户需要报警时,则直接转接高速公路交警。图2 智能语音业务流程架构(三) 技术架构技术结构如图3所示。软件架构分为四层,分别是语音应用层、平台服务层、语音核心引擎层和基础架构层。图3 技术架构图1、语音应用层用户对系统最直观的感受,主要有对话交互流程开发、语音服务接口、音频处理组件等。2、平台服务层为衔接语音应用层和语音核心引擎层的纽带,向上提供对话能力,向下对接核心能力,主要有负载均衡系统、对话系统、授权管理、语音合成服务、语音识别服务、语义理解服务等。3、语音核心引擎层为核心能力的私有化层,包括语音合成引擎、语音识别引擎、语义理解引擎、引擎优化定制系统、资源优化定制系统等。4、基础架构层该层是保证核心引擎能够最优化运行的桥梁,充分发挥硬件系统的计算和存储能力,包括多线程管理组件、操作系统适配库、分布式数据存储系统、配置管理基础组件。五建设规划(一)业务范围规划梳理12122提供现有业务菜单层级关系表及业务逻辑设计图等详细业务资料,实现现有12122中IVR或人工办理的高频查询和资讯类业务的扁平化;同时实现现有12122中IVR及其中用户输入难点业务、层级较深业务、地方特色业务的扁平化。业务扁平化设计时要从用户实际使用感受出发,贴近用户原有操作习惯,满足用户的个性化需求,保证业务流程的易用性,提高业务处理的效率,原则如下:主菜单采用开放式自由说语音导航提升用户体验;设计友好的VUI(语音交互界面)提示音;自动的错误/拒识结果原因分析,提供有针对性的错误处理,提供柔性错误恢复机制;合理识别入口,允许由识别跳转入人工流程。(二)IVR对话系统范围智能语音门户系统定制场景开发包含业务场景如下表所示。业务场景表(三)知识对话系统知识对话系统包含对外接口API和后台引擎两部分。后台引擎实现对业务知识的智能问答以及与客户之间的聊天问答,同时提供对话机器人的管理平台,实现对业务知识库的管理、文法管理、参数设置、机器人管理。知识对话系统对外提供调用接口API,与微信端和APP端应用平台对接,用于接收第三方发送的对话请求,以满足客户查询道路相关信息的需求。具体引擎与三方渠道之间的交互逻辑如图4所示。图4 交互逻辑(四)业务逻辑规划用户接入电话后,语音导航系统引导用户说出需求,并引导用户至正确的业务节点,当系统无法识别用户说话时能给出相应的提醒,并给出无法识别的原因,如音量大、音量小等错误原因,对话场景示例如图5所示。图5 对话场景示例(五)业务导航功能规划用户进入语音导航系统中,对话节点支持自由跳转,减少传统菜单中生硬的“返回”等操作。同时,由于部分用户不具备使用语音识别系统的经验,出现困惑、迟疑和系统打招呼等情况。系统将利用智能引导技术和用户打招呼实现集外业务处理,并最终引导用户说出自己的业务需求。业务导航流程设计如图6所示。图6 导航流程设计业务导航支持功能特点:VUI(语音交互界面)虚拟形象、语音/按键打断功能、错误处全局命令(主菜单、返回、重听、转人工、帮助)、路标指引、音乐与音效和集外业务。六技术难点及关键技术(一)技术难点分析本项目技术难点主要包括庞大的知识库体系、语音识别效果的优化、报警优先权处理等。(二)关键技术解决方案1、建设规范。根据浙江高速公路客服中心语音服务现状和业务需求,语音识别的应用规模:语音识别(听写)ASR许可数量为并发20路,语音识别(转写)数量为并发5路,语音合成TTS并发10路。考虑到负载均衡,ASR认证和转写识别部署在2台服务器上,TTS认证部署在2台服务器,语义理解组件部署在2台服务器上。2、组网方案。本项目在浙江高速公路现网环境中集中部署语音服务。针对本次应用,需要在现有系统添加8台服务器,如图7所示,其中ASR(语音识别听写和转写)、语义平台、语音合成服务器6台,通过IMS平台动态负载均衡功能实现热备功能,数据库、智能IVR业务组件服务器2台,其中语音识别与语义平台为必选组件,可依据实际情况增减服务器数。图7 组网方案图3、路数分离方案。报警咨询重要、紧急,本次方案设计秉承报警优先的原则。在系统中设置预警阈值(比如30路),当系统并发达到30路(预警阈值)时,针对咨询类服务,播报提示语,引导挂机,保障后续报警电话可接入。七系统创新点本项目的亮点主要体现在以下几个方面。(1)作为国内高速公路行业首次创新的智能化语音客服系统,多方面优化了现有的自助服务系统。(2)新一代智能语音客服系统将支持自由语音输入,实现菜单扁平化,使用户的使用操作更加简单高效。(3)新一代智能语音客服系统提供更加精确高效的普通话识别引擎和更加人性化的用户界面,提升了用户的操作体验和满意度。(4)新一代智能语音客服系统根据指挥高速公路交通的业务要求,在原有系统涵盖的内容下扩展了了路径、路况、服务区等常见问题的智能应答和查询模块,减少了人工客服的工作压力,节约了人工运营成本,提高了智能客服系统的服务集成度和服务质量。(5)新一代智能化语音客服系统和智慧高速APP、高速微信公众号等高速公路相关的第三方业务对接,为客户提供更全面的业务相关服务和信息查询通道。(6)本项目系统提供了丰富的应用接口和良好的软硬件平台,可应对时下高速公路发展变化的市场需求,利用现有资源满足各种技术、业务需求的调整和扩展。(7)该系统集成了现有操作和业务系统,实现与相关系统高效的交互访问。八一结束语该智能语音平台已于2019年11月率先在温州上线,后续逐步在台州、丽水、衢州、湖州、嘉兴、舟山共6个地市上线。自系统上线至2021年10月31日,共接通电话1059732通,报警类电话343509通,进入系统后直接转人工客服的电话102341通,智能客服系统自助解决的电话323161通,针对咨询类服务的自助解决率为78.71%。智能语音客服系统的上线,不仅缓解了接警压力,提升了高速公路交警应对突发事件的应急处理能力,还给查询高速公路交通信息的车主用户带来了极大便利。参考文献1 杜祎勋.浅析高速公路智能语音系统J.科学之友,2008.2 陈铖颖.智能语音SoC模拟前端研究进展J.电子技术应用,2019,45(01):7-10.3 郑杰慧,楼锴.人工智能语音技术在水务客服领域的应用研究J. 给水排水,2020(4).4 屈春华.基于RFID的智能语音导游系统的研究与实现D.北京交通大学.2011.5 郭明.智能语音外呼系统业务交互子系统的设计与实现D.北京邮电大学,2019.18