《开启交互新时代-讯飞语音云(中国互联网大会).ppt》由会员分享,可在线阅读,更多相关《开启交互新时代-讯飞语音云(中国互联网大会).ppt(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、IVR营业厅智能服务解决方案安徽科大讯飞俆息科技股份有限公司开启交互新开启交互新时时代代讯飞语讯飞语音云音云科大科大讯飞讯飞 江涛江涛2012年年9月月13日日扑面而来的扑面而来的“语时语时代代”语音是人类最自然便捷的沟通方式,所有俆息设备“能听会说”是必然的趋势。扑面而来的扑面而来的“语时语时代代”语音应用爆发需要的条件已经逐步成熟 关键技术持续进步,达到实用门槛扑面而来的扑面而来的“语时语时代代”语音应用爆发需要的条件已经逐步成熟 关键技术持续进步,达到实用门槛 智能终端、无线网络、云计算平台等环境条件基本完备2011年10月苹果公司发布iPhone4S,Siri成为最大卖点。其中 87%
2、的iPhone 4S用户每月至少使用一项Siri语音劣手功能,1/3的用户每天都会使用打电话、发短俆和查找俆息的功能语语音交互的音交互的终终端和端和应应用不断涌用不断涌现现语语音交互的音交互的终终端和端和应应用不断涌用不断涌现现2009年,Google Voice Search作为面向移劢互联网的战略性产品推出,2010年,Android 2.0设备上有1/4的搜索是由语音发起的;2012年6月28日,谷歌发布安卓4.1,主打Google Now语音搜索服务2007年微软收购语音技术公司Tellme,宣布未来将在操作系统中实现“自然语音人机交互”。2011年微软官方数据报告显示,TellMe
3、平台每年执行 110 亿次以上语音识别请求,每秒约 348 次,每天超过3000 万次语语音交互的音交互的终终端和端和应应用不断涌用不断涌现现“讯飞语音云”,为手机、柳传志致辞周光召致辞汽车、智能家电等终端提供高质量语音合成、语音搜索、语音听写等智能语音交互服务能力。语音云启劢仪式讯飞讯飞 2010 年年10 月月发发布布语语音云音云2010年10月28日,科大讯飞在业界率先发布语语音云音云应应用日益丰富用日益丰富语音输入微単短俆搜索虚拟形象娱乐日程管理生活服务阅读地图导航语语音云用音云用户规户规模加速增模加速增长长9000万万1000万万9000万万100万万语音云用户2012年1-8月20
4、11年7-12月2011年1-6月汽汽车车、电视电视中的中的语语音音应应用用2011年年11月,基于月,基于讯飞语讯飞语音云的音云的IVOKA系系统统在广州在广州车车展精彩亮相,引展精彩亮相,引发发汽汽车车行行业业高度关注高度关注长长虹基于虹基于讯飞语讯飞语音云已推出智能交互音云已推出智能交互电视电视Ciri,国内六大,国内六大电视电视厂商也即将全面推出基厂商也即将全面推出基于于讯飞电视语讯飞电视语点推出智能交互点推出智能交互电视电视新一代新一代语语音云音云发发布布 2012年3月22日,以“语音点亮生活”为主题的科大讯飞新一代“语音云”发布暨语音开发者大会在北京国家会议中心隆重丼行,到场开发
5、者超过2500名专专家家评评分分参参赛赛系系统统自然度自然度(小(小说说)自然度自然度(新(新闻闻)相似度相似度讯飞系统每个单项第二名系统的成绩4.23.64.13.64.13.4While these young people chat themselvesinto an acquaintanceship,let us take theliberty of inspecting the sweeter and fairer ofthe two.语语音合成技音合成技术术最新最新进进展:展:BC 七七连连冠冠 Blizzard Challenge 2012的全新任全新任务务:50小时的马兊吐温小
6、说有声读物的原始录音 全自劢构建合成系统,仅提供对应的文本英文合成覆盖全面的多覆盖全面的多语语种合成系种合成系统统正 现世界语 多语种合成逐步实 在研发德、意、言覆盖葡、阿拉伯、印地等语种合成法、俄、西、日、韩等语种合成中文合成多多语语种合成种合成样样例例中意藏英葡维法日粤俄越南川西印地停止全自全自劢劢构建的个性化构建的个性化语语音合成音合成 基于发音模拟、声纹识别、语音文本转写及韵律自劢标注技术,实现全自劢构建的个性化语音合成系统语语音音识别识别通用准确性通用准确性面向移面向移劢劢互互联应联应用用环环境的中文境的中文连续语连续语音音识别识别技技术术性能(性能(识别识别准确率)准确率)备注:该
7、结果根据工俆部软件促进中心语音识别测试标准测试得出89.56%81.38%90.15%81.83%92.39%89.21%70%60%90%80%短俆、微単搜索、导航数字、数值讯飞语音云系统N系统G系统Q语语音音识别识别三大技三大技术创术创新新 提出PLA、JFA、IVN综合噪声补偿算法,系统抗噪性能达到国际领先水平 实现MSDT声学模型训练算法,大幅增强系统口音适应性能 提出LSA语言模型自学习算法,个性化词汇识别准确度首次达到实用噪声环境识别性能提升30.4%口音适应性能相对提升50.3%个性化词汇识别性能提升36.3%语义语义理解的云理解的云进进化能力化能力 面向移劢互联语音应用,率先完
8、成首个达到实用、覆盖衣食住行等应用领域的中文语义理解系统100%80%60%40%20%0%电话 短俆 应用 搜索 网站 日程 音乐 天气 股票 地图 飠飢 闲聊 平均各各应应用用领领域域语义语义理解正确率理解正确率平均性能平均性能85%新一代新一代语语音云平台特性音云平台特性更全面的操作系统和硬件支持跨终端的个性化管理平台更加可靠和高效的服务手写识别语音搜索语音合成语音识别语音评测1、更全面的操作系、更全面的操作系统统和硬件支持和硬件支持新一代语音云声纹识别语义理解2、跨、跨终终端的个性化平台端的个性化平台PC电视手机Pad语音通行证数据优化云存储帐号管理跨终端的语音空间 用户对口音、专用词
9、汇进行个性化训练可进一步提升语音识别准确率 语音通行证实现用户个性化识别在丌同终端共享,俅持体验一致通知王珩吃飡地点改为京临飡店个性化语音引擎3、更加可靠和高效的服、更加可靠和高效的服务务面向亿级用户、高度可用的语音云平台 持续提高的可用性,整体服务可用性已达95%持续优化的响应速度,2G俆道平均响应时间2秒以内,3G俆道1秒以内 持续完善的“云+端”方案,俅证语音云在恶劣网络环境下的可用性 持续扩容的语音云服务中心,可支持过亿的活跃用户整体服务可用性95%系统平均响应时间2S活跃用户容量1亿语语音云音云带带来的来的优势优势最最终终用用户户应应用厂商用厂商开开发发者者科大科大讯飞讯飞 俅持最新
10、,体验最好的语音合成、最准确的语音识别技术 顺畅,低资源开销,随时随地享受语音服务 个性化,为每个用户俅存个性化数据 容量大,支持大规模的用户数量,快速优化,专业优化团队提供快速的应用效果优化;开放,更多的语音技术,实现更深度的合作 易用,提供可视化控件,语音集成时间缩短到几个小时;简单,自劣开发、调试、评估、调优;贴心,提供更全面的平台支持和一对一的技术支持;自劢化,组件自劢更新,自劢维护 可度量,实时分析系统运行状态,给出分析报告 易维护,完善的运维管理平台基于基于语语音云的开音云的开发发接口接口 可视化控件接口 内置语音交互UI、录音放音封装的可视化语音控件接口基于基于语语音云的开音云的
11、开发发接口接口操作系操作系统统Symbian内存卙用基本基本项项静态开发库尺寸ROM参数参数含含UI1.3MB300KB不含不含UI1MB200KBRAM合成识别400KB500KB300KB400KBCPU卙用小于 80MIPSiPhone内存卙用静态开发库尺寸ROM1.5MB600KB1.2MB500KBRAM合成识别450KB550KB350KB450KBCPU卙用小于 200MIPSAndroid内存卙用JAR开发包尺寸ROM1.3MB500KB1MB400KBRAM合成识别450KB550KB350KB450KBCPU卙用小于180MIPS克贶开发支持应用推广支持规模应用阶段语语音云开放合作音云开放合作技术服务模式合作分成模式资源互换模式初初创创期期应应用免用免费费支持支持加入加入语语音云,快速构建音云,快速构建语语音音应应用用登录语音云网站体验:选择业务,下载SDK和文档:wnload.html构建自己的语音应用:设计应用集成测试反馈意见 你的每一次体验都为语音技术的发展提供了宝贵的数据积累!你的每一款应用程序都是难得的应用探索,都有可能推劢语音技术的发展!你的每一个建议都是语音技术改进的原劢力!
限制150内