欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年语音产业调研. .pdf

    • 资源ID:27866378       资源大小:149.88KB        全文页数:24页
    • 资源格式: PDF        下载积分:4.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要4.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年语音产业调研. .pdf

    目录智能语音产业发展情况调研. 2NUANCE公司(语音识别,图像处理,输入法软件) . 2IBM(VIAVOICE) . 3微软( SPEECH SDK) . 3DIALOGIC . 4安吉星 ONSTAR(通用汽车) . 5车音网 . 5深圳华为 . 6科大讯飞 . 7苏州思必驰 . 8北京捷通华声语音技术有限公司(智能人机交互HCI) . 9中科信利(中科院声学所). 10中科模识 . 12北京正鹰科技. 13北京得意音通公司. 13厦门天聪智能软件. 14北京宇音天下科技有限公司. 15四维图新(车载语音). 16上汽荣威 . 17福州海景科技(海景生物识别技术研究中心). 18唯创科技 . 19北京云知声 . 19北京普强公司. 21聚熵信息技术(上海 )有限公司 . 22百度 . 22GOOGLE. 23三星 . 24名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 24 页 - - - - - - - - - 智能语音产业发展情况调研Nuance 公司(语音识别,图像处理,输入法软件)核心技术:语音识别产品:1. 电脑语音识别软件Naturally Speaking2. T9 智能文字输入法 (支持超过 70 种语言,超过 30 亿移动终端内置,市场占有率 70%,中国超 50%)3. Dragon Dictation (声龙听写),适用于 iPhone ,iPad 和 iPod touch 用户的一款语音识别应用软件, 将用户的语音转换成文字。软件目前支持美国英语、 英国英语、澳大利亚英语、 法语、德语、意大利语、西班牙语、日语、韩语和中文。特点:在类似的产品中拥有最高的语音辨识率,英文可达99%。其英文语音产品 Dragon NaturallySpeaking9在法律和医院临床记录占据很大市场。世界语音技术市场, 有超过 80%的语音识别是采用Nuance 识别引擎技术,其名下有超过1000 个专利技术,公司研发的语音产品可以支持超过 50 种语言,在全球拥有超过20 亿用户。在金融领域,超过 500 家客户;电信行业,前15 大公司有超过 10 家为 Nuance用户。语音识别应用领域广泛,如呼叫客服中心、GPS 语音定位搜索、电子词典发音,说话译成不同语言的文字。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 24 页 - - - - - - - - - 08 年 3 月,亿讯成为大中华区的专业总代理。在中国有90% 的语音识别应用是采用Nuance的核心技术。在中国,占据大部分客服呼叫中心的份额,尤其在电信、金融行业广泛应用。IBM (ViaVoice )产品: ViaVoiceIBM ViaVoice 是一种通过麦克风输入中文的程序。您所需要做的仅仅是对着话筒喊出您要输入的字符,ViaVoice就会自动判断并且帮你输入汉字。作为语音识别软件系列的产品,它可以使PC、手提设备、汽车系统和自动客户服务系统之间的信息交流变得轻松快捷。作为第一个全功能的语音指令桌面程序,运行在Windows下的ViaVoice 支持 Microsoft Office 2003,为不同要求的用户提供了精确的语音识别技术。 与其它语音识别系统一样, 它能够不断学习和适应用户的特定语音,并不断提高识别的准确度。ViaVoice同样可以对识别出来的文本进行修改纠错,这也让软件变的更加实用。微软( Speech SDK )产品: Speech SDKSpeech SDK 是微软的语音识别系统。它的功能与IBM的ViaVoice类似,可以将用户的语音信号转化为文字,省去打字的繁琐。原程序带的是英文引擎,外带中日文语言包,可支持中文和日文输入。在进行简单的语音训练之后即可使用,也具有较高的辨识度。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 24 页 - - - - - - - - - 比较 ViaVoice 和 Speech SDK ,VIavoice 的优点在于纠错功能比较好用并且对短的字词识别度较高,而Speech SDK 的优点在于一方面它很好与微软的语音输入法结合起来,另一方面它对整句的识别度比较高。Dialogic Dialogic是一家 Intel 所属公司,它提供关键构件和技术服务。Dialogic的产品用于客户拥有设备和公用网络环境中的语音、传真、数据、语音识别和合成、呼叫中心管理和IP 电话应用程序。Dialogic总部位于新泽西Parsippany ,并在全球设有地区总部。Dialogic公司是一个提供开放的、高品质的、基于标准的电信和计算机语音集成部件的供应商,并占有全球64%的市场份额。您会发现很多基于Dialogic产品的系统在可靠地管理电话、传真和由计算机通过有线和无线网络来应答的多媒体呼叫系统。Dialogic产品广泛应用于语音、传真、数据、语音识别、声音合成、互联网电话和呼叫中心管理等一系列商业领域。Dialogic 产品中国区总代理是北京美迪格威科技有限责任公司产品:1. 语音网关DMG 媒体网关系列IMG 集成媒体网关系列BorderNet网关系列名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 24 页 - - - - - - - - - 2. 语音传真卡Diva Soft IP Brooktrout系列HMP 接口卡安吉星 Onstar (通用汽车)安吉星是通用汽车与上汽集团之间的第八家合资企业,也是北美市场之外的首家OnStar 信息服务业务机构。 OnStar 是通用汽车最成功的品牌之一,在 2008 年底北美上市的 95% 通用汽车产品都安装了该系统。 OnStar系统通过应用全球卫星定位系统(GPS)和无线通信技术来为中国的消费者提供广泛的汽车安全信息服务,包括碰撞自动求助、路边救援协助、 全音控免提电话 、实时按需检测和 全程音控领航 (Turn-By-Turn Navigation)等十多项。车音网车音网是中国首家 特马服务( Telematics )提供商,是富创新精神和开拓性的新锐科技公司, 是中国市场应用自动语音识别和跨网通信技术进行语音增值业务的领导者。车音网与联通及广大汽车专业服务商紧密合作,致力于推广全新的汽车生活理念, 提倡 “安全、便捷、时尚”的汽车生活方式, 提供安全的驾驶通讯环境和便携的汽车特马服务。核心技术:语音识别与语音合成;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 24 页 - - - - - - - - - 主要产品:1. 企业级产品: 一声达为 TSP及汽车企业用户提供的基于语音识别引擎的用户管理及服务平台,为企业级用户提供集服务管理、会员管理、网站管理以及报表统计于一体的基于语音平台级的咨询服务,通过自身语音平台技术优势和经验帮助用户进行语音平台的设计和实施。2. 用户级产品: 智驾精灵基于语音识别引擎的车联网智能移动终端套件为企业级用户提供促销推广、行业礼品解决方案,通过自身语音平台技术优势和经验为客户群体提供基于语音识别技术的智能终端应用方案,根据用户的需求,整合不同的服务内容,服务配套设备,实现整合营销。车音网背景阅读:http:/ 金融行业 VoIP 解决方案华为公司作为国内著名的通信设备制造商,借助多年电信设备开发经验,为金融系统提供全方位的可管理、 智能化语音解决方案。2. Emotion UI中内嵌的 语音助手华为语音助手是华为终端公司开发的用于终端的语音控制程序。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 24 页 - - - - - - - - - 华为终端将在未来上市的高端智能手机上采用全新的Emotion UI,并且启用“智能语音助手”功能。这个新功能的具体名称目前还不得而知,但可以肯定它不仅具有Siri 的基本功能,而且一改 Android系统 Voice Actions的诟病,针对自然语言的理解和反应进行全面的中国本地化改善。科大讯飞产业方向:1. 语音平台产业方向;2. 通信增值产业方向;3. 嵌入式产业方向;4. 教育产业方向;5. 行业软件和系统集成产业方向。核心技术:1. 语音合成技术;2. 语音识别技术;3. 语音评测技术;4. 声纹识别技术;5. 自然语言处理。主要产品:1. 讯飞语音输入法;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 24 页 - - - - - - - - - 2. 讯飞语点;3. 讯飞口讯;苏州思必驰思必驰致力于为国内外的教育软件公司、标准化考试机构、培训机构、出版社、大中小学提供基于云计算平台的中英文智能语音交互技术,以及相关的智能人机互动口语教学系统解决方案,帮助传统教学产品和服务实现智能语音人机互动和跨平台(互联网、桌面应用、移动平台等)应用。核心技术:1. 语音分析思必驰强大的智能语音分析模块,支持中文和英文的全方位智能分析,覆盖基本音素、音节、字词、句子以及段落各个范围,覆盖声调、语调、流利程度、母语程度等各个评估维度。客观的鲁棒性测试显示,思必驰的语音分析技术不单在安静标准的考试环境下达到很高精度,在通常的家庭学习环境和一般麦克风声学环境下仍然达到了评估的高准确度,显著领先于市场上的同类产品。2. 语音合成思必驰开发了商业化的低资源消耗的语音合成系统,以同类产品1/200的大小,提供不限词表、不同性别、多语种的多风格自然语音合成。采用新一代的基于参数化统计模型的语音合成系统,与传统的音频片段拼接合成技术相比,具有更高的灵活性,在合名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 24 页 - - - - - - - - - 成多样化风格语音方面具有特别的优势,使风格定制化的语音合成成为现实。3. 语音识别与语音理解思必驰拥有自主知识产权的统计语音识别和理解技术,突破了大词汇量、连续自然语音、说话人变化、环境变化、语义模糊等一系列主要技术难点,其引擎可以在复杂运行条件下提供更高的识别率、更快的反应速度和自适应调整能力,达到了国际先进水平。产品:1. 声动之芯( API)“声动之芯”是为教育软件公司、标准化考试机构、培训机构、出版社提供的基于云计算的智能语音交互技术服务,能实现口语教辅系统、口语学习软件、口语考试系统、语音游戏、互动教材等功能。用户无需专业语音知识, 调用简单接口或应用成熟模板,就能立刻使软件、网站、智能手机、平板电脑增加国际领先的智能语音分析互动能力。2. 智能人机互动口语教学系统解决方案面向教育培训机构、教育软件公司、出版社提供的教学系统定制服务。该方案基于思必驰先进的智能语音技术,覆盖完整口语教学环节,提供针对课前预习发音练习人机对话口语评测的应用模块。客户只需选择相关模块,添加相应学习内容,就能形成一套最适合自己的教学、评测产品。北京捷通华声语音技术有限公司(智能人机交互HCI)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 24 页 - - - - - - - - - 平台:人机交互感知云捷通灵云(HCI)核心技术:1. 语音合成2. 语音识别3. 手写识别主营产品:1. HCI 技术授权类产品(平台级,嵌入式,桌面级)2. HCI 方案类产品(平台应用解决方案,嵌入式应用解决方案)3. HCI 应用类产品(安卓应用,捷通听书)4. 小唐龙 语音助手小唐龙是一个灵敏、可爱、智能的手机助手。依靠语音识别(ASR) 、语音合成( TTS)和人工智能( AI)来实现让小唐龙可以通过自然语言与用户进行互动,为用户提供工作、学习、生活、交友等各个方面的手机助理。中科信利(中科院声学所)产品:1. 中科信利语音识别引擎;中科信利嵌入式语音识别引擎(MSR)是一款特别为移动设备比如 PDA、手机语音应用而设计的语音识别引擎。其内核基于隐马尔科夫模型( HMM ) ,所采用的搜索算法针对嵌入式移动设备的特点作了针对性的改进以提高速度和识别率。所用的中文语音模名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 24 页 - - - - - - - - - 型是基于大量的不同场合,不同人群和不同口音的真实语音数据训练出来的,具有较好的鲁棒性。 根据不同移动设备的资源情况,该识别引擎可以被定制成不同的配置,使得它可以在某种设备上让语音识别的应用性能达到最优。2. 中科信利 KTV 语音点歌解决方案;中科信利 KTV 语音点歌解决方案,是针对卡拉OK 包房内点歌系统而提出的,具有根据用户用嘴说出的歌名、歌手名、一句歌词或哼唱一段旋律来搜索歌曲的功能,以及对演唱者的旋律准确度进行评分的功能。其自然的交互和简便的操作方式,均胜于传统的点歌方式。为适应 KTV 的高噪声环境, 中科信利 KTV 语音点歌方案还集成了中科信利专有的降噪处理算法,保证了嘈杂环境中语音点歌的准确性。3. 中科信利嵌入式系统语音合成引擎;中科信利嵌入式语音合成引擎(简称MTTS )是一款特别为移动设备比如手机语音应用而设计的语音合成引擎。其特点是基于汉语全音节以及某些特殊单元建模,并结合特定的语音压缩的算法,针对嵌入式移动设备的资源有限的特点作了针对性的改进,以降低音库大小并提高自然度。根据不同移动设备的资源情况以及不同的应用场合,该引擎可以附加定制不同的特定音库,以使得它可以在某种应用背景中的性能达到最优。4. 中科信利语音手机通语音手机通 VoiceTone 是基于中科信利嵌入式语音识别引擎名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 24 页 - - - - - - - - - 和中科信利嵌入式语音合成引擎,专门针对高端手机(比如PDA手机、 SmartPhone等)开发的语音应用软件,它为用户提供了通过人机语音交互模式控制移动设备的快捷方便的途径。使用该产品,只需直接说出要查询的人的名字,其资料将会自动显示出来,然后可根据语音提示的指令进行拨号操作。语音手机通适用于Windows CE平台和其他资源极度受限的嵌入式操作系统,能在资源有限的情况下以较小开销完成人名/命令识别等任务。该软件的主要目的是为嵌入式系统用户提供基于语音的人机交互界面,使嵌入式移动设备的操作更加人性化,同时,也方便了老年人以及残障人群对嵌入式移动产品的使用。中科模识北京中科模识科技有限公司 (Pattek )是中国科学院自动化研究所于 2000 年成立的高新技术企业。 模识科技专业从事语音识别技术研究、产品开发与成果转化,为拥有自主知识产权的创新型企业。公司为中关村科技园区高新技术企业和软件企业。模识科技致力于为成为全球著名的智能语音处理技术与应用服务提供商。经过几年的不断努力和应用探索,模识科技研究和开发了系列化的智能语音处理技术和产品。面向嵌入式、桌面、广播电视和电话等信道,Pattek ASR 可提供系列化的语音 -文字转换、关键词检出、说话人识别和语种识别等技术引擎;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 24 页 - - - - - - - - - Pattek CMS 面向广播电视等内容监测和高自动化的广告监测等需求,可提供完整的平台和系统解决方案;Pattek SIR 面向音视频内容管理和个性化内容服务等市场需求,可完成海量音视频内容的语音索引和检索。Pattek上述三个产品以及技术已在广电、公安、终端、工商、教育等领域部署实施和应用,有力地促进了相关行业的技术进步和业务发展。北京正鹰科技北京正鹰科技是以自主研发的声纹识别和语音识别技术为基础的语音技术供应商,公司由一批教授、博士等投资发起。依托雄厚的技术实力、厚积薄发的研发能力和专业高效的人才团队,正鹰科技强势进军声纹识别和语音识别技术领域。公司以声纹识别、语音识别技术应用和服务为主要研发及经营方向,为业界提供先进的全方案语音技术应用服务。该公司曾为咨询公司益普索咨询和建设银行等大型企业提供声纹识别技术和服务,积累了丰富的声纹识别技术应用经验。产品和服务:声纹识别软件、声纹识别开发包、 声纹识别服务、 声音鉴定服务、呼叫中心身份识别、呼叫中心防骚扰、语音识别技术服务、电话银行身份认证等。北京得意音通公司名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 24 页 - - - - - - - - - 核心技术:1. 声纹识别;2. 语音识别;3. 自然语言理解。主要产品:1. 电话银行声纹身份认证系统;2. 智能客服解决方案;3. WM5.0 中文整句输入法。备注:存在北京与广州两个公司,有清华大学与中国移动的背景。厦门天聪智能软件厦门天聪智能软件有限公司是一家成立于2005 年的高新技术企业,专业从事语音技术、声纹识别和嵌入式系统的研发和销售。天聪产品和解决方案可应用于公安司法、 银行证券、智能手机、智能玩具、智能家居等领域。天聪公司的产品受到消费者的欢迎,已成功应用到中国移动、中国科技馆、泉州监狱、厦门港务、超级虹逗、俄语声控机器人等众多客户和产品,并先后得到各类媒体的报道和转载。天聪公司研发的智能化嵌入式语音识别系统,具备识别准确率高、响应速度快的优点, 以及良好的抗背景噪音功能。 天聪公司研发的智能声纹识别系统也达到国内领先水平。2010 年 11 月,由厦门天聪智能软件有限公司与中国移动联合研发成功的全国首创的“声纹识别名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 24 页 - - - - - - - - - 亲情电话系统”获得“ 2010 年中国通信与信息化应用优秀成果奖”银奖。天聪公司的发展目标是, 在 5 年内,成为全国领先的语音声纹识别技术开发商, 10 年内产值进入全国IT 百强。核心产品:1. 声纹软件天聪亲情电话管理系统声纹识别开发包( tsVPR) VoicePassport 2. 语音模块语音识别 IC 语音识别模块语音控制模块北京宇音天下科技有限公司成立于 2009 年 5 月份,其对外品牌是宇音天下,其前身是北京益世通利智能通讯技术有限公司 (原汉王科技公司智能电话事业部于2005年分离出来的部分队伍) ,是国内早期致力于语音合成(中文TTS)和中文输入法等智能人机交互领域产业化的企业,研制了国内首款中文语音合成芯片。核心技术:语音合成。主要产品:1. SYN 系列语音合成芯片;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 24 页 - - - - - - - - - 2. emTTS 语音合成软件;嵌入式语音合成软件EMTTS2.0 是北京宇音天下科技有限公司 2010 年开发推出的具有国际先进水平的嵌入式语音合成系统。它能够将任意输入的文本(包括流式输入和块式输入),转换成自然的语音输出,声音易懂,且自然亲切。EMTTS2.0 提供了丰富的功能和接口,还提供一套文本标注方法,方便用户根据应用需要来设计独特的发音效果。它支持Symbian 、WinCE 、ARM 、Linux 、Vxworks等平台,可应用于手机、 GPS 导航、 PDA、嵌入式汽车导航仪、声控玩具、仿真宠物、智能家电等领域。四维图新(车载语音)技术来源: Nuance ;北京四维图新科技股份有限公司是我国第一家致力于中国自主车载导航电子地图研发、 生产与经营的企业, 拥有先进的导航电子地图制作核心技术以及近10 年的导航电子地图生产经验。其产品广泛应用于汽车工业、消费类电子、Internet和 LBS 等领域。四维图新连续 9 年在中国车载导航地图市场保持持续领先地位,连续 5 年在手机导航地图市场份额超过50%,并在便携导航、 LBS及互联网位置服务、交通信息服务和智能的Telematics服务领域全面领先。率先推出 Telematics业务品牌 “趣驾”,战略布局车联网。四维名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 24 页 - - - - - - - - - 图新以打造国际级综合地理信息服务提供商为目标,打造专业化业务平台,促进企业市场化、国际化和规模化发展。四维图新通过技术创新,在导航地图制作技术中引入更加精确的字音转换技术,在原有云计算平台的基础上增加了道路名称、POI等所有与导航地图相关的语音地图数据,并建立了“嵌入式”与“云计算”两种模式的语音地图数据库, 确保了语音识别和语音合成的准确度,大大提高了现有语音导航的识别率。产品介绍:Telematics 业务: 在 Telematics 服务中涉及到语音识别与合成的功能,但并不是其主打业务,这一点与车音网有所不同。但所提供的特马服务基本相同。上汽荣威产品:语音云驾驶 iVoka ;iVoka 是上汽荣威的 3G 网络行车系统 inkaNet中搭载的新型人机语音交互技术。 这是一项类似 Siri 的人车对话功能。 如果您在开车时仍需处理其他事务, 那么语音云驾驶iVoka 可以根据您的语音指令来执行各种行车时常用操作,如拨打电话、短信浏览、目的地搜索、查询航班、查询天气、播放音乐等。与 Siri 相比,语音云驾驶iVoka 显然更加本土化,为用户提供的体验也显然更加实际。 这是一项智能化的人车对话功能,其重要意义在于解放了驾驶者的双手, 提高了行车安全性。 车主通过语音云驾驶名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 17 页,共 24 页 - - - - - - - - - iVoka 操作时双手完全无需离开方向盘,这带来的不仅是便利,更是行车安全性的提高。 iVoka 人机智能交互系统全部基于语音操作,很大程度上减少了由于双手脱离方向盘的不当操作引发的意外事故。福州海景科技(海景生物识别技术研究中心)福州海景科技开发有限公司致力于人像、声音、虹膜生物识别技术多年,投入大量的人力、 物力,和国内外著名高校及科研机构广泛深入的合作, 攻克了生物识别技术诸多难题,成功研发出全球领先的人像、虹膜、声音识别技术,并拥有自主的知识产权,识别准确度最高,识别速度最快,受外环境影响最小。该公司在基于该项技术的基础之上成立研发了应用于诸多行业的软件、硬件产品,在国内外的同行的同类产品中均处前列。核心技术:语音识别技术。声音识别(Voice Recognition 简称“VR”)也称说话人识别,就是根据人的声音特征,识别出某段声音是谁说的。严格地讲,声纹识别有两方面,说话人辨认和说话人确认。前者要判断出某段声音是若干人中的哪一个所说的;后者则确认某段声音是否是指定的某个人所说的。主要产品:海景声音识别系统海景声音识别系统,集成了国际先进的说话人模型技术,能够依据较短的声音,快速准确的辨识说话人真实身份。系统准确性高,识别速度快,安全,易用,成本低,可广泛应用于证券交易、 银行交易、公安取证、个人电脑声控锁、 汽车声控锁、身份证、信用卡的认证等。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 18 页,共 24 页 - - - - - - - - - 唯创科技唯创科技有限公司于1999 年创立于广州市天河区,是一家专注于语音技术研究、 语音产品方案设计及控制等软、硬件设计的高新技术公司。业务范围涉及汽车电子、多媒体、家居防盗、通信、家电、医疗器械、工业自动化控制、玩具及互动消费类产品等领域。主营范围:语音芯片语音模块语音方案;主要产品:WTV 系列语音芯片、WTR 可录音系列语音芯片、WTM系列高音质语音应用模块、WTF 系列的高性价比长时间播放模块,及特约代理的 APLUS 系列语音芯片、ISD全系列可录放语音芯片等。提供完备、多元化的客需解决方案,节约研发成本,缩短研发周期,使产品以最短的时间上市。 在汽车电子及特种车领域, 自主研发的公交车报站器在国内有着很好的市场口碑,为叉车使用安全而开发的叉车超速报警器是国内第一家研发并大量生产的企业。WTV 系列语音芯片、 WT588D系列语音模块广泛应用于:汽车电子消费品、倒车雷达、汽车智能防盗设备、TPMS、电动车语音芯片、洗衣机语音芯片、空调语音芯片、指纹智能锁、治疗仪、门禁系统、家庭智能防盗报警器、停车系统等。北京云知声北京云知声信息技术有限公司,创立于2012 年 6 月,是一家专注于智能语音及语言处理技术研究、开发和应用的移动互联网创业公司,核心技术团队来自国内外知名企业、高校和研究所, 80% 以上拥名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 19 页,共 24 页 - - - - - - - - - 有博士学位,并具有超过10 年的语音识别技术研发和应用经验,拥有自主知识产权的世界领先的智能语音识别技术,借助云计算平台和移动互联网技术, 目前已推出了一系列语音识别服务中间件和语音识别服务云平台,为互联网用户提供专业的语音识别服务。核心技术:1. 语音识别技术;2. 云计算平台技术;3. 移动客户端技术。产品服务:1. 公有语音云平台在利用云计算技术增进语音识别系统的识别率、服务效率、响应速度等方面, 我们形成了一整套技术和平台架构方案。语音云计算平台具有自主知识产权, 是由创业团队根据在开源高性能集群平台基础上,针对语音云进行优化得到,经过大规模高强度测试,完全具备支撑语音识别服务的高强度计算需求。公有云平台支持大词汇量连续语音在线识别,通过 API 直接调用公有云服务, 提供具有世界水平的中文语音识别服务。2. 私有语音云平台除了可以支持大词汇量连续语音在线识别,还可以根据特定的业务需求,为企业提供专业的私有云平台,并根据企业特有的应用环境优化识别模型。根据企业的特殊需要提供定制化的SDK 和接口调用。3. 移动终端名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 20 页,共 24 页 - - - - - - - - - 爱说说语音助手搜狗语音助手北京普强公司普强信息技术有限公司是一个以智能语音、语言理解技术和云计算平台为依托,面向移动应用和企业应用提供服务的企业。公司的创始及研究团队由海外留学人员组成,具有丰富的科研和开发经验。借助硅谷的科技背景和中国本地化的开发团队,迅速推出了面向移动应用和企业应用的语音云计算平台产品,向广大合作伙伴提供智能人机交互服务。产品:1. “千语”语音云计算平台“千语”语音云计算平台是国内第一个通过云计算构架提供语音识别服务的云计算语音平台,通过“平台即服务”的方式提供服务。由于海量计算和数据管理是在平台内处理,千语平台对移动终端的要求低,因此可以方便地支持多种不同的移动客户终端。基于云计算的技术,千语平台可以弹性地支持大规模的用户群,免去了应用提供商对复杂和占用资源的语音识别系统的安装与维护。千语语音平台解决了移动终端输入的困难, 开创了语音输入的新时代。 程序员可以利用这个开发和运行的平台方便地实现支持语音的创新应用。2. 与酷我音乐合作推出 “酷我听听“语音版 ;3. 与爱帮网合作推出 “爱帮爱逛“语音版名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 21 页,共 24 页 - - - - - - - - - 聚熵信息技术 (上海 )有限公司核心产品: 智能 360 语音助理智能 360 为一款移动智能语音交互应用, 是由一个平均年龄为26岁的年轻团队开发的,其语音识别技术由google 、科大讯飞提供,语义核心技术中文语义解析引擎由聚熵智能自主研发。正如“百度更懂中文”一样,较之Siri,智能 360 绝对“更懂中文”。智能聊天、备忘、发短信、发微博、定位、查询周围的美食、询问路线、翻译 16 种语言、查询菜谱、打电话、查询天气、打开应用、打开网站、删除应用、下载应用、百科知识、媒体播放、查新闻、询问流行的游戏、最新的电影等等众多智能功能。百度产品:1. 语音搜索语音搜索作为一种新颖的搜索技术,给广大互联网用户带来全新的搜索体验, 用户可以使用语音进行检索和查询。比起传统的搜索实现,语音搜索能够给用户带来更多的方便和快捷,同时,语音搜索也提供了更多的通用性, 对于那些不会拼音或者不方便打字的人群来说,这些都是实实在在的便利。 百度语音搜索旨在为用户提供更好的用户体验,一直致力于识别准确率的提高和语音搜索服务的多样性改进。目前,不仅提供一般的通用语音搜索服务,还有针对地图用户制定的特色搜索服务,后续还会有更多的个性化搜索和识别服务出现。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 22 页,共 24 页 - - - - - - - - - 目前百度语音搜索以移动客户端为主要平台,内嵌于百度的其他产品中,比如掌上百度,百度手机地图等,用户可以在使用这些客户端产品的同时体验语音搜索,支持全部主流的手机操作系统。2. 百度手机输入法2012 年 5 月,百度手机输入法v3.0 版本发布,新增了语音输入功能;核心技术来自中科院的中科信利,辨识率与准确率都较高。Google产品:1. Voice Actions Voice Actions (技术来自摩托罗拉,后被Google收购)是Google推出的语音搜索应用程序,通过它,你可以用语音给运行Voice Actions的手机下命令,诸如发信息、打电话、听音乐等。它提供了非常坚实可靠的声音识别引擎,识别度较高, 并且它也推出了针对中国用户的中文版。相比 Dragon Dictation,Google公司的这款产品有了一定的智能程度,能够一定程度上听懂人说的话并按人的要求执行相应的操作。虽然还只是一些简单的诸如发信息、打电话、听音乐的指令,但是相对较高的识别率还是让它能够在日常生活中为使用者提供不少方便。2. Google Voice Search Google Voice Search是 Google公司推出的一款全新的搜索产品,谷歌于 2012 年 10 月 30 日更新了iOS 版谷歌搜索应用,新增名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 23 页,共 24 页 - - - - - - - - - 了语音搜索功能。 新版谷歌语音搜索应用能允许用户更快、更容易进行网页搜索。在新版iOS 谷歌搜索应用中,新增加的语音搜索功能已经被改善。不用手动输入,只需简单地说出你想查询的内容,就能快速得到语音回答。 此外该应用的语音识别功能也得以加强,加上谷歌“知识图” (Knowledge Graph) ,语音搜索结果准确。目前iOS版谷歌搜索应用的语音搜索功能仅兼容iPhone 5 ,预计很快就会兼容其它设备例如iPad 和 iPod touch 。三星产品:1. 三星 TTS 语音引擎2. S Voice 语音助手S Voice 是一款语音辅助类的软件,和苹果Siri 语音助手类似。为了保证旗舰手机独特的优势,三星“封杀”了所有其他Android手机访问 S Voice 指令响应 Vlingo 服务器,仅有三星GALAXY S III才能体验到独特的S Voice 语音服务。2012 年 5 月,S Voice 功能遭到了开发者的破解。被破解后,三星 GALAXY Nexus 、HTC One X 等 Android4.0机型也都可以顺利的运行 S Voice 语音助手。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 24 页,共 24 页 - - - - - - - - -

    注意事项

    本文(2022年语音产业调研. .pdf)为本站会员(Q****o)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开