通用听见智能会议系统建设设计规划方案设计(一体机).doc
《通用听见智能会议系统建设设计规划方案设计(一体机).doc》由会员分享,可在线阅读,更多相关《通用听见智能会议系统建设设计规划方案设计(一体机).doc(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、#*听见智能会议系统听见智能会议系统 建设方案建设方案安徽听见科技有限公司安徽听见科技有限公司 20172017 年年 1 1 月月#*目录1.1.项目概述项目概述.1 1.1. 建设背景 1 1.2. 建设重要性 12.2.建设内容及目标建设内容及目标 .13.3.产品施工条件产品施工条件.24.4.建设方案建设方案.2 4.1. 系统概述 2 4.2. 软件详细配置4 4.2.1.中文语音转写引擎 4 4.2.2.应用系统基本功能 4 4.2.2.1.用户管理 5 4.2.2.2.音频采集处理 5 4.2.2.3.实时语音转写 5 4.2.2.4.历史语音转写 5#*4.2.2.5.内容编
2、辑 6 4.2.2.6.效果优化 7 4.2.2.7.内容展示 7 4.2.2.8.内容管理 8 4.2.2.9.全文检索 8 4.3. 硬件设备配置9 4.3.1.一体式智能会议主机 9 4.3.2.应用端主控电脑 105.5.项目报价项目报价.10#*1.1.项目概述项目概述1.1.建设背景建设背景随着信息时代的到来,海量语音的获取 和存储能力愈发强大,基于会议办公的实 际场景,会存在需要大量的人力投入、工 作效率不高的情况、语音技术在会议场景 中的应用质量和效果不高。 因此,结合会议会务场景对语音技术的 实际应用需求,开展了基于会议场景下的 语音技术应用关键技术研究,突破语音合 成、语音
3、识别、语音转写等核心技术,提 升语音技术在会议会务场景中的应用水平, 切实提升日常会议办公的工作效率和效果。1.2.建设重要性建设重要性语音识别(Speech Recognize )技术, 是让机器通过识别和理解过程使之听懂人 类语言的技术。语音识别技术是信息技术 中人机交互的关键技术,目前已经在呼叫 中心、电信增值业务、企业信息化系统中 有了广泛的应用。随着语音识别在语音搜#*索、语音控制等全新应用领域的深入应用 ,语音识别技术被业界权威人士誉为有可 能引发人机界面领域革命的关键技术。近 年来,语音识别技术取得了长足的进步。 智能会议系统是基于语音识别技术所研发, 可满足会议演讲、会议研讨、
4、沟通交流、 大型会议等一系列需要进行实时文字转写 的场景。 此部分项目的实施主要解决会议记要整 理时间长、会议中心思想因记录人员的理 解而可能出现的偏差、会议录音及关键点 难以查找等问题。项目建成后当天即可完 成所有相关会议记要的整理工作,同时, 每一个人的发言均可记录在纪要当中,可 有效减少因不同原因造成的会议中心内容 理解的偏差,提升纪要整理的效率。2.2.建设内容及目建设内容及目 标标本项目计划选取 1 个会议室分别部署单 机版听见智能会议系统,进行基于会议场 景下的新型语音转写技术的应用,实现会#*议过程中音频实时转写成文字,辅助会议 记录人员进行纪要的整理与校正,实现快 速成稿,在整
5、体上打造样板化智能语音转 写会议室。3.3.产品施工条件产品施工条件听见智能会议系统的部署环境整体要求 如下:电源电源机柜要机柜要 求求音频接音频接 口口麦克麦克 风风视频接视频接 口口环 境 指 标 要 求1.5KW高度: 6U 深度: 500MM 对应机 柜托盘 一个需提供 一路音 频接口, 支持卡 侬公或 大三芯 或双莲 花需配 置麦 克风 对每 个说 话人 声音 进行 采集如需上 屏,需 提供投 屏接口, 支持 HDMI 或 VGA详细说明如下: 环境要求 智能会议系统采用专业定制一体机的硬#*件形态,一体机的安装机柜需要 6U 空间, 安装于正常室外室内即可,设备深度为 500MM,
6、系统本身局域网组建自带,网络 带宽在 100M 以上,主控 PC 需要连接局 域网下使用,整套设备局域网下运行即可。 同时需要 1.5KW 电源。 音视频需求 该系统是基于音频基础上实现语音转写, 麦克风等音响设备利用会议室现有环境。 为实现对现场音频的采集,需要现场音 响设备(调音台或相关音频设备)提供会 议话筒音频供转写,同时设备接口支持卡 侬公、大三芯(6.5) 、双莲花输入。 如有展板上屏需求,需要会议室内配有 投影仪或者电视机,且具备 VGA 或者 HDMI 接口任意一种,展板通过连接投影 仪或者电视机进行投屏展示。4.4.系统连线图系统连线图听见智能会议系统的配套硬件设备,其 形态
7、为:通过国家 CCC 认证和专业定制一 体机+应用端主控电脑。一体式智能会议主#*机为讯飞听见专业定制设备,集成了包括 服务节点、应用节点、声卡、显示器、路 由器等部件,用于部署引擎等核心能力软 件,并提供录音服务处理、数据传递等能 力;主控端笔记本电脑主要用于部署客户 端软件,控制会议的开始和结束,提供软 件各个功能的操作。会议室现场的发言音 频输出给一体机,同时如需显示,一体机 支持显示输出,主控电脑通过网线与一体 机连接,整套产品即可使用。一体机整体外观图示意图及背后面板图 如下:#*参数说明:参数说明: 整机电源:AC 100-240V 700W; 服务器节点:XEON 2.6G 20
8、M 2011P 8CORE,E5-2620 V3*2;32G DDR4 REG/ECC;接口 2*千网口( Intel I210AT ) ,1* RS232,GPIO,Watch dog,VGA-切换器;USB:6*USB(前 置1*USB2.0+后置(2*USB 2.0/2*USB 3.0) ; 应用节点:CORE 3.2G 6M 1151P 4 CORE I5-6500;8G DDR4,2*千兆网 口( Intel 82579V )1*千兆网口( Intel 82579V ) ,1*RS 232,1*VGA,1*PS2,外接:DVI转 HDMI; 坦克声卡:一个麦克风输入并自带音 量增益旋
9、钮,XLR/6.3mm混合式接头 一#*个乐器输入并自带音量增益旋钮, 6.3mm接头 4个模拟输入(RCA接头) 一组唱盘输入并内建RIAA等化放大及 自带音量增益旋钮 6个模拟输出(RCA 接头) 一个耳机接孔(6.3mm接头)并自 带音量增益旋钮 一个光纤数字输出/输 入 一个同轴数字输出/输入 一组MIDI I/O。 产品连线说明:产品连线说明: 本产品为一体机形态,只需要接通一根 电源线、一根音频线、一根视频线,并通 过一根网线连接主控,就可使用。#*5.5.建设方案建设方案5.1.系统概述系统概述听见智能会议系统由软件、硬件共同构 成,实现在会议场景下的实时音频或录音 采集,并通过
10、语音识别技术实时转化为文 字。用户可以通过系统提供延时播放、按 句回听、重点标记等功能方便快速整理出 会议材料;并且通过系统提供的语气词过 滤、自动分段等功能自动优化文字结果; 同时,用户可以使用全文检索功能方便检 索历史音频。系统具备会议音频管理、即 时校对编辑、敏感词屏蔽、转写文字实时 直播等基本功能。一体机主控电脑实时字幕麦克风#*5.2.性能参数性能参数系统关键性能指标如下: 1)转写结果能够实时上屏展示; 2)转写结果能够音字对照、编辑校正; 3)普通话转写指标:安静环境下的标准 普通话转写正确率90%; 4)系统响应指标:常规页面操作的响应 时间5 秒; 5)转写效率指标:实时语音
11、转写效率 500 毫秒。 5.3.软件软件功能功能配置配置5.3.1. 中文语音转写引擎中文语音转写引擎听见智能会议系统需要解决语音转换成 文字的问题。机器语音识别技术是一种实 现从“声音”到“文字”转换的技术,通 过将人的语音直接转换成相应的文本。语 音识别技术的研究工作开始于上世纪五十 年代。Bell 实验室的研究人员利用模拟元 器件提取了语音信号元音共振峰频率变化 的信息,有史以来第一次实现了识别十个 英文数字的语音识别系统-Audry 系统。八#*十年代,Bell 实验室的 Rabiner 等科学家将 原本艰涩难懂的隐马尔科夫模型(Hidden Markov Model-HMM)理论工
12、程化,形成 了较为完善的概率统计模型体系,识别性 能也得到了很大的提高。2006 年以来 Deep Learning 理论和技术成为了模式识别 领域的一个热门研究方向,G. E. Hinton 等 深入研究了深度置信网络(Deep Belief Network-DBN)以及深度神经网络(Deep Neural Network-DNN)等模型结构,微软 通过与 Hinton 合作率先将 DNN 应用于语 音识别任务,识别性能取得了显著提升。 此后谷歌、蒙特利尔,以及 IBM 又将循环 神经网络(Recurrent Neural Netwok- RNN)成功应用于语音识别领域,特别是 长短时记忆(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通用 听见 智能 会议系统 建设 设计 规划 方案设计 一体机
限制150内