普通话测试中系统神经网络评分机制算法的实现,普通话论文.docx
《普通话测试中系统神经网络评分机制算法的实现,普通话论文.docx》由会员分享,可在线阅读,更多相关《普通话测试中系统神经网络评分机制算法的实现,普通话论文.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、普通话测试中系统神经网络评分机制算法的实现,普通话论文在提升国家普通话水平测试系统评分性能,改良系统评分机制这项研究工作中,语音辨别是关键技术,而声学特征的提取与选择是语音辨别的一个重要环节.为此,在文献1中,笔者提出了一种根据噪声污染情况自适应选取不同策略滤波的算法.首先判定噪声点,然后对轻度噪声污染语音采取梯度法滤波,对中度污染语音采取信号点中值滤波,对重度污染语音采取基于直方图信息的加权均值虑波.该算法在整个噪声率范围内都有效,无需设定参数,自适应能力强.但本文算法针对的是较为理想的干扰噪声模型,其噪声点为0或255,且均匀分布.假如原语音中包含很多取值为0或255的点,该算法将导致语音
2、失真,且不能直接应用于高斯噪声和脉冲噪声点在0到255之间随机取值的语音.除此之外,笔者在实践中又提出一种噪声检测的有效算法:对噪声点,取所定义的12个梯度值中最小梯度对应邻域音素决定噪声点处的功率值,对信号点保持原值.实验结果表示清楚,噪声率低于0.2,十分是在语音中存在黑、白细线时,新算法在滤除噪声的同时很好地保卫了语音细节.但对严重干扰噪声污染语音,该算法中的直线检测存在局限性.在实际测试中,笔者还使用了基于开关滤波思想的算法.首先,采用改良的极值检测法检测语音噪声,建立噪声标记矩阵;然后,根据语音局部噪声污染情况自适应选择不同策略滤除噪声;最后,利用误检音素修正,极大地减少了对信号点的
3、误滤波操作,但是实现应用较为有限. 随着语音应用环境的日趋复杂化,十分是在环境噪声和干扰对语音辨别有严重影响的情况下,往往会致使语音辨别率极大降低,此时滤波算法已经不能知足要求.当前来看,新的普通话测试系统优化主要有如下几方面存在的问题需要解决:(1).对自然语言的辨别和理解.首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则.(2)语音信息量大.语音形式不仅对不同的讲话人不同,对同一讲话人也是不同的.(3)语音的模糊性.讲话者在讲话时,不同的词可能听起来是类似的.这在英语和汉语中常见.(4)单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等.
4、 为此,本文讨论在普通话测试中引入系统神经网络评分机制(PSCAI)来有效的解决上述问题,因其所采用的是基于反向传播法(BP算法)的多层感悟网络,具有区分复杂的分类边界的能力,特别有助于形式划分. 1 PSCAI算法实现 与传统的神经网络不同,普通话测试系统神经网络评分机制PSCAI是一种完全基于神经元连接的网络模型.十分是在评判各地区不同的语音时,网络中的每一个神经元都唯一代表一种语音形式,每当接收新语音形式时,其会自动建立一个新的连接,把信息存储在网络中;而当接收到的是已有的语音形式时,已有的神经元连接得到加强.当形式神经元的输出到达所设定的感觉阈值时,对应形式的信息被记忆.因而,PSCA
5、I能不断地接收、存储各种信息,并把感觉足够强的形式记忆下来,这一经过更接近于人脑的学习、记忆经过.PSCAI在学习新知识时不会影响已有的知识,同时具有很强的辨别能力. 1.1 PSCAI算法引入 图1(a)是一个3输入2输出的单层感悟器.模拟人工测试评分的规律,我们构建了新的PSCAI神经网络,如此图1(b)所示.乍看起来,二者并没有什么明显的不同,但事实上存在着本质上的差异不同.在图1(a)中,利用了编码的概念,即两个输出共有22=4个不同的状态,代表四种语音形式.这样的连接确实能够节省神经元的数量,但却是以增加计算的复杂性为代价的.从网络的工作算法能够看出,输入与输出之间是根据连接权向量构
6、成的一种映射关系,而学习经过实际上就是使输入、输出之间关系从不确定到确定的经过.假如在原有语音知识集中参加新的语音知识,那就要重新选择连接权向量,这样一来,在学习新语音知识的时候可能会影响原有的语音知识,更主要的是,随着语音知识集的扩大,也就是网络规模的增加,每次学习新语音知识所进行的运算量会越来越大.而人工测试评分的规律是,已有的、与新知识相关的知识越丰富,学习、记忆新知识就越快、越容易,而与新知识毫不相关的内容则不受任何影响.【图1】 1.2 PSCAI神经元之间的连接规则 以图1(b)为例,每当第一次接收到某个形式xj=(x1,x2,x3) 0,13 1,就会有一个神经元j把所有处于兴奋
7、状态的输入层神经元连接起来,例如,神经元1、2、3分别对应的输入为(1,1,0),(1,0,1),(1,1,1).神经元j的输出能够表示为:【1】 通过这种连接规则,yj就是输入语音形式xi的响应,其大小反映了神经网络对该语音形式的响应程度,也就是 大脑 对该语音形式的感觉强度.一旦某个神经元在某个语音形式输入鼓励下建立起了一个连接,这个神经元就会被这个输入语音形式所 占有 ,而不会再改变连接形式,即:这个语音形式就永久保存在神经网络中.因而,我们把这样的神经元称为 PSCAI神经元 .这样,一种形式与一种连接是一对一的关系,也具体表现出了神经元之间存在的竞争机制. 1.3 PSCAI神经元之
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内