语言清晰度的客观评测精.ppt
语言清晰度的客言清晰度的客观评测第1页,本讲稿共29页主要内容主要内容1 语音清晰度评测的发展概况语音清晰度评测的发展概况语音清晰度评测的发展概况语音清晰度评测的发展概况2 混响作用下混响作用下STIPA与清晰度的关系与清晰度的关系3 噪声环境下噪声环境下STIPA与清晰度的关系与清晰度的关系4 总结与展望总结与展望第2页,本讲稿共29页1.语音清晰度的评测语音清晰度的评测v语音的清晰度或可懂度是音质评价的重要指标语音的清晰度或可懂度是音质评价的重要指标反映反映厅堂或扩声系统的声音传输质量厅堂或扩声系统的声音传输质量v主观评价:主观评价:组织测试队伍实地测试组织测试队伍实地测试(articulation test)优点:直接、真实缺点:耗费人力物力vGB-T 15508-1995 声学声学 语言清晰度测试方法语言清晰度测试方法第3页,本讲稿共29页语音清晰度的客观评价方法语音清晰度的客观评价方法STI%ALconAI主观主观测试测试v尽可能反映真实的尽可能反映真实的清晰度水平清晰度水平第4页,本讲稿共29页清晰度指数清晰度指数 AI (Articulation Index)vFrench&Steinberg(1947),Fletcher(1953),Kryter(1962)1)测量或估计语言频谱和听音人处的噪声有效掩蔽谱计算得到各频带的“有效信噪比”;2)对各频带信噪比进行线性转化至0,1得“贡献值”;3)基于不同频带对清晰度的贡献率加权平均得AI;vANSI Std.S3.5-196919861997v特点特点:特别适用于评价诸如噪声干扰、有限带通噪声干扰、有限带通等频域失真引起的语音清晰度恶化程度,不能反映混响、回声混响、回声或削峰削峰等时域或非线性失真的影响。第5页,本讲稿共29页辅音损失率辅音损失率%ALcon(articulation loss of consonants)v能不能根据测量房间内的某些物理量估计语音清晰度?能不能根据测量房间内的某些物理量估计语音清晰度?vKnudsen(1932),Peutz(1971),Klein(1971)根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。第6页,本讲稿共29页Peutz 公式(经验推导)公式(经验推导)D听音处距声源的距离。单位m。T60混响时间(1400Hz)。单位s。V房间的体积。单位m3。校准值。针对不同水平的听者。1.5%12.5%。Dc临界距离。单位m。v注意:SNR25dB;单个无指向性的点声源(Q=1);第7页,本讲稿共29页Klein对对Peutz公式的补充公式的补充v当房间声学特性难以改善时,采用电声手段提高语音清晰度。当房间声学特性难以改善时,采用电声手段提高语音清晰度。v声源个数声源个数n;声源指向性因子;声源指向性因子Q;虽然提高扬声器的Q值有助于改善语音清晰度,但Q值与清晰度之间是否成简单的线性关系并没有实际的实验数据支持。Jacob(1985)认为语音清晰度与Q并无直接的关联。第8页,本讲稿共29页辅音损失率辅音损失率%ALcon的不足的不足根据实验结果的经验推导,物理基础不够;对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响;没有考虑早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响;Jacob(1985)第9页,本讲稿共29页vHougast&Steeneken(197319801985)vIEC Std.60268-16v充分反映声传递系统性能质量的优劣充分反映声传递系统性能质量的优劣输入端:说话人发音语言传输指数语言传输指数STI(speech transmission index)输出端:听者耳朵语言传输系统:语言传输系统:充分考虑传递过程中噪充分考虑传递过程中噪声、混响、回响、系统声、混响、回响、系统失真等各种干扰因素的失真等各种干扰因素的影响影响Black Box第10页,本讲稿共29页调制转移函数调制转移函数MTF(modulation transfer function)v连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。v传输过程中,噪声、混响、系统失真等会使得包络发生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。第11页,本讲稿共29页MTF的计算的计算v函数定义为声信号经传输后接收信号强度包络的调制度调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。第12页,本讲稿共29页STI的计算的计算v14种调制频率;7种倍频带噪声 作为测试信号v计算98个MTF结果v类似AI计算中的加权平均最终得STI 0,1v根据房间脉冲响应可以直接计算MTF第13页,本讲稿共29页STI与语音清晰度与语音清晰度Steeneken(1980)v不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。v客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。第14页,本讲稿共29页语言传输指数语言传输指数STI的简化算法的简化算法v限制条件:限制条件:无明显非线性失真;环境噪声无脉冲;混响时间频率特性平滑;宽带语言传输系统;v1)RASTI(Rapid STI or Room acoustic STI)适用于不包括扩声系统的厅堂语音传输质量的评价选取了语言谱中比较有代表性的频带和调制频率500Hz1Hz2Hz4Hz8Hz2KHz0.7Hz1.4Hz2.8Hz5.6Hz11.2Hz第15页,本讲稿共29页v2)STIPA(STI for public address)适用于包括扩声系统的厅堂或电声系统的语音传输质量评价选取了7种倍频带载波,每种载波对应2中调制频率125Hz250Hz500Hz1KHz2KHz4KHz8KHz1.0Hz1.0Hz0.63Hz2.0Hz1.25Hz0.8Hz2.5Hz5.0Hz5.0Hz3.15Hz1.0Hz6.25Hz4.0Hz12.5Hz第16页,本讲稿共29页v公共广播系统工程技术规范公共广播系统工程技术规范vSTIPA作为评价公共广播语言传输质量的重要指标作为评价公共广播语言传输质量的重要指标分类STIPA分类STIPA业务广播(一级)0.55紧急广播(一级)0.55业务广播(二级)0.45 紧急广播(二级)0.45业务广播(三级)0.35 紧急广播(三级)0.40第17页,本讲稿共29页2.混响作用下混响作用下STIPA与汉语清晰度的关系与汉语清晰度的关系v对于于“声韵声韵调”结构构语言言汉语,情况是怎,情况是怎样的?的?v目的:目的:在实验室条件下对无噪声纯混响作用下STI-PA与普通话单音节清晰度之间的关系进行实验研究。以期对搞清楚在纯混响作用下普通话单音节清晰度与语言传输指数STI-PA的具体关系有所贡献和帮助。对汉语语音清晰度客观评测方法的发展有着积极的意义。第18页,本讲稿共29页实验方法实验方法v实验室录音、模拟测试的方法v参照声学 语言清晰度测试方法GB-T 15508-1995第19页,本讲稿共29页v混响时间:0.5 s6.0 s,步长0.5 s,共12种混响条件;v发音人2名,听音人11名;声场中心声压级65dBA;v中、后音节受混响作用更明显;第20页,本讲稿共29页实验结果实验结果v混响时间与清晰度、STIPA的关系第21页,本讲稿共29页vSTIPA与普通话单音节清晰度的关系第22页,本讲稿共29页v在实验结果的基础上归纳导出了STI-PA与普通话单音节清晰度之间的关系,此关系对制定扩声系统的STI-PA指标具有实用意义。v实验结果也揭示出汉语普通话单音节清晰度受混响的影响与英语清晰度受混响的影响程度有明显的不同。启示我们在实际工程应用中,在涉及到普通话语音清晰度的评测问题时,对直接引用已有的国际标准或基于外语的研究结果要十分慎重。第23页,本讲稿共29页3.噪声条件下噪声条件下STIPA与汉语清晰度的关系与汉语清晰度的关系v在实验室条件下分析了不同频带范围、不同信噪比的噪声环境下语音清晰度、STI-PA与信噪比的关系,并根据单音节清晰度与语言可懂度的关系,估计了在满足一定可懂度条件下的最低信噪比及相应的STI-PA。v实验室录音、模拟测试的方法v参照声学 语言清晰度测试方法GB-T 15508-1995v采用了全频带白噪声和中心频率为250Hz,500Hz,1KHZ,2KHz,4KHz,8KHz的倍频带噪声作为干扰噪声,各频带噪声分别设置45种信噪比。第24页,本讲稿共29页实验结果实验结果v1)信噪比与清晰度、STIPA的关系(以白噪声为例)第25页,本讲稿共29页v2)等清晰度曲线v不同的噪声条件可能有着相同清晰度水平第26页,本讲稿共29页v工作是在实验室条件下进行的,考虑到实际的应用情况,可能还有一些不完善的地方,比如房间冲击响应的结构是否会对STI-PA与清晰度的关系有明显的影响还需要探讨。实际环境中的噪声种类多样,频率范围丰富,由于条件限制无法一一进行测试。每个频带噪声的信噪比取值区间可以更加细致以获得更为全面的结果。另外本次实验只是在65dBA(标准说话声压级)的噪声水平下进行的,其它噪声水平下的语言清晰度和STI-PA、信噪比的关系是否同本次实验结果一致还需要进一步的研究。第27页,本讲稿共29页4.展望展望STI for Chinese?STI%ALconAI主观主观测试测试第28页,本讲稿共29页第29页,本讲稿共29页