MOS-语音质量评测指标的介绍(共10页).doc

上传人：飞****2

文档编号：14493164

上传时间：2022-05-04

格式：DOC

页数：10

大小：450KB

( 4.5 )

《MOS-语音质量评测指标的介绍(共10页).doc》由会员分享，可在线阅读，更多相关《MOS-语音质量评测指标的介绍(共10页).doc（10页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、精选优质文档-倾情为你奉上MOS语音质量评测指标的介绍专心-专注-专业- 目录 -1前言32语音质量测量和量化标准的发展史33MOS语音质量量化的定义44PESQ评估方法的介绍44.1PESQ的基本原理44.2PESQ的应用55MOS的测试方法65.1NEMO Outdoor65.1.1测试系统的要求65.1.2测试系统的解决方案65.2NetQual85.2.1测试系统的组成85.2.2语音质量的测试95.3TEMS INVESTIGATION106MOS测量的优化建议111 前言直到现在，GSM网络的最主要基本业务仍然是语音业务，语音质量的好坏直接影响用户对于运营商的选择；另外，随着移动网

2、络发展的日趋成熟，客户对网络的性能质量要求逐渐提高。因此，根据电信网络服务质量(QoS) 的要求，建立一套客观评估标准，如何更好地对网络的语音服务质量进行定量分析和测量就逐步摆在了网络运营商的面前。语音服务质量的测量与通常移动网络的信号质量测量有很大的区别。在GSM网络中,对无线质量的评价是通过RxQual 来实现的。但是语音在GSM网络中是经过信道及信源编码的，而RxQual 只能描述空中接口的传输质量，并不能给出终端用户对无线网络的实际感受，语音服务质量的测量将更好地反映用户对网络的真实感受情况。本文将就语音QoS的测量方法进行较深入地讨论。2 语音质量测量和量化标准的发展史目前语音QOS

3、测试方法主要有主观测试方法和客观测试方法两种，ITUTP.800定义了MOS的主观测试方法，客观测试方法主要有：PSQM、PSQM、PESQ等。其中ITU-TP.862（PESQ）是目前ITU推荐用于端对端网络语音质量测试的方法。早期语音质量的评测主要采用主观评分的方式：调查用户被要求按照1-5分对接收到的电话语音质量进行评分（5表示最好，1表示最差）。这种主观判断评测法由ITU组织在1996年8月制定为标准，其P.800标准详细定义了这种MOS评测法（Mean Opinion Score）。但是，这个主观方法存在的最大问题就是，在现实中，让一组人接听语音和评价语音的质量实现起来是非常困难和昂

4、贵的，因此人们在不断的探索能进行客观测量的方法。MOS方法是一种模糊的评估方法，因此ITU-T在建议P861中又提出了PSQM（Perceptual Speech Quality Measurement）方法。根据P861提出的PSQM方法，语音质量的测试开始摆脱原始的人类主观评估，而开始使用计算机产生的波型文件（Wave File），通过比较其通过通信网络传输前后的变化计算出PSQM中相对应的级别及好坏程度。ITU组织在2001年2月发布了新的语音传输质量测量标准：P.862 PESQ （Perceptual Evaluation of Speech Quality）。PESQ是评价各类端对

5、端网络条件和语音编码与解码的最新标准。PESQ可以根据一些感知标准来客观地评价语音信号的质量，从而提供可以完全量化的语音质量衡量方法，而这些衡量标准又是与人类对语音质量的感受完全吻合的。PESQ由荷兰的KPN公司和英国电信公司协作开发的，比其前身PSQM（Perceptual Speech Quality Measurement, ITU-T P.861）有了长足的进展。下面的介绍将主要针对PESQ测量方法进行更多详细的阐述。3 MOS语音质量量化的定义发明电话开始，语音质量的测量方式是凭主观的，人们摘起一个电话，然后由人耳来感知语音的好坏，这个方法是被广泛认同的。基于该主观评测，人类接听和感

6、知语音质量的行为被调研和量化，接听何种级别质量的语音，得到多少平均主观值MOS，人类将起主要的反映作用。采用MOS（平均主观评分）方法评价语音质量，评测方法在ITUTP.800中定义。MOS值的定义如下表所示：级别MOS值 MOS值用户满意度优 4.05.0 很好，听得清楚，延迟很小，交流流畅。良 3.54.0 稍差，听得清楚，延迟小，交流欠缺顺畅，有点杂音。中3.03.5还可以，听不太清，有一定延迟，可以交流。差1.53.0勉强，听不太清，延迟较大，交流重复多次。劣01.5 劣01.5极差，听不懂，延迟大，交流不通畅。一个平均主观值MOS是4或更高，被认为是比较好的语音质量，而若平均主观值

7、MOS低于3.6，则大部分接听者不能满意这个语音质量。平均主观值MOS是广泛认同的语音质量量化标准；因此，无论采用何种方法所有测量方法都必须将它们的结果最终对应到平均主观值MOS，如实际中采用到的PESQ（语音质量的知觉评估）客观测试方法。4 PESQ评估方法的介绍PSEQ工具是用来计算语音样本的MOS-LQO （Mean Opinion Score Listening Quality Objective）值，PESQ把在信号传输通过设备时提取的输出信号与参照信号进行比较计算出差异值。一般情况下，输出信号和参照信号的差异性越大，计算出的MOS参数值就越低。实验证明其计算结果和主观评分结果是基本

8、一致的。4.1 PESQ的基本原理下图是PESQ模型的结构图：如图所示，开始时两个信号都通过电平调整，再用输入滤波器模拟标准电话听筒进行滤波(FFT)。然后对这两个信号进行时间上的校准，并通过听觉变换，这个变换包括对系统中线性滤波和增益变化的补偿和均衡。为了获得主观和客观之间的较高关联性，再输入到认知模型，最后得到质量评分。电平调整：各个待测系统的增益一般差别比较大，而且对参考信号没有确定的校准电平，所以有必要将二者调整到统一、恒定的电平上来。输入滤波：感知模型必须考虑人听到的实际声音，在PESQ中使用了滤波器，起到一个模拟电话手柄的作用。时间调整和校准：假设系统的时延是分段恒定的，在静默期间

9、和说话期间时延可以改变，对每一段话语都给出延时估计，然后得出听觉变换要用的一帧一帧的延时。PESQ中的听觉变换是一个生理声学模型，它对信号进行时间-频率映射，以及频率和强度偏差处理，变化成时频可感知的响度表达。扰动处理：计算参考信号与失真信号间的绝对差值。计算PESQ的得分：处理的结果经认知模型，最终给出了客观语音质量的评估得分。PESQ的值一般落在1.0和4.5之间，在失真情况严重时，得分可能会低于1.0，但这种情况很少见。4.2 PESQ的应用PSQM只用在窄带编解码测量中，并且对某些类型的编解码、背景噪声和端到端的影响，比如滤波和时延变化不能给出精确的预测值。而PESQ关注到端对端的行为

10、影响，并包括滤波和变化时延造成的影响。PESQ能提供比PSQM与主观意见更好的相关性，它能在很广范的条件下对主观质量给出了很精确的预测，包括背景噪声、模拟滤波、和时延变化等。ITU-T相关的资料已证明PESQ是能够给出精确的预测值的。PESQ适用于目前所知的所有移动通信技术，如GSM、CDMA、3G等，以及编码器语音质量的测量，如AMR。5 MOS的测试方法现阶段，许多主流测试仪器厂商先后推出了支持PESQ测量算法的测试系统，下面将主要介绍几个厂家的MOS测量相关解决方案。5.1 NEMO OutdoorNEMO Outdoor测试系统通过增加简单的语音模块，可以支持最新的PESQ语音质量测量

11、。NEMO的语音模块实现发送和接收测试样本，并完成测试终端间相互同步的需求。5.1.1 测试系统的要求测试终端方面，要求测试手机应该有一个模拟音频接口，刚开始时仅NOKIA6650手机支持，但如果其他DKU-2类型手机的测试软件能将音频信号连接到手机底部的连接端，那么这些手机也将支持语音质量的测试。另外，接下来Sagem OT290和Nokia DKU-5类型手机也将支持语音质量的分析。手提电脑方面，对内存、电源的要求跟其他Nemo Outdoor系统一样；多任务操作要求便携的性能要好；除非安装了MMAC2设备，否则每个Nemo Audio Module（语音模块）要求一个RS232接口，以及

12、额外的一个USB端口。其他如Nemo Audio Module、适配的音频/信令跟踪数据线等。5.1.2 测试系统的解决方案手机手机的测量语音质量测试中，终端可以单独连接到电脑，也可以通过MMAC2设备连接。当有多个测试终端需要同时连接时，就要用到MMAC2设备。语音模块单元需要安装在MMAC2设备最上面的槽位，这样它们才能取得电源供应。当然语音模块也可以单独使用，这时需要其他外部电源给它供电，或使用最近的USB端口给它供电。这种情况下的测试流程如下：1. 将一个参考样本更新到每个语音模块中。2. A测试手机呼叫B测试机，连接建立好后，A手机开始发送参考样本，而B手机开始接收。3. 一旦接收

13、端接收到所有的样本，立即计算出PESQ的得分。4. 然后，根据测试模式，A手机继续发送样本（单一TX发送模式），或者A手机随后变成接收方（双向模式）。就这样不断重复发送和接收直到测试结束。手机固网的测量这种情况下的测试流程如下：1. 语音模块的参考样本更新2. 测试手机呼叫Nemo Audio Test Server（音频测试服务器）其中一个固定号码。连接建立后，服务器开始发送测试样本，手机端则开始接收。3. 当一个完整的样本接收好后，Nemo Outdoor将计算PESQ的得分。4. 以上测试步骤将不但重复，直到测试结束。手机固话的测量手机固话的测试方法跟固话手机的测试方法类似，不同的是

14、音频测试服务器将作为接收端，并评估PESQ的得分。这些结果是手机上行质量的得分，所以应该在后台处理时插入无线端的终端测量文档，或者在测试时实时使用一个同步数据将测试文件传送上来。其他方面的测量Nemo语音测试系统还提供支持POC和VoIP语音质量测试的解决方案。5.2 NetQualNetQual是 SwissQual的Qos测量套件，合成了分组数据和语音质量测量以及分析工具，适用于测量和分析无线或有线的电路交换和分组交换网络。NetQual提供了IP、PSTN和ISDN接口，可以连接2G、2.5G和3G多种终端。5.2.1 测试系统的组成NetQual测试系统是由几个子系统组成的： NQM

15、P-NetQual Measurement Probe测量终端 NQMS-NetQual Media Server媒体服务器 NQTM-NetQual Test Manager测试管理服务器 NQDI-NetQual Post-processing System后台处理服务器下图是一个NetQual系统组成的示意图：下图是该系统测试终端的图例：5.2.2 语音质量的测试Squad是SwissQual测试家族中可选模块，它的测量考虑所有可能降低语音质量的主要因素，并能分析出那个因素将导致质量的下降。Squad是集成在NetQual中，实现多种语音测试的要求： SQuad-LQ for Liste

16、ning Quality下行语音质量的测量 SQuad-SS for Silence Suppression静音压缩 SQuad-NS for Noise Suppression噪声的抑制 SQuad-EC for Echo Canceller Quality回声抑制的质量 SQuad-ECP for Echo Detection回声的监测 SQuad-DT for Double Talk Quality含混语音的质量下表是SwissQual针对语音质量评估和数据测试为NOKIA提供了两个解决方案：Node 1Node 2Dell lap top configured with - NQMP

17、Measurement Probe- NQDI Post Processing system- NQMS Voice ResponderDell lap top configured with - NQMP Measurement Probe- NQMS UDP and Voice Responder Supported Tests:Speech Quality Test (SQuad-LQ)Noise Suppression Test (SQuad-NS)Silence Suppression Test (SQuad-SS)Echo Cancellation Test (SQuad-EC)E

18、cho Passive Test (SQuad-ECP)Double Talk Test (SQuad-DT)Inband Round Trip Time TestIP trace TestFTP TestUDP TestHTTP TestEMAIL TestPING TestPING Trace TestSupported Tests:Speech Quality Test (SQuad-LQ)Noise Suppression Test (SQuad-NS)Silence Suppression Test (SQuad-SS)Echo Cancellation Test (SQuad-EC

19、)Echo Passive Test (SQuad-ECP)Double Talk Test (SQuad-DT)5.3 TEMS INVESTIGATIONTEMS Investigation 网络测试软件暂不支持PESQ，但提出了一个用于表达终端用户对话音质量直接感受的指标SQI。SQI 用于表达语音由于无线链路传输造成的失真度。该算法考虑诸多的无线参数，包括BER、FER、切换频率、切换状态、DTX 是否激活，以及所用的编码器等，从而给出最终的语音质量评估值SQI。SQI 的取值范围从20 到30 ，从小到大其语音质量逐步提升。它与另一种国际通用的语音评估方法MOS 之间有直接的对应关系

20、。现给出一个简单的对应表：SQIMOS-201.0101.46183.67193.76213.91304.24这里需要指出的是对于不同的编码器类型，SQI 是有上限的。对于半速率编码器而言，SQI 的上限为19，而全速率则为21，增强型全速率为30 。这是因为不同的编码方法对数据的压缩是不同的，从而造成的语音失真也是不同的。通常我们认为当SQI 小于0 时语音质量为不可接受，当SQI 大于0 而小于18 时语音质量为可接受，当SQI 大于18 时语音质量为良好。当然这只是我们的一个推荐值，大家在实际工作中可以作更详细的划分。另一个测试系统TEMS Benchmarker 最新推出带有PESQ测定算法的新版本，即TEMS Benchmarker 5.0。TEMS Benchmarker可执行QoS测试，对比性网络性能评比，及在众多网络中进行竞争性的评比和工程分析工作。除此之外，已发行的TEMS DeskCat 5.3 版本是特别为支持TEMS Benchmarker 5.0而推出的应用工具。当两种工具合作使用时，它们能够给予用户那种只有PESQ才能实现的准确的捕获和后处理性能。这里不做更详细的介绍。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: MOS 语音质量评测指标介绍 10

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：MOS-语音质量评测指标的介绍(共10页).doc
链接地址：https://www.taowenge.com/p-14493164.html