《7.Spectrogram of Speech.ppt》由会员分享,可在线阅读,更多相关《7.Spectrogram of Speech.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Human Features for Speech ProductionTopicsTheproductionofspeech.TheclassificationofspeechShort-Time Speech AnalysisSegments(orframes,orvectors)aretypicallyoflength20ms.Speechcharacteristicsareconstant.Allowsforrelativelysimplemodeling.Oftenoverlappingsegmentsareextracted.BBBBB=1/NShort time ACF(Auto
2、Correlation Function)ACF|DFT|/m/ow/s/Speech AnalysisFundamentalFrequencyTp基音周期基音周期a、i、u和和oSpeech Analysis女声汉语拼音女声汉语拼音a的时域波形的时域波形Feature of Vocal TractFormantThe SpectrogramAclassicanalysistool.ConsistsofDFTsofoverlapping,andwindowedframes.Displaysthedistributionofenergyintimeandfrequency.istypically
3、displayed.The Spectrogram Cont.彩色语谱图发“ah.”时的单元音/a/发“eye”时的双元音/ai/发音“real”发音“mean”Linear Prediction AnalysisLinearPrediction1947年维纳提出;1967年板仓等人应用于语音分析与合成;语音信号处理与分析的核心技术提供了预测功能;提供了声道模型和声道模型的参数估计方法;基本思想:语音样本之间存在相关性,一个语音信号的样本可以用过去若干个样本的线性组合来逼近;Basic Principles将信号看作某一模型(系统)的输出;用模型参数来描述信号;全极点模型(AR,Autoreg
4、ressive)语音信号的模型语音信号的模型常用来产生合成语音,所以称为合成滤波器求解滤波器参数和G的过程就是线性预测的分析过程。线性预测方程组的建立线性预测方程组的建立逆虑波法 线性预测器逆滤波器短时预测均方误差预测阶数预测阶数P的确定的确定利用线性预测方法估计的一个结论利用线性预测方法估计的一个结论结论:如果已知s(n)确实是由全极点模型产生的,那么最佳预测阶数应该是p=p,最佳预测系数应该是相应线性预测的系数结论的证明结论的证明按照全极点模型的表示可以得到考虑误差序列e(n)是白噪声的情况,这时候序列e(n)的各个样点值相互统计独立,不难导出f(n)和g(n)相互统计独立实现这一点的充分
5、必要条件是下面的两项中任一项成立。如果全极点模型的阶数p预知,则可以设置预测阶数p=p。如果阶数p不能确定,则可以采用尝试的方法,观察随着p的变化情况,显然,当p=p时,再增加p就不能使其下降可确定预测阶数p。实际的语音序列s(n)并不都是完全符合全极点理想模型。当s(n)不是由理想全极点模型产生时,这种情况下提高p值总可以改善逼近效果。在语音信号处理领域中,模型阶数p一般选择在812之间。一般而言,当语音采样率为6.667kHz时,选P=8;采样率为8KHz时,选P=12。要想使模型的假定较好的符合语音的实际产生模型主要考虑两个因素:模型的阶数要与共振峰的个数相吻合;声门脉冲形状和口唇辐射影响的补偿。考虑了上述两个因素的线性预测分析,预测误差序列近似于白噪声序列,表明由某一短时信号所得到的线性预测系数能较好的描述产生这段语音的声道特性。线性预测阶数P的选择P的选择应综合考虑谱估计精度、计算量、存储量;原则:保证有足够的极点来模拟声道的谐振结构每kHz一个共振峰,每共振峰需要两个极点,外加几个逼近零点的极点;经验公式:分析帧长N的选择N小,计算量小;N大,估计谱的精度高;N可取23个基音周期长度;自相关解法自相关解法短时平稳,加窗处理,利用短时自相关函数 线性预测方程组的解法Yule-Walker方程,Toeplitz矩阵;Levinson-Durbin递推算法
限制150内