语音信号产生的数字模型课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《语音信号产生的数字模型课件.ppt》由会员分享,可在线阅读,更多相关《语音信号产生的数字模型课件.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于语音信号产生的数字模型第1页,此课件共59页哦2.1 人类的语言器官和语音产生过程人类的语言器官和语音产生过程 人类的语音是由人体发音器官在大脑控制下的生理运人类的语音是由人体发音器官在大脑控制下的生理运动产生的。发音器官包括:肺,喉,声道等。空气由肺部动产生的。发音器官包括:肺,喉,声道等。空气由肺部排入喉部,经过声带进入声道,最后由嘴或鼻辐射出声波,排入喉部,经过声带进入声道,最后由嘴或鼻辐射出声波,形成了语音。形成了语音。鼻腔鼻腔口腔口腔声带声带声门声门第2页,此课件共59页哦Muscle force lung Vocal cords Nose outputMouth outputV
2、elumNasal cavityMouth cavityThe complete physiological mechanism of speech production 声道声道excitationspeech第3页,此课件共59页哦喉的生理结构喉的生理结构 喉位于气管的上端,实际上喉位于气管的上端,实际上是气管末端一圈软骨构成的一是气管末端一圈软骨构成的一个框架,前方稍高处的软骨称个框架,前方稍高处的软骨称为甲状软骨,前后方环成一圈为甲状软骨,前后方环成一圈的称为喉部环形软骨,喉中两的称为喉部环形软骨,喉中两片肌肉称为声带,声带之间的片肌肉称为声带,声带之间的空隙为声门。空隙为声门。当声带
3、张开时,声门打开,当声带张开时,声门打开,空气可自由呼出,正常呼吸就空气可自由呼出,正常呼吸就处于这种情况;当声带闭合,处于这种情况;当声带闭合,声门关闭。声门关闭。甲状软骨甲状软骨声门声门声带声带环形软骨环形软骨人的前方人的前方喉喉第4页,此课件共59页哦 当说话时,声带在软骨的作用下相互靠近但不当说话时,声带在软骨的作用下相互靠近但不完全闭合,声门变成一条窄缝,当气流通过窄缝完全闭合,声门变成一条窄缝,当气流通过窄缝时压力减小,外界压力大,从而两片声带完全闭时压力减小,外界压力大,从而两片声带完全闭合使得气流不能通过,当气流阻断时压力恢复正合使得气流不能通过,当气流阻断时压力恢复正常,推开
4、两片声带,声门再次打开,气流再次流常,推开两片声带,声门再次打开,气流再次流过。过。声带靠拢声带靠拢Tp基音周期基音周期 声带的开启和闭合称为声带的开启和闭合称为振动。这一振动过程周而振动。这一振动过程周而复始,形成了一串周期性复始,形成了一串周期性脉冲气流送入声道。这个脉冲气流送入声道。这个过程发出的音称为浊音。过程发出的音称为浊音。如汉语发音的如汉语发音的aa、ii、uu和和oo等。等。第5页,此课件共59页哦Glottal Closure instant T第6页,此课件共59页哦女声汉语拼音女声汉语拼音a的时域波形的时域波形第7页,此课件共59页哦Tp基音周期基音周期 fundamen
5、tal periodVoiced excitationUnvoiced excitation(声带不振动,声门开启)(声带不振动,声门开启)第8页,此课件共59页哦男声汉语拼音声母男声汉语拼音声母s的时域波形的时域波形第9页,此课件共59页哦 气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,期间的传输通道称为声道。气流流过声道时犹如通过了一期间的传输通道称为声道。气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。成相应位置的峰起,称为共振峰。
6、讲话时,由于舌和唇的连续运动,使讲话时,由于舌和唇的连续运动,使声道形状改变,随即改变谐振频率,使得声道形状改变,随即改变谐振频率,使得发不同的音。声道的不同的形状,对应不发不同的音。声道的不同的形状,对应不同的谐振频率。同的谐振频率。声道声道第10页,此课件共59页哦发音的三种方式发音的三种方式excitationn浊音(浊音(voiced sounds)声带开启和闭合,在声门处声带开启和闭合,在声门处产生一个准周期性脉冲序列产生一个准周期性脉冲序列。(quasi-periodic sequence)n清音(清音(unvoiced sounds)声带完全舒展开来,声道声带完全舒展开来,声道的
7、某个部位发生收缩形成了一个狭窄的通道,当空气流到达此的某个部位发生收缩形成了一个狭窄的通道,当空气流到达此处时被迫以高速冲过收缩区,并在附近产生空气的湍流,类似处时被迫以高速冲过收缩区,并在附近产生空气的湍流,类似于白噪声。于白噪声。(white noise)n爆破音(爆破音(plosive/stop sounds)声带完全舒展开声带完全舒展开来,声道的某个部位完全闭合在一起,当空气流到达时来,声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,一旦闭合点突然开启便会让便在此处建立起空气压力,一旦闭合点突然开启便会让气压快速释放,实际上也是一种空气的湍流。气压快速释放,实际上也
8、是一种空气的湍流。(white noise)第11页,此课件共59页哦 F0=1/Tp,基音频率,由声带的质量来决定基音频率,由声带的质量来决定。F0的大小决定了声音的高低,称为音高。的大小决定了声音的高低,称为音高。男性的男性的F0大致分布在大致分布在:50250Hz 女性和儿童的女性和儿童的F0大致分布在大致分布在:100500Hz基音频率基音频率(Fundamental Frequencypitch)F0 第12页,此课件共59页哦鼻端鼻端嘴唇嘴唇17cm17cm8.5cm13cm13cm声道的无损模型声道的无损模型声道的谐振频率声道的谐振频率format frequency谐振频率发生
9、在:谐振频率发生在:Fn=Fn=(声道的横截面是均匀的,发元(声道的横截面是均匀的,发元音音e e时,声道近似是均匀的。)时,声道近似是均匀的。)L=17cmL=17cm,声道的长度,声道的长度n=1,2,3 n=1,2,3 称为第一共振峰称为第一共振峰F1=500Hz F1=500Hz、第二共振峰、第二共振峰F2=1500Hz F2=1500Hz、第三共振峰、第三共振峰F3=2500Hz F3=2500Hz,c=340m/sc=340m/s2n-12n-14L4Lc第13页,此课件共59页哦基音频率基音频率输出气流的频率输出气流的频率共振峰频率共振峰频率女声英文女声英文a的频谱的频谱第14页
10、,此课件共59页哦男声汉语拼音声母男声汉语拼音声母s的频谱的频谱第15页,此课件共59页哦 一种声道形状对应一套共振峰一种声道形状对应一套共振峰 不同人的声道大小不同,共振峰不同不同人的声道大小不同,共振峰不同 同一人,发不同音,共振峰也不同同一人,发不同音,共振峰也不同总结总结前三个共振峰的大致范围(前三个共振峰的大致范围(Hz)共振峰 成年男子 成年女子 带宽 f1 200800 2501000 4070 f2 6002800 7003300 5090 f3 13003400 15004000 60180第16页,此课件共59页哦 时域波形:幅度时间图。大致得出音节的起始点、清时域波形:幅
11、度时间图。大致得出音节的起始点、清音和浊音以及浊音的基音频率。音和浊音以及浊音的基音频率。女声汉语拼音女声汉语拼音a的时域波形的时域波形第17页,此课件共59页哦 频谱特性:幅度谱图。得出基音周期、频谱特性:幅度谱图。得出基音周期、共振峰频率及其位置。共振峰频率及其位置。女声英文女声英文a的频谱的频谱第18页,此课件共59页哦鼻腔的作用鼻腔的作用 在软腭的帮助下,可使空气经过鼻腔排在软腭的帮助下,可使空气经过鼻腔排除人体外,由此产生的语音称为鼻音。如除人体外,由此产生的语音称为鼻音。如nn、ngng为鼻音韵母,为鼻音韵母,mm、nn、ll为鼻为鼻音声母。音声母。鼻腔是一个谐振腔,由于形状固定,
12、故其鼻腔是一个谐振腔,由于形状固定,故其共振峰频率是确定的。共振峰频率是确定的。第19页,此课件共59页哦Muscle force lung Vocal cords Nose outputMouth outputVelumNasal cavityMouth cavityThe complete physiological mechanism of speech production 声道声道excitationspeech第20页,此课件共59页哦uG(n)Av冲激序列冲激序列发生器发生器声门脉冲声门脉冲模型模型G(z)G(z)随机噪声随机噪声发生器发生器基音周期基音周期TPAu清清/浊音开浊
13、音开关关浊音激励浊音激励清音激励清音激励2.3 语音信号产生的数字模型语音信号产生的数字模型一、激励模型一、激励模型第21页,此课件共59页哦声门脉冲滤波器声门脉冲滤波器N1N2第22页,此课件共59页哦二、声道模型二、声道模型(共振峰模型共振峰模型)短时线性系统短时线性系统声道声道V(z)1.1.级联型级联型(元音元音)V V1 1V V2 2V V3 3V V4 4V V5 5 声道是一组串连的二阶谐振器(一个谐振腔对应声道是一组串连的二阶谐振器(一个谐振腔对应1 1个共振峰频率)。个共振峰频率)。第23页,此课件共59页哦 每个每个传输函数是一个全极点的传输函数是一个全极点的IIRIIR
14、滤波器,这些极点滤波器,这些极点确定了声管的共振峰。若确定了声管的共振峰。若N N取偶数,取偶数,V(z)V(z)一般有一般有N/2N/2对共对共轭极点,轭极点,r rk kexp(j2exp(j2 F Fk kT)T),k=1k=1N/2N/2。各个各个w wk k值分别值分别与语音的共振峰相互对应。与语音的共振峰相互对应。N N的取值一般为的取值一般为8 81212。a ai iz z-1-1z z-1-1b bi ic ci i第24页,此课件共59页哦传输函数传输函数N N为极点个数,为极点个数,G G是是增益参数增益参数,a ak k为常系数。为常系数。T T为采样周期为采样周期第2
15、5页,此课件共59页哦2.2.并联型并联型(大部分辅音大部分辅音)传输函数,传输函数,零极点零极点IIRIIR滤波器滤波器V V1 1V V2 2V V3 3V V4 4V V5 5 零极点零极点IIRIIR滤波器总是可以用全极点滤波器总是可以用全极点IIR IIR 滤波器来代替。因此可以用全极点滤波器来代替。因此可以用全极点模型来表示任何语音。模型来表示任何语音。第26页,此课件共59页哦三、辐射模型三、辐射模型R(z)=RR(z)=R0 0(1-z(1-z-1-1)唇端辐射损耗在高频端较为显著,而在低频端影响唇端辐射损耗在高频端较为显著,而在低频端影响较小,较小,R(z)应具有高通特性。对
16、高频提升大约为每倍频应具有高通特性。对高频提升大约为每倍频程程6dB6dB。第27页,此课件共59页哦四、完整的语音信号的数字模型四、完整的语音信号的数字模型A Av v冲激序列冲激序列发生器发生器声门脉冲声门脉冲模型模型G(z)G(z)随机噪声随机噪声发生器发生器基音周期基音周期T TP PA AN N线性系统线性系统声道声道V V(z z)辐射模型辐射模型R R(z z)清清/浊音浊音开关开关传输函数传输函数第28页,此课件共59页哦传输函数的具体表达式:传输函数的具体表达式:传输函数的具体表达式:传输函数的具体表达式:第29页,此课件共59页哦模型的特点模型的特点 在这个模型中,在这个模
17、型中,T TP P、A Av v、A AN N、清清/浊音开关的位置以及浊音开关的位置以及声道滤波器的参数都是随时间而变化,在声道滤波器的参数都是随时间而变化,在10-30ms10-30ms的时的时间间隔内是保持不变的。这种特性称为短时性。间间隔内是保持不变的。这种特性称为短时性。对于激励信号而言,大部分情况下,这一结论也是正确对于激励信号而言,大部分情况下,这一结论也是正确的,但有些音变化速度特别快,爆破音,取的,但有些音变化速度特别快,爆破音,取5ms比较更为恰比较更为恰当。当。第30页,此课件共59页哦2.4 2.4 语音信号的特性语音信号的特性一、语音的声学特性一、语音的声学特性 语音
18、是发声器官发出的一种声波,具有一定的音色、语音是发声器官发出的一种声波,具有一定的音色、音调和音强和音长。音调和音强和音长。音色音色:又称为音质,是一种声音区别于另一种声又称为音质,是一种声音区别于另一种声音的基本特性。音的基本特性。音调:声音的高低,取决于声波的频率音调:声音的高低,取决于声波的频率 音强:声音的强弱,它由声波的振动幅度所决音强:声音的强弱,它由声波的振动幅度所决定定 音长:发音时间的长短音长:发音时间的长短第31页,此课件共59页哦(1 1)音系简单,在汉语中一个字就是一个音节,由一)音系简单,在汉语中一个字就是一个音节,由一般为般为2 23 3个音素组成,而且具有音素少、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 产生 数字 模型 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内