语音信号处理第2章.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《语音信号处理第2章.ppt》由会员分享,可在线阅读,更多相关《语音信号处理第2章.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.12.1概述概述2.22.2语音和语言语音和语言2.32.3汉语语音学汉语语音学2.42.4语音生成系统和语音感知系统语音生成系统和语音感知系统2.52.5语音信号生成的数学模型语音信号生成的数学模型2.62.6语音信号的特性分析语音信号的特性分析2.1 2.1 概述概述v语音信号处理语音信号处理是研究用数字信号处理技术对语音信号进行处是研究用数字信号处理技术对语音信号进行处理的一门学科。它的目的一是要通过处理得到一些反映语音理的一门学科。它的目的一是要通过处理得到一些反映语音信号重要特征的语音参数以便高效的传输或储存语音信号信信号重要特征的语音参数以便高效的传输或储存语音信号信息;二是要
2、通过处理的某种运算以达到某种用途的要求,例息;二是要通过处理的某种运算以达到某种用途的要求,例如人工合成出语音、辨识出讲话者、识别出讲话的内容等等。如人工合成出语音、辨识出讲话者、识别出讲话的内容等等。因此,在研究各种语音信号数字处理技术应用之前,首先需因此,在研究各种语音信号数字处理技术应用之前,首先需要了解语音信号的一些重要特性的知识,在此基础上才可以要了解语音信号的一些重要特性的知识,在此基础上才可以建立既实用又便于分析的语音信号产生模型和语音信号感知建立既实用又便于分析的语音信号产生模型和语音信号感知模型等,它们是贯穿整个语音信号数字处理的基础。模型等,它们是贯穿整个语音信号数字处理的
3、基础。2.22.2语音和语言语音和语言v人们讲话时发出的话语叫人们讲话时发出的话语叫语音语音,它是一种声音,具,它是一种声音,具有称为声学特征的物理特性。有称为声学特征的物理特性。语音(语音(SpeechSpeech)是是声声音(音(AcousticAcoustic)和和语言(语言(LanguageLanguage)的组合体。可的组合体。可以这样定义语音:语音是由一连串的音组成语言的以这样定义语音:语音是由一连串的音组成语言的声音。声音。v人的说话过程人的说话过程可以分为五个阶段:(可以分为五个阶段:(1 1)想说阶段)想说阶段(2 2)说出阶段()说出阶段(3 3)传送阶段()传送阶段(4
4、4)理解阶段()理解阶段(5 5)接收阶段接收阶段 2.2 2.2 语音和语言语音和语言v人的说话的过程人的说话的过程:2.2 2.2 语音和语言语音和语言v语言语言是从人们的话语中概括总结出来的规律性的符是从人们的话语中概括总结出来的规律性的符号系统。包括构成语言的语素、词、短语和句子等号系统。包括构成语言的语素、词、短语和句子等的不同层次的单位,以及词法、句法、文脉等语法的不同层次的单位,以及词法、句法、文脉等语法和语义内容等。和语义内容等。语言学是语音信号处理的基础。语言学是语音信号处理的基础。v语音学语音学(Phonetics)(Phonetics)是研究言语过程的一门科学。它是研究言
5、语过程的一门科学。它考虑的是语音产生、语音感知等的过程以及语音中考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类等问题。各个音的特征和分类等问题。现代语音学发展成为现代语音学发展成为三个主要分支:发音语音学、声学语音学、听觉语三个主要分支:发音语音学、声学语音学、听觉语音学。音学。2.2 2.2 语音和语言语音和语言v语音语音是人的发声器官发出的一种声波,它具有一定的音色,是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。其中,音色也叫音质,是一种声音区别音调,音强和音长。其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。音调是指声音的高低,它取决于于另一
6、种声音的基本特征。音调是指声音的高低,它取决于声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声音的长短叫音长,它取决于发音时间的长短。声音的长短叫音长,它取决于发音时间的长短。v说话时一次发出的,具有一个响亮的中心,并被明显感觉到说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫的语音片段叫音节(音节(SyllableSyllable)。一个音节可以由一个。一个音节可以由一个音素音素(PhonemePhoneme)构成,也可以由几个音素构成。音素是语音发构成,也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有
7、语音的音的最小单位。任何语言都有语音的元音(元音(VowelVowel)和和辅音辅音(ConsonantConsonant)两种音素。两种音素。2.2 2.2 语音和语言语音和语言v说话时一次发出的,具有一个响亮的中心,并被明显感觉到说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫的语音片段叫音节(音节(SyllableSyllable)。一个音节可以由一个。一个音节可以由一个音素音素(PhonemePhoneme)构成,也可以由几个音素构成。音素是语音发构成,也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的音的最小单位。任何语言都有语音的元音(元音(Vowe
8、lVowel)和和辅音辅音(ConsonantConsonant)两种音素。两种音素。v当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过,这种音称为去时,这些声腔完全开放,气流顺利通过,这种音称为元音元音。v呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素称为称为辅音辅音。发辅音时由声带是否振动引起浊音和清音的区别,。发辅音时由声带是否振动引起浊
9、音和清音的区别,声带振动的是声带振动的是浊音浊音,声带不振动的是,声带不振动的是清音清音。2.2 2.2 语音和语言语音和语言v决定元音音色的主要因素是舌头的形状及其在口腔中的位置决定元音音色的主要因素是舌头的形状及其在口腔中的位置(简称简称舌位舌位)、嘴唇的形状、嘴唇的形状(简称简称口形口形)等。元音的另一个重要等。元音的另一个重要声学特性是声学特性是共振峰(共振峰(FormantFormant)。共振峰参数是区别不同元。共振峰参数是区别不同元音的重要参数,它一般包括音的重要参数,它一般包括共振峰频率(共振峰频率(Formant Formant FrequencyFrequency)的位置和
10、的位置和频带宽度(频带宽度(Formant BandwidthFormant Bandwidth)。)。v一般地说,虽然就语音的基音频率而言是女声和童声高于男一般地说,虽然就语音的基音频率而言是女声和童声高于男声,但是实验表明:区分语音是男声还是女声、是成人声音声,但是实验表明:区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。还是儿童声音,更重要的因素是共振峰频率的高低。2.2 2.2 语音和语言语音和语言v从上面的介绍可以总结出发音器官产生元音的条件,即从上面的介绍可以总结出发音器官产生元音的条件,即声道受到声带声道受到声带振动的激励引起共振;振动的激励引起共
11、振;在语音流的持续过程中,声道不发生极端的狭在语音流的持续过程中,声道不发生极端的狭窄,并维持较稳定的形状;窄,并维持较稳定的形状;和鼻腔不发生偶合,声音只从口腔辐射出和鼻腔不发生偶合,声音只从口腔辐射出去。这三个条件中,只要缺少其中之一,则该语音就是去。这三个条件中,只要缺少其中之一,则该语音就是辅音辅音。辅音没有。辅音没有明确的共振峰结构。辅音发音时的阻碍的位置叫明确的共振峰结构。辅音发音时的阻碍的位置叫调音点(调音点(Place of Place of ArticulationArticulation)、阻碍的方法叫、阻碍的方法叫调音方式(调音方式(Manner of Articulat
12、ion Manner of Articulation)。)。v调音方式等的不同可以把辅音分成如下几类:塞音、摩擦音、塞擦音、调音方式等的不同可以把辅音分成如下几类:塞音、摩擦音、塞擦音、鼻音、边音、颤音、通音。鼻音、边音、颤音、通音。根据发辅音时声带有无振动,可以把辅音分根据发辅音时声带有无振动,可以把辅音分类成浊辅音和清辅音。根据辅音除阻后是否紧跟着送出一股气来,可以类成浊辅音和清辅音。根据辅音除阻后是否紧跟着送出一股气来,可以把辅音分类成送气辅音和不送气辅音。把辅音分类成送气辅音和不送气辅音。2.3 2.3 汉语语音学汉语语音学汉语语音的特点汉语语音的特点:v音系简单。这是指音素少、音节少
13、。音节的结构也比较简单。音系简单。这是指音素少、音节少。音节的结构也比较简单。v由于清辅音多,而且多是弱清音,而且开口呼的音节占全部由于清辅音多,而且多是弱清音,而且开口呼的音节占全部音节的一半以上,所以汉语语音听感上有清亮、高扬和舒服、音节的一半以上,所以汉语语音听感上有清亮、高扬和舒服、柔和的感觉。柔和的感觉。v有鲜明的轻重音和儿化韵,所以字词分隔清楚,语言表达准有鲜明的轻重音和儿化韵,所以字词分隔清楚,语言表达准确而丰富。确而丰富。汉语的拼音方法汉语的拼音方法v汉语由音素构成声母或韵母。有时,将含有声调汉语由音素构成声母或韵母。有时,将含有声调(汉语通常认为有五个声调)的韵母称为(汉语通
14、常认为有五个声调)的韵母称为调母调母。由。由单个调母或由声母与调母拼音成为单个调母或由声母与调母拼音成为音节音节。汉语的一。汉语的一个音节就是汉语一个字的音,即音节字。由音节字个音节就是汉语一个字的音,即音节字。由音节字构成词(其中主要是两音节字构成的两字词,约占构成词(其中主要是两音节字构成的两字词,约占74%74%),最后再由词构成句子。国际上,都是用音标),最后再由词构成句子。国际上,都是用音标来描述拼音过来描述拼音过程的。汉语也不例外。汉语拼音的音程的。汉语也不例外。汉语拼音的音标包括:声母表、韵母表和声调符号等。标包括:声母表、韵母表和声调符号等。汉语音节的一般结构汉语音节的一般结构
15、 v汉语音节一般由汉语音节一般由声母声母、韵母韵母和和声调声调三部分组成。三部分组成。汉语普通话汉语普通话中有中有60006000多个常用字,每个汉字是一个音节,如将同音字合多个常用字,每个汉字是一个音节,如将同音字合一处理,则汉语中共有一处理,则汉语中共有13321332个有调音节,其中可以单念的有个有调音节,其中可以单念的有12681268个。汉语中一般有五个声调,即阴平、阳平、上声、去个。汉语中一般有五个声调,即阴平、阳平、上声、去声以及轻声。如果不考虑声调,则汉语中无调音节共有声以及轻声。如果不考虑声调,则汉语中无调音节共有407407个。个。v汉语音节的一般结构,由汉语音节的一般结构
16、,由9 9个部分组成。其中个部分组成。其中1 14 4段属于声段属于声母(辅音),母(辅音),6 69 9段属于韵母(元音),第段属于韵母(元音),第5 5段是二者的过段是二者的过渡段。一个音节可能只包含里面的某几段,但是第渡段。一个音节可能只包含里面的某几段,但是第7 7段(主段(主要元音段)是每个音节是具有的。要元音段)是每个音节是具有的。汉语音节的一般结构汉语音节的一般结构汉语声母的结构汉语声母的结构 v普通话中的二十二声母可分为六大类:擦音、普通话中的二十二声母可分为六大类:擦音、塞音、塞擦音、边音、鼻音、零声母。除零塞音、塞擦音、边音、鼻音、零声母。除零声母之外,其他所有的声母全部都
17、是单辅音声母之外,其他所有的声母全部都是单辅音。汉语韵母的结构汉语韵母的结构 v普通话的三十八个韵母大致可以分为三类:普通话的三十八个韵母大致可以分为三类:8 8个单韵母,如个单韵母,如aa、ii、uu等;等;1414个复韵母,如个复韵母,如aiai、aoao等;等;1616个鼻个鼻韵母如韵母如anan、uanguang等。在这三十八个韵母中有三个(等。在这三十八个韵母中有三个(-i-i、erer、)是特殊韵母)是特殊韵母。v应该注意,元音并不等于韵母。元音、辅音是按音素的发音应该注意,元音并不等于韵母。元音、辅音是按音素的发音特征分类的;而声母、韵母则是按音节结构分类的。这是两特征分类的;而
18、声母、韵母则是按音节结构分类的。这是两种不同的概念,尽管它们之间有一定的联系。种不同的概念,尽管它们之间有一定的联系。声母和韵母的相互作用声母和韵母的相互作用音征互载音征互载 v在在普通话里,声母和韵母的音征并不总是在各自的音段之内,普通话里,声母和韵母的音征并不总是在各自的音段之内,而且又可能跨越两者的边界,即声母里可能会带有韵母的信而且又可能跨越两者的边界,即声母里可能会带有韵母的信息,韵母里也可能带有声母的信息,如辅音音渡。如果把韵息,韵母里也可能带有声母的信息,如辅音音渡。如果把韵母从元音起始就开始算起的话,那么音渡就是韵母中载带的母从元音起始就开始算起的话,那么音渡就是韵母中载带的辅
19、音音征,对于某些辅音来说,如不送气塞音辅音音征,对于某些辅音来说,如不送气塞音bb、dd,元,元音里的音渡正是它们之间相互区别的主要音征。音里的音渡正是它们之间相互区别的主要音征。v而韵母中的某些音征有声带载带的现象,最典型的就是介音而韵母中的某些音征有声带载带的现象,最典型的就是介音的实现方式。的实现方式。汉语的声调汉语的声调v汉语是一种汉语是一种声调语言声调语言,相同声母和韵母构成的音节随声调的,相同声母和韵母构成的音节随声调的不同而具有完全不同的意义,对应着不同的汉字。所以在汉不同而具有完全不同的意义,对应着不同的汉字。所以在汉语的相互交谈中,不但要凭借不同的元音、辅音来辨别这些语的相互
20、交谈中,不但要凭借不同的元音、辅音来辨别这些字或词的意义,还需要从不同的声调来区别它,也就是说声字或词的意义,还需要从不同的声调来区别它,也就是说声调有辨意作用;另外,汉语中存在着多音字现象,同一个字调有辨意作用;另外,汉语中存在着多音字现象,同一个字在不同的语气或不同的词义下具有不同的声调,因而声调对在不同的语气或不同的词义下具有不同的声调,因而声调对于汉语语音的理解极为重要,承担着重要的构字辨意作用。于汉语语音的理解极为重要,承担着重要的构字辨意作用。汉语普通话的声调只有阴平、阳平、上声、去声以及汉语普通话的声调只有阴平、阳平、上声、去声以及“轻声轻声”等五种声调。等五种声调。v声调的变化
21、就是声调的变化就是浊音基音周期浊音基音周期(或(或基音频率基音频率)的变化,各个)的变化,各个韵母段中基音周期随时间的变化产生了声调,变化的轨迹称韵母段中基音周期随时间的变化产生了声调,变化的轨迹称为为声调曲线声调曲线。汉语的声调汉语的声调汉语普通话四种声调的典型曲线:汉语普通话四种声调的典型曲线:2 2.4.4 语音生成系统和语音感知系统语音生成系统和语音感知系统语音发音系统语音发音系统 v人的发音器官包括:肺、气管、喉(包括声带)、咽、鼻和人的发音器官包括:肺、气管、喉(包括声带)、咽、鼻和口。这些器官共同形成一条形状复杂的管道。喉的部分称为口。这些器官共同形成一条形状复杂的管道。喉的部分
22、称为声门声门。从声门到嘴唇的呼气通道叫做。从声门到嘴唇的呼气通道叫做声道(声道(Vocal TractVocal Tract)。声道的形状主要由嘴唇、颚和舌头的位置来决定。由声道形声道的形状主要由嘴唇、颚和舌头的位置来决定。由声道形状的不断改变,而发出不同的语音。状的不断改变,而发出不同的语音。语音听觉系统语音听觉系统v人耳由人耳由内耳内耳、中耳中耳和和外耳外耳三部分组成。外耳由耳翼、三部分组成。外耳由耳翼、外耳道和鼓膜构成。外耳在对声音的感知中起着声外耳道和鼓膜构成。外耳在对声音的感知中起着声源定位和声音放大的作用。中耳包括由锤骨、砧骨源定位和声音放大的作用。中耳包括由锤骨、砧骨和镫骨这三块
23、听小骨构成的听骨链以及咽鼓管等组和镫骨这三块听小骨构成的听骨链以及咽鼓管等组成。中耳的作用是进行声阻抗的变换,即将中耳两成。中耳的作用是进行声阻抗的变换,即将中耳两端的声阻抗匹配起来,同时对内耳起着保护的作用端的声阻抗匹配起来,同时对内耳起着保护的作用 。内耳的主要构成器官是。内耳的主要构成器官是耳蜗耳蜗(Cochlea)(Cochlea)。它是听觉。它是听觉的受纳器,把声音通过机械变换产生神经发放信号。的受纳器,把声音通过机械变换产生神经发放信号。语音听觉系统语音听觉系统人的听觉系统人的听觉系统 语音听觉系统语音听觉系统v人的听觉系统有两个重要特性,一个是耳蜗对于声信号的人的听觉系统有两个重
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内