多媒体技术应用2音频处理技术(陈永强)ppt课件.ppt
《多媒体技术应用2音频处理技术(陈永强)ppt课件.ppt》由会员分享,可在线阅读,更多相关《多媒体技术应用2音频处理技术(陈永强)ppt课件.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益多媒体技术应用多媒体技术应用数学与计算机学院数学与计算机学院陈永强陈永强Email:Email:2013-2014-21为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益第二章第二章 音频处理技术音频处理技术n n2.12.1 音频基本原理音频基本原理音频基本原理音频基本原理 2.1.12.1.1 人类听觉特性人类听觉特性人类听觉特性人类听觉特性 2.1.22.1.2 数字音频数字音频数字音频数字音频 2.1.3
2、2.1.3 声音声音声音声音 2.1.4 2.1.4 语音语音语音语音n n2.22.2常用音频压缩标准常用音频压缩标准常用音频压缩标准常用音频压缩标准 2.2.12.2.1音频压缩基础音频压缩基础音频压缩基础音频压缩基础 2.2.22.2.2常用音频压缩标准常用音频压缩标准常用音频压缩标准常用音频压缩标准 2.2.32.2.3音频文件格式音频文件格式音频文件格式音频文件格式n n2.32.3音频处理软件音频处理软件音频处理软件音频处理软件AuditionAudition 2.3.12.3.1功能介绍功能介绍功能介绍功能介绍 2.3.22.3.2编辑环境编辑环境编辑环境编辑环境 2.3.32.
3、3.3基本操作基本操作基本操作基本操作2为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益第二章第二章 音频处理技术音频处理技术n n2.1 音频基本原理音频基本原理2.1.1 人类听觉特性人类听觉特性2.1.2 数字音频数字音频2.1.3 声音声音2.1.4 语音语音3为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益近十年来,随着计算机技术的高速发展,以及能同近十年来,随着计算机技术的高速发展,以及能同近十年来,随着计算机技术的高速发展,以及能同近十年来,随着
4、计算机技术的高速发展,以及能同时满足数字信号的高压缩率和数字信号的高保真时满足数字信号的高压缩率和数字信号的高保真时满足数字信号的高压缩率和数字信号的高保真时满足数字信号的高压缩率和数字信号的高保真透明重放质量的压缩算法及标准得到大量开发与透明重放质量的压缩算法及标准得到大量开发与透明重放质量的压缩算法及标准得到大量开发与透明重放质量的压缩算法及标准得到大量开发与使用,数字音频已经广泛应用于因特网、多媒体使用,数字音频已经广泛应用于因特网、多媒体使用,数字音频已经广泛应用于因特网、多媒体使用,数字音频已经广泛应用于因特网、多媒体及无线通信系统,及无线通信系统,及无线通信系统,及无线通信系统,C
5、DCDCDCD品质的数字音频品质的数字音频品质的数字音频品质的数字音频已经从根本已经从根本已经从根本已经从根本上替代了模拟音频。因此,人们对音频信号数字上替代了模拟音频。因此,人们对音频信号数字上替代了模拟音频。因此,人们对音频信号数字上替代了模拟音频。因此,人们对音频信号数字化处理提出了越来越高的要求,相应软硬件实现化处理提出了越来越高的要求,相应软硬件实现化处理提出了越来越高的要求,相应软硬件实现化处理提出了越来越高的要求,相应软硬件实现手段的效率也在不断提高。手段的效率也在不断提高。手段的效率也在不断提高。手段的效率也在不断提高。4为了规范事业单位聘用关系,建立和完善适应社会主义市场经济
6、体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性音频信号的感知过程与人耳的听觉系统密不可分。音频信号的感知过程与人耳的听觉系统密不可分。音频信号的感知过程与人耳的听觉系统密不可分。音频信号的感知过程与人耳的听觉系统密不可分。对于对于对于对于人类听力感知人类听力感知人类听力感知人类听力感知的研究,其范围从人耳的生理的研究,其范围从人耳的生理的研究,其范围从人耳的生理的研究,其范围从人耳的生理设计到大脑对听觉信息的解释。当前,大部分感设计到大脑对听觉信息的解释。当前,大部分感设计到大脑对听觉信息的解释。当前,大部分感设计到大脑对听觉信息的解释。当前,
7、大部分感知音频的编码算法都是基于心理声学模型的。知音频的编码算法都是基于心理声学模型的。知音频的编码算法都是基于心理声学模型的。知音频的编码算法都是基于心理声学模型的。5为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性1 1 1 1听阈与听域听阈与听域听阈与听域听阈与听域2 2 2 2音调音调音调音调3 3 3 3响度和响度级响度和响度级响度和响度级响度和响度级4 4 4 4绝对听觉门限绝对听觉门限绝对听觉门限绝对听觉门限5 5 5 5临界频带临界频带临界频带临界频带6 6 6 6同时掩蔽同
8、时掩蔽同时掩蔽同时掩蔽7 7 7 7异时掩蔽异时掩蔽异时掩蔽异时掩蔽8 8 8 8感知熵感知熵感知熵感知熵6为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性1 1 1 1听阈与听域听阈与听域听阈与听域听阈与听域听阈(听阈(听阈(听阈(Auditory ThresholdAuditory ThresholdAuditory ThresholdAuditory Threshold)就是指人能听到的)就是指人能听到的)就是指人能听到的)就是指人能听到的最低最低最低最低声压级声压级声压级声压级(So
9、und Power LevelSound Power LevelSound Power LevelSound Power Level,SPLSPLSPLSPL)。)。)。)。听域(听域(听域(听域(Audible AreaAudible AreaAudible AreaAudible Area)是指)是指)是指)是指人能感知的声音的范围人能感知的声音的范围人能感知的声音的范围人能感知的声音的范围,正常人耳能够感知的频率范围大致是正常人耳能够感知的频率范围大致是正常人耳能够感知的频率范围大致是正常人耳能够感知的频率范围大致是20Hz20Hz20Hz20Hz20kHz20kHz20kHz20kHz
10、;正常人能感知声音的声压级范围是;正常人能感知声音的声压级范围是;正常人能感知声音的声压级范围是;正常人能感知声音的声压级范围是0 0 0 0128dB128dB128dB128dB。7为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益图图2-1 2-1 听阈听阈-频率曲线频率曲线 8为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性2 2 2 2音调音调音调音调音调(音调(音调(音调(PitchPitchPitchPitch)
11、在物理学中是指)在物理学中是指)在物理学中是指)在物理学中是指声音的高低声音的高低声音的高低声音的高低,实际上,实际上,实际上,实际上就是指人耳对不同频率声音的一种主观感受。就是指人耳对不同频率声音的一种主观感受。就是指人耳对不同频率声音的一种主观感受。就是指人耳对不同频率声音的一种主观感受。音音音音调主要由声音的频率决定调主要由声音的频率决定调主要由声音的频率决定调主要由声音的频率决定,同时也与声音强度有,同时也与声音强度有,同时也与声音强度有,同时也与声音强度有关。频率高的声音,人感觉其音调也较高,反之,关。频率高的声音,人感觉其音调也较高,反之,关。频率高的声音,人感觉其音调也较高,反之
12、,关。频率高的声音,人感觉其音调也较高,反之,人感知音调低的声音其频率也低。人感知音调低的声音其频率也低。人感知音调低的声音其频率也低。人感知音调低的声音其频率也低。对音调可以进行定量的判断,其度量单位为对音调可以进行定量的判断,其度量单位为对音调可以进行定量的判断,其度量单位为对音调可以进行定量的判断,其度量单位为美美美美(MelMelMelMel),),),),定义一个声压级为定义一个声压级为定义一个声压级为定义一个声压级为40dB40dB40dB40dB,频率为,频率为,频率为,频率为1kHz1kHz1kHz1kHz的纯音的音调为的纯音的音调为的纯音的音调为的纯音的音调为1000Mel1
13、000Mel1000Mel1000Mel。9为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性3 3 3 3响度和响度级响度和响度级响度和响度级响度和响度级响度(响度(响度(响度(LoudnessLoudnessLoudnessLoudness)是)是)是)是人耳感受声音强弱人耳感受声音强弱人耳感受声音强弱人耳感受声音强弱的主观感觉的主观感觉的主观感觉的主观感觉程度,这种感觉与音强、频率和波形都有关系,程度,这种感觉与音强、频率和波形都有关系,程度,这种感觉与音强、频率和波形都有关系,程度,这
14、种感觉与音强、频率和波形都有关系,其度量单位为宋(其度量单位为宋(其度量单位为宋(其度量单位为宋(SoneSoneSoneSone),定义一个声压级为),定义一个声压级为),定义一个声压级为),定义一个声压级为40dB40dB40dB40dB,频率为,频率为,频率为,频率为1kHz1kHz1kHz1kHz的纯音的响度为的纯音的响度为的纯音的响度为的纯音的响度为1Sone1Sone1Sone1Sone。响度级(响度级(响度级(响度级(Loudness LevelLoudness LevelLoudness LevelLoudness Level)是)是)是)是指某响度与基准响度相指某响度与基准响
15、度相指某响度与基准响度相指某响度与基准响度相比的等级比的等级比的等级比的等级,其度量单位为方(,其度量单位为方(,其度量单位为方(,其度量单位为方(PhonPhonPhonPhon),定义),定义),定义),定义1kHz1kHz1kHz1kHz纯音的响度级为纯音的响度级为纯音的响度级为纯音的响度级为1Phon1Phon1Phon1Phon。10为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益图图2-2 2-2 人耳可听最小响度曲线人耳可听最小响度曲线 11为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工
16、作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性4 4 4 4绝对听觉门限绝对听觉门限绝对听觉门限绝对听觉门限绝对听觉门限(绝对听觉门限(绝对听觉门限(绝对听觉门限(Absolute Threshold of HearingAbsolute Threshold of HearingAbsolute Threshold of HearingAbsolute Threshold of Hearing,ATHATHATHATH)指一个人在没有噪声的环境下,能够产生)指一个人在没有噪声的环境下,能够产生)指一个人在没有噪声的环境下,能够产生)指一个人在没有噪声的环境下,
17、能够产生听觉,感知到一个纯音信号(某频率点)的最小听觉,感知到一个纯音信号(某频率点)的最小听觉,感知到一个纯音信号(某频率点)的最小听觉,感知到一个纯音信号(某频率点)的最小能量幅度。能量幅度。能量幅度。能量幅度。绝对听觉门限用声压级表示,静音为绝对听觉门限用声压级表示,静音为绝对听觉门限用声压级表示,静音为绝对听觉门限用声压级表示,静音为0dB0dB0dB0dB,痛阈为,痛阈为,痛阈为,痛阈为140dB140dB140dB140dB。12为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益图图2-3 2-3 绝对听觉门限曲线绝
18、对听觉门限曲线 13为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性5 5 5 5临界频带临界频带临界频带临界频带指一个纯音可以被以它为中心频率,并且具有一定指一个纯音可以被以它为中心频率,并且具有一定指一个纯音可以被以它为中心频率,并且具有一定指一个纯音可以被以它为中心频率,并且具有一定频带宽度的连续噪声所掩蔽,在这一频带内噪声频带宽度的连续噪声所掩蔽,在这一频带内噪声频带宽度的连续噪声所掩蔽,在这一频带内噪声频带宽度的连续噪声所掩蔽,在这一频带内噪声功率等于该纯音的功率。使该纯音处于刚能
19、被听功率等于该纯音的功率。使该纯音处于刚能被听功率等于该纯音的功率。使该纯音处于刚能被听功率等于该纯音的功率。使该纯音处于刚能被听到的临界状态,即称这一带宽为临界频带宽度。到的临界状态,即称这一带宽为临界频带宽度。到的临界状态,即称这一带宽为临界频带宽度。到的临界状态,即称这一带宽为临界频带宽度。临界频带的单位为巴克(临界频带的单位为巴克(临界频带的单位为巴克(临界频带的单位为巴克(BarkBarkBarkBark)。)。)。)。14为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性6 6 6
20、 6同时掩蔽同时掩蔽同时掩蔽同时掩蔽掩蔽效应是指当两个响度不等的声音作用于掩蔽效应是指当两个响度不等的声音作用于人耳时,响度较高的频率成分的存在会影人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感知。响到对响度较低的频率成分的感知。当两个或更多的音频信号到达人内耳时,掩当两个或更多的音频信号到达人内耳时,掩蔽声与被掩蔽声同时作用发生掩蔽效应,蔽声与被掩蔽声同时作用发生掩蔽效应,就称同时掩蔽。就称同时掩蔽。15为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性7 7 7 7异时掩
21、蔽异时掩蔽异时掩蔽异时掩蔽指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的情况下。情况下。情况下。情况下。若掩蔽声音出现之前的一段时间内发生掩蔽效应,若掩蔽声音出现之前的一段时间内发生掩蔽效应,若掩蔽声音出现之前的一段时间内发生掩蔽效应,若掩蔽声音出现之前的一段时间内发生掩蔽效应,则称为超前掩蔽,否则称为滞后掩蔽。则称为超前掩蔽,否则称为滞后掩蔽。则称为超前掩蔽,否则称为滞后掩蔽。则称为超前掩蔽,否则称为滞后掩蔽。16为了规范事业单位聘用关系,建立和完善适应社会主义市
22、场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.1 人类听觉特性人类听觉特性8 8 8 8感知熵感知熵感知熵感知熵感知熵(感知熵(感知熵(感知熵(Perceptual EntropyPerceptual EntropyPerceptual EntropyPerceptual Entropy)指利用心理声学的掩)指利用心理声学的掩)指利用心理声学的掩)指利用心理声学的掩蔽现象和信号能量化原理来测量音频信号中感知蔽现象和信号能量化原理来测量音频信号中感知蔽现象和信号能量化原理来测量音频信号中感知蔽现象和信号能量化原理来测量音频信号中感知相关的信息。一般以位(相关的信息。一
23、般以位(相关的信息。一般以位(相关的信息。一般以位(bitbitbitbit)作为单位,实际上)作为单位,实际上)作为单位,实际上)作为单位,实际上表示了音频信号压缩的理论极限。表示了音频信号压缩的理论极限。表示了音频信号压缩的理论极限。表示了音频信号压缩的理论极限。17为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2.1.22.1.2 数字音频数字音频数字音频数字音频音频信号是音频信号是音频信号是音频信号是时间和幅度都连续变化的一维模拟信号时间和幅度都连续变化的一维模拟信号时间和幅度都连续变化的一维模拟信号时间和幅度都连续
24、变化的一维模拟信号,要想在计算机中对它进行处理,就要将它变成时要想在计算机中对它进行处理,就要将它变成时要想在计算机中对它进行处理,就要将它变成时要想在计算机中对它进行处理,就要将它变成时间和幅度都是离散的数字信号,所以间和幅度都是离散的数字信号,所以间和幅度都是离散的数字信号,所以间和幅度都是离散的数字信号,所以数字音频是数字音频是数字音频是数字音频是指音频信号经过离散化处理后再用一系列的数字指音频信号经过离散化处理后再用一系列的数字指音频信号经过离散化处理后再用一系列的数字指音频信号经过离散化处理后再用一系列的数字来表示的信号来表示的信号来表示的信号来表示的信号,其特点是保真度好,动态范围
25、大。,其特点是保真度好,动态范围大。,其特点是保真度好,动态范围大。,其特点是保真度好,动态范围大。数字音频可分为数字音频可分为数字音频可分为数字音频可分为波形声音波形声音波形声音波形声音、语音语音语音语音和和和和音乐音乐音乐音乐。波形声音。波形声音。波形声音。波形声音实际上包含了所有的声音形式,因此数字音频有实际上包含了所有的声音形式,因此数字音频有实际上包含了所有的声音形式,因此数字音频有实际上包含了所有的声音形式,因此数字音频有时也泛称为声音。时也泛称为声音。时也泛称为声音。时也泛称为声音。18为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 应用 音频 处理 技术 陈永强 ppt 课件
限制150内