第5章数据音频技术.ppt
《第5章数据音频技术.ppt》由会员分享,可在线阅读,更多相关《第5章数据音频技术.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体技术与应用多媒体技术与应用第第第第3 3章章章章 数据压缩技术数据压缩技术数据压缩技术数据压缩技术第第第第4 4章章章章 数据存储技术数据存储技术数据存储技术数据存储技术第第第第5 5章章章章 数字音频技术数字音频技术数字音频技术数字音频技术第第第第6 6章章章章 数字图形图像技术数字图形图像技术数字图形图像技术数字图形图像技术第第第第7 7章章章章 数字视频技术数字视频技术数字视频技术数字视频技术第第第第8 8章章章章 网络多媒体技术网络多媒体技术网络多媒体技术网络多媒体技术第第第第9 9章章章章 多媒体操作系统多媒体操作系统多媒体操作系统多媒体操作系统第第5章章 数据音频技术数据音频
2、技术 声音是多媒体技术研究中的一个重要内容。声音的种类繁多,声音是多媒体技术研究中的一个重要内容。声音的种类繁多,声音是多媒体技术研究中的一个重要内容。声音的种类繁多,声音是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器的声响、动物的叫声、机器产生的声音以如人的话音、乐器的声响、动物的叫声、机器产生的声音以如人的话音、乐器的声响、动物的叫声、机器产生的声音以如人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、风声、雨声、闪电声等。在用计算机处理及自然界的雷声、风声、雨声、闪电声等。在用计算机处理及自然界的雷声、风声、雨声、闪电声等。在用计算机处理及自然界的雷声
3、、风声、雨声、闪电声等。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们各自的特这些声音时,既要考虑它们的共性,又要利用它们各自的特这些声音时,既要考虑它们的共性,又要利用它们各自的特这些声音时,既要考虑它们的共性,又要利用它们各自的特性。性。性。性。自从自从自从自从19691969年年年年BellBell实验室开始数字语音的研究以来,计算机产实验室开始数字语音的研究以来,计算机产实验室开始数字语音的研究以来,计算机产实验室开始数字语音的研究以来,计算机产生音乐以及语音识别、语音合成技术得到了越来越广泛的研生音乐以及语音识别、语音合成技术得到了越来越广泛的研生音乐以及语音识别、语音合
4、成技术得到了越来越广泛的研生音乐以及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体数字音频处理技术在音频数字化、语音处究和应用。多媒体数字音频处理技术在音频数字化、语音处究和应用。多媒体数字音频处理技术在音频数字化、语音处究和应用。多媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面都有着很好的发展。理、合成及识别等各个方面都有着很好的发展。理、合成及识别等各个方面都有着很好的发展。理、合成及识别等各个方面都有着很好的发展。5.1 声音与声音信号数字化声音与声音信号数字化 作为一种模拟信号,声音在时间和振幅上都是连续的,即它作为一种模拟信号,声音在时间和振幅上都是连续
5、的,即它作为一种模拟信号,声音在时间和振幅上都是连续的,即它作为一种模拟信号,声音在时间和振幅上都是连续的,即它的振幅能以任意精度并在任何一个时刻进行测量。与之不同的振幅能以任意精度并在任何一个时刻进行测量。与之不同的振幅能以任意精度并在任何一个时刻进行测量。与之不同的振幅能以任意精度并在任何一个时刻进行测量。与之不同的是,数字信号只能在确定的时刻才有意义,其数值也只能的是,数字信号只能在确定的时刻才有意义,其数值也只能的是,数字信号只能在确定的时刻才有意义,其数值也只能的是,数字信号只能在确定的时刻才有意义,其数值也只能取有限的量。取有限的量。取有限的量。取有限的量。5.1.1 声音与听觉器
6、官声音与听觉器官 声音的强弱表现在声波压力的大小上,音调的高低表现在声声音的强弱表现在声波压力的大小上,音调的高低表现在声声音的强弱表现在声波压力的大小上,音调的高低表现在声声音的强弱表现在声波压力的大小上,音调的高低表现在声音的频率上。当声音用电信号表示时,在时间和幅度上都是音的频率上。当声音用电信号表示时,在时间和幅度上都是音的频率上。当声音用电信号表示时,在时间和幅度上都是音的频率上。当声音用电信号表示时,在时间和幅度上都是连续的模拟信号。对声音信号的分析表明,声音信号由许多连续的模拟信号。对声音信号的分析表明,声音信号由许多连续的模拟信号。对声音信号的分析表明,声音信号由许多连续的模拟
7、信号。对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为复合信号,而单一频率频率不同的信号组成,这类信号称为复合信号,而单一频率频率不同的信号组成,这类信号称为复合信号,而单一频率频率不同的信号组成,这类信号称为复合信号,而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽,的信号称为分量信号。声音信号的一个重要参数就是带宽,的信号称为分量信号。声音信号的一个重要参数就是带宽,的信号称为分量信号。声音信号的一个重要参数就是带宽,用来描述组成复合信号的频率范围,如高保真声音的频率范用来描述组成复合信号的频率范围,如高保真声音的频率范用来描述组成复合信号的频率范围,如高保
8、真声音的频率范用来描述组成复合信号的频率范围,如高保真声音的频率范围为围为围为围为1020000Hz1020000Hz,带宽约为,带宽约为,带宽约为,带宽约为20kHz20kHz,而视频信号的带宽是,而视频信号的带宽是,而视频信号的带宽是,而视频信号的带宽是6MHz6MHz。5.1.1 声音与听觉器官声音与听觉器官 声音信号的两个基本参数是频率和幅度。信号的频率是指信声音信号的两个基本参数是频率和幅度。信号的频率是指信声音信号的两个基本参数是频率和幅度。信号的频率是指信声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数,用号每秒钟变化的次数,用号每秒钟变化的次数,用号每秒钟
9、变化的次数,用HzHz表示。频率小于表示。频率小于表示。频率小于表示。频率小于20Hz20Hz的信号称的信号称的信号称的信号称为亚音信号,或称为次音信号;频率范围为为亚音信号,或称为次音信号;频率范围为为亚音信号,或称为次音信号;频率范围为为亚音信号,或称为次音信号;频率范围为20Hz20kHz20Hz20kHz的的的的信号称为音频(信号称为音频(信号称为音频(信号称为音频(AudioAudio)信号。虽然人的发音器官发出的声)信号。虽然人的发音器官发出的声)信号。虽然人的发音器官发出的声)信号。虽然人的发音器官发出的声音频率大约是音频率大约是音频率大约是音频率大约是803400Hz80340
10、0Hz,但人说话的信号频率通常为,但人说话的信号频率通常为,但人说话的信号频率通常为,但人说话的信号频率通常为3003000Hz3003000Hz,在这种频率范围的信号称为话音信号;高于,在这种频率范围的信号称为话音信号;高于,在这种频率范围的信号称为话音信号;高于,在这种频率范围的信号称为话音信号;高于20kHz20kHz的信号称为超音频信号,或称超声波信号。一般来说,的信号称为超音频信号,或称超声波信号。一般来说,的信号称为超音频信号,或称超声波信号。一般来说,的信号称为超音频信号,或称超声波信号。一般来说,人的听觉器官能感知的声音频率大约在人的听觉器官能感知的声音频率大约在人的听觉器官能
11、感知的声音频率大约在人的听觉器官能感知的声音频率大约在2020000Hz2020000Hz之间,之间,之间,之间,在这种频率范围里感知的声音幅度大约在在这种频率范围里感知的声音幅度大约在在这种频率范围里感知的声音幅度大约在在这种频率范围里感知的声音幅度大约在0120db0120db之间。多之间。多之间。多之间。多媒体技术中处理的主要是音频信号,包括音乐、语音和音效媒体技术中处理的主要是音频信号,包括音乐、语音和音效媒体技术中处理的主要是音频信号,包括音乐、语音和音效媒体技术中处理的主要是音频信号,包括音乐、语音和音效(风雨声、鸟叫声、机器声)等。(风雨声、鸟叫声、机器声)等。(风雨声、鸟叫声、
12、机器声)等。(风雨声、鸟叫声、机器声)等。5.1.2 模拟信号与数字信号模拟信号与数字信号 大多数电信号(模拟信号)过去一直是用模拟元部件(如晶大多数电信号(模拟信号)过去一直是用模拟元部件(如晶大多数电信号(模拟信号)过去一直是用模拟元部件(如晶大多数电信号(模拟信号)过去一直是用模拟元部件(如晶体管、变压器、电阻、电容等)进行处理的。但是,开发一体管、变压器、电阻、电容等)进行处理的。但是,开发一体管、变压器、电阻、电容等)进行处理的。但是,开发一体管、变压器、电阻、电容等)进行处理的。但是,开发一个具有相当精度、且几乎不受环境变化影响的模拟信号处理个具有相当精度、且几乎不受环境变化影响的
13、模拟信号处理个具有相当精度、且几乎不受环境变化影响的模拟信号处理个具有相当精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难,成本也很高。元部件相当困难,成本也很高。元部件相当困难,成本也很高。元部件相当困难,成本也很高。话音信号是典型的连续信号,不仅在时间上,而且在幅度上话音信号是典型的连续信号,不仅在时间上,而且在幅度上话音信号是典型的连续信号,不仅在时间上,而且在幅度上话音信号是典型的连续信号,不仅在时间上,而且在幅度上也是连续的。时间上也是连续的。时间上也是连续的。时间上也是连续的。时间上“连续连续连续连续”是指在一个指定的时间范围内是指在一个指定的时间范围内是指在一个指定的时间
14、范围内是指在一个指定的时间范围内声音信号的幅值有无穷多个,在幅度上声音信号的幅值有无穷多个,在幅度上声音信号的幅值有无穷多个,在幅度上声音信号的幅值有无穷多个,在幅度上“连续连续连续连续”是指幅度的是指幅度的是指幅度的是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称数值有无穷多个。我们把在时间和幅度上都是连续的信号称数值有无穷多个。我们把在时间和幅度上都是连续的信号称数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。为模拟信号。为模拟信号。为模拟信号。5.1.2 模拟信号与数字信号模拟信号与数字信号 如果把模拟信号转变成数字信号,用数字来表示模拟量和对如果把模拟信号
15、转变成数字信号,用数字来表示模拟量和对如果把模拟信号转变成数字信号,用数字来表示模拟量和对如果把模拟信号转变成数字信号,用数字来表示模拟量和对数字信号做计算,那么开发模拟运算部件的问题就转变成了数字信号做计算,那么开发模拟运算部件的问题就转变成了数字信号做计算,那么开发模拟运算部件的问题就转变成了数字信号做计算,那么开发模拟运算部件的问题就转变成了开发数字运算部件的问题,这就出现了数字信号处理器开发数字运算部件的问题,这就出现了数字信号处理器开发数字运算部件的问题,这就出现了数字信号处理器开发数字运算部件的问题,这就出现了数字信号处理器(digital signal processordigi
16、tal signal processor,DSPDSP)。)。)。)。DSPDSP与通用微处理器相与通用微处理器相与通用微处理器相与通用微处理器相比,除了结构不同外,它们的基本差别是,比,除了结构不同外,它们的基本差别是,比,除了结构不同外,它们的基本差别是,比,除了结构不同外,它们的基本差别是,DSPDSP有能力响应有能力响应有能力响应有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加求和运和处理采样模拟信号得到的数据流,如做乘法和累加求和运和处理采样模拟信号得到的数据流,如做乘法和累加求和运和处理采样模拟信号得到的数据流,如做乘法和累加求和运算等。算等。算等。算等。5.1.2 模拟信
17、号与数字信号模拟信号与数字信号 在数字环境进行信号处理的主要优点是:首先,数字信号计在数字环境进行信号处理的主要优点是:首先,数字信号计在数字环境进行信号处理的主要优点是:首先,数字信号计在数字环境进行信号处理的主要优点是:首先,数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;算是一种精确的运算方法,它不受时间和环境变化的影响;算是一种精确的运算方法,它不受时间和环境变化的影响;算是一种精确的运算方法,它不受时间和环境变化的影响;其次,表示部件功能的数学运算不是物理上实现的功能部件,其次,表示部件功能的数学运算不是物理上实现的功能部件,其次,表示部件功能的数学运算不是物理上实现的
18、功能部件,其次,表示部件功能的数学运算不是物理上实现的功能部件,而仅仅是用数学运算来模拟,相对容易实现;此外,可以对而仅仅是用数学运算来模拟,相对容易实现;此外,可以对而仅仅是用数学运算来模拟,相对容易实现;此外,可以对而仅仅是用数学运算来模拟,相对容易实现;此外,可以对数字运算部件进行编程,如欲改变算法或改变某些功能,还数字运算部件进行编程,如欲改变算法或改变某些功能,还数字运算部件进行编程,如欲改变算法或改变某些功能,还数字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程。可对数字部件进行再编程。可对数字部件进行再编程。可对数字部件进行再编程。5.1.3 声音信号数字
19、化声音信号数字化 计算机要处理或合成声音,就必须把模拟的(连续的)声音计算机要处理或合成声音,就必须把模拟的(连续的)声音计算机要处理或合成声音,就必须把模拟的(连续的)声音计算机要处理或合成声音,就必须把模拟的(连续的)声音波形转换成数字(离散化),这个过程称为声音采样(图波形转换成数字(离散化),这个过程称为声音采样(图波形转换成数字(离散化),这个过程称为声音采样(图波形转换成数字(离散化),这个过程称为声音采样(图5-5-1 1),它是把连续的声波信号通过一种称为模数(),它是把连续的声波信号通过一种称为模数(),它是把连续的声波信号通过一种称为模数(),它是把连续的声波信号通过一种称
20、为模数(A/DA/D)转)转)转)转换器的部件转换成数字信号,供计算机处理,如果需要的话,换器的部件转换成数字信号,供计算机处理,如果需要的话,换器的部件转换成数字信号,供计算机处理,如果需要的话,换器的部件转换成数字信号,供计算机处理,如果需要的话,这种转换后的数字信号又可以通过数模转换(这种转换后的数字信号又可以通过数模转换(这种转换后的数字信号又可以通过数模转换(这种转换后的数字信号又可以通过数模转换(D/AD/A)器,经)器,经)器,经)器,经过放大输出,变成人耳能够听到的声音。过放大输出,变成人耳能够听到的声音。过放大输出,变成人耳能够听到的声音。过放大输出,变成人耳能够听到的声音。
21、图图图图5-1 5-1 声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程5.1.3 声音信号数字化声音信号数字化 连续时间的离散化通过采样来实现,就是每隔相等的一小段连续时间的离散化通过采样来实现,就是每隔相等的一小段连续时间的离散化通过采样来实现,就是每隔相等的一小段连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样;连续幅度的离散化时间采样一次,这种采样称为均匀采样;连续幅度的离散化时间采样一次,这种采样称为均匀采样;连续幅度的离散化时间采样一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,就是把信号的强度划分成
22、一小段一小段,通过量化来实现,就是把信号的强度划分成一小段一小段,通过量化来实现,就是把信号的强度划分成一小段一小段,通过量化来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为如果幅度的划分是等间隔的,就称为线性量化,否则就称为如果幅度的划分是等间隔的,就称为线性量化,否则就称为如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。图非线性量化。图非线性量化。图非线性量化。图5-25-2表示了声音数字化的概念。表示了声音数字化的概念。表示了声音数字化的概念。表示了声音数字化的概念。图图图图5-2 5-2 声音的采样和量化声音的采样和量化声
23、音的采样和量化声音的采样和量化5.1.3 声音信号数字化声音信号数字化 我们把时间和幅度都用离散的数字表示的信号称为数字信号。我们把时间和幅度都用离散的数字表示的信号称为数字信号。我们把时间和幅度都用离散的数字表示的信号称为数字信号。我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音数字化需要回答两个问题:声音数字化需要回答两个问题:声音数字化需要回答两个问题:声音数字化需要回答两个问题:每秒钟采集多少个声音每秒钟采集多少个声音每秒钟采集多少个声音每秒钟采集多少个声音样本,也就是采样频率是多少;样本,也就是采样频率是多少;样本,也就是采样频率是多少;样本,也就是采样频率是多少;每个声音
24、样本的位数每个声音样本的位数每个声音样本的位数每个声音样本的位数(bit per samplebit per sample,bpsbps)应该是多少,也就是量化精度。)应该是多少,也就是量化精度。)应该是多少,也就是量化精度。)应该是多少,也就是量化精度。采样的速度决定了录制声音的准确性,而采样值的精度则决采样的速度决定了录制声音的准确性,而采样值的精度则决采样的速度决定了录制声音的准确性,而采样值的精度则决采样的速度决定了录制声音的准确性,而采样值的精度则决定了录制声音的精确性。实践证明,采样速度越快,采样值定了录制声音的精确性。实践证明,采样速度越快,采样值定了录制声音的精确性。实践证明,
25、采样速度越快,采样值定了录制声音的精确性。实践证明,采样速度越快,采样值越准确,声音特征复原得就会越好。越准确,声音特征复原得就会越好。越准确,声音特征复原得就会越好。越准确,声音特征复原得就会越好。5.1.3 声音信号数字化声音信号数字化 常用的几种音频信号数字化的采样率标准是:常用的几种音频信号数字化的采样率标准是:常用的几种音频信号数字化的采样率标准是:常用的几种音频信号数字化的采样率标准是:44.2kHz44.2kHz(CDCD音质)、音质)、音质)、音质)、22.05kHz22.05kHz(FMFM音质)、音质)、音质)、音质)、11.025kHz11.025kHz(AMAM音质)等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 数据音频技术 数据 音频 技术
限制150内