第二章_音频信息处理基础知识.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第二章_音频信息处理基础知识.ppt》由会员分享,可在线阅读,更多相关《第二章_音频信息处理基础知识.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 音频信息处理1 1YOUR SITE HERE第2章 音频信息处理2.1 数字音频基础2.2 音频卡的工作原理2.3 音频编码基础和标准2.4 音乐合成和MIDI2.5 语音识别2 2YOUR SITE HEREn n多媒体中音频信息的应用多媒体中音频信息的应用 n n模拟音频和数字音频模拟音频和数字音频n n音频的音频的数字化数字化n n音频信号处理的特点音频信号处理的特点2.1 数字音频基础3 3YOUR SITE HERE多媒体中音频信息的应用 在多媒体系统中,语音和在多媒体系统中,语音和音乐是不可少的。没有音频的音乐是不可少的。没有音频的视频是不可接受的。视频是不可接受的。4
2、4YOUR SITE HERE多媒体中音频信息的应用 音频和视频同步,使视频图音频和视频同步,使视频图像更具真实性像更具真实性 娓娓动听的音乐和解说,使娓娓动听的音乐和解说,使静态图像变得更加丰富多彩静态图像变得更加丰富多彩 可视电话、电视会议中的声可视电话、电视会议中的声音更为重要音更为重要5 5YOUR SITE HERE音频是多媒体的重要媒体之一Audio 音频音频Speech 语音语音 言语言语Sound 非语音非语音 声音声音浊音浊音清音清音爆破音爆破音乐音乐音杂音杂音6 6YOUR SITE HERE 语音是语言的物质外壳语音是语言的物质外壳(载体载体)。语言。语言是人类社会特有的
3、一种信息系统,社会交是人类社会特有的一种信息系统,社会交际工具的符号。际工具的符号。非语音信号的特点是不具有复杂的语非语音信号的特点是不具有复杂的语意和语法信息,信息量低、识别简单。意和语法信息,信息量低、识别简单。7 7YOUR SITE HERE 语言是人类通信最直接最自然的方式。从第一台计算机诞生以来,专家们就为之付出了巨大的努力。人们期望以最自然人们期望以最自然 的方式与计算机交互的方式与计算机交互8 8YOUR SITE HERE 设计师为计算机安上了设计师为计算机安上了“嘴巴嘴巴”(扬声器),(扬声器),让计算机奏乐、讲话;让计算机奏乐、讲话;为计算机装上了为计算机装上了“耳朵耳朵
4、”(麦克风),让计(麦克风),让计算机听懂、理解人的讲话。算机听懂、理解人的讲话。网络专家还期望分布在不同地点的计算机成网络专家还期望分布在不同地点的计算机成为为“顺风耳顺风耳”,实现音频实时传播。,实现音频实时传播。人们期望以最自然人们期望以最自然 的方式与计算机交互的方式与计算机交互9 9YOUR SITE HERE 音频被用来传递消息、意向、音频被用来传递消息、意向、情感,是人类最熟悉的传递消息情感,是人类最熟悉的传递消息的方式。音频携带的信息量大、的方式。音频携带的信息量大、精细、准确。精细、准确。1010YOUR SITE HERE 随着多媒体信息处理技术的随着多媒体信息处理技术的发
5、展,计算机数据处理能力的增发展,计算机数据处理能力的增强,音频处理技术受到重视,并强,音频处理技术受到重视,并得到了广泛的应用。如:得到了广泛的应用。如:1111YOUR SITE HERE视频图像的配音、配乐可视电话、电视会议中的话音;游戏中的音响效果Internet 电话、声音欺骗系统、现代“芝麻开门”系统虚拟现实中的声音模拟电子读物的有声输出等1212YOUR SITE HEREn n多媒体中音频信息的应用多媒体中音频信息的应用 n n模拟音频和数字音频模拟音频和数字音频n n音频的音频的数字化数字化n n音频信号处理的特点音频信号处理的特点2.1 数字音频基础1313YOUR SITE
6、 HERE模拟音频和数字音频什么是模拟音频?什么是模拟音频?声音是机械振动。振动越强,声声音是机械振动。振动越强,声音越大,话筒把机械振动转换成电信音越大,话筒把机械振动转换成电信号,模拟音频技术中以模拟电压的幅号,模拟音频技术中以模拟电压的幅度表示声音强弱。度表示声音强弱。模拟声音在时间上是连续的。模拟声音在时间上是连续的。1414YOUR SITE HERE什么是数字音频?什么是数字音频?在计算机内,所有的信息均以数字表示。在计算机内,所有的信息均以数字表示。各种命令是不同的数字,各种幅度的物理量各种命令是不同的数字,各种幅度的物理量也是不同的数字。当然,语音信号也是由一也是不同的数字。当
7、然,语音信号也是由一系列数字来表示,称之为数字音频。系列数字来表示,称之为数字音频。数字音频的特点是保真度好,动态范围数字音频的特点是保真度好,动态范围大。大。数字声音在时间上是断续的。数字声音在时间上是断续的。1515YOUR SITE HERE 在数字音频技术中,把表示声音在数字音频技术中,把表示声音强弱的模拟电压用数字表示,如强弱的模拟电压用数字表示,如0.5V电压用数字电压用数字20表示,表示,2V电压用电压用80表示。表示。模拟电压的幅度,即使在某电平范围模拟电压的幅度,即使在某电平范围内,仍然可以有无穷多个如内,仍然可以有无穷多个如1.21V,1.215V。1616YOUR SIT
8、E HERE 而用数字来表示音频幅度时,而用数字来表示音频幅度时,只能把无穷多个电压幅度用有限只能把无穷多个电压幅度用有限个数字表示。即把某一幅度范围个数字表示。即把某一幅度范围内的电压用一个数字表示,这称内的电压用一个数字表示,这称之为量化。之为量化。1717YOUR SITE HERE 计算机内的基本数制是二进计算机内的基本数制是二进制,为此我们也要把声音数据写制,为此我们也要把声音数据写成计算机的数据格式,这称之为成计算机的数据格式,这称之为编码,模拟电压幅度、量化、编编码,模拟电压幅度、量化、编码的关系举例如下表。码的关系举例如下表。1818YOUR SITE HERE1919YOUR
9、 SITE HEREn n多媒体中音频信息的应用多媒体中音频信息的应用 n n模拟音频和数字音频模拟音频和数字音频n n音频的音频的数字化数字化n n音频信号处理的特点音频信号处理的特点2.1 数字音频基础2020YOUR SITE HERE音频的数字化 计算机内的音频必须是数字形式的,因此必须把模拟音频信号转换成有限个数字表示的离散序列,即实现音频数字化。在这一处理技术中,涉及到音频的采样、量化和编码。2121YOUR SITE HERE采样:音频实际上是连续信号,采样:音频实际上是连续信号,或称连续时间函数或称连续时间函数x(t)。用计算机用计算机处理这些信号时,必须先对连续信处理这些信号
10、时,必须先对连续信号采样,即按一定的时间间隔号采样,即按一定的时间间隔(T)取值取值,得到得到x(nT)(n为整数为整数)。T称称采样周期,采样周期,1/T称为采样频率。称称为采样频率。称x(nT)为离散信号。为离散信号。2222YOUR SITE HERE 离散信号离散信号x(nT)是从连续信号是从连续信号x(t)上取出的一部分值,那么能用上取出的一部分值,那么能用x(nT)唯一地确一地恢复出唯一地确一地恢复出x(t)吗?吗?一般是不行的。但在一定条件下可一般是不行的。但在一定条件下可以的,即采样要满足采样定理。以的,即采样要满足采样定理。2323YOUR SITE HERE 采采样样定定理
11、理:设设连连续续信信号号x(t)的的频频谱谱为为x(f),以以采采样样间间隔隔T采采样样得得到到离离散散信信号号x(nT),如如果果满足:满足:2424YOUR SITE HERE 可以由可以由x(nT)完全确定连续信号完全确定连续信号x(f)当当采采样样频频率率等等于于1/2T时时,即即fN N=1/2T,称称fN N为奈魁斯特频率。为奈魁斯特频率。2525YOUR SITE HERE常用的音频采样率有:常用的音频采样率有:8kHz8kHz、11.025kHz11.025kHz、22.05kHz22.05kHz、16kHz16kHz、37.8kHz37.8kHz、44.1kHz44.1kHz
12、、48kHz48kHz。2626YOUR SITE HERE量化:为了把采样序列量化:为了把采样序列x(nT)存存入计算机,必须将样值量化成一个入计算机,必须将样值量化成一个有限个幅度值的集合有限个幅度值的集合x(nT)。通常,通常,用二进制数字表示量化后的样值是用二进制数字表示量化后的样值是方便的。方便的。2727YOUR SITE HERE 量化采样的过程如下:先将整量化采样的过程如下:先将整个幅度划分成为有限个小幅度个幅度划分成为有限个小幅度(量化量化阶距阶距)的集合,把落入某个阶距内的的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化样值归为一类,并赋予相同的量化值。如果量化值是
13、均匀分布的,我值。如果量化值是均匀分布的,我们称之为均匀量化。们称之为均匀量化。2828YOUR SITE HEREn n多媒体中音频信息的应用多媒体中音频信息的应用 n n模拟音频和数字音频模拟音频和数字音频n n音频的音频的数字化数字化n n音频信号处理的特点音频信号处理的特点2.1 数字音频基础2929YOUR SITE HERE音频信号处理的特点 音频信息处理 信号处理的角度:将声音看成是一种信号,通过对信号的认识,来获取信息。信息论的角度:用它的消息内容和信息来表示。3030YOUR SITE HERE音频信号处理的特点(1)音频信号是时间依赖的连续媒体 音频信号是时间依赖的连续媒体
14、。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟,人就会感到断续。3131YOUR SITE HERE音频信号处理的特点 (2)(2)理想的合成声音应是立体声理想的合成声音应是立体声 由于人接收声音有两个通道(左耳、右耳),因此由于人接收声音有两个通道(左耳、右耳),因此为使计算机模拟自然声音,也应有两个声道,即理想的为使计算机模拟自然声音,也应有两个声道,即理想的合成声音应是立体声。同时,也应该包括位置信息(不合成声音应是立体声。同时,也应该包括位置信息(不同会场和不同角落的发的声音同会场和不同角落的发的声音 )。真实感声音的模拟:。真实感声音的模拟:多通道、幅度、位置多通道、
15、幅度、位置3232YOUR SITE HERE音频信号处理的特点 (3)(3)对语音信号的处理,要抽取语意等其它信息对语音信号的处理,要抽取语意等其它信息 由于语音信号不仅仅是声音的载体,同时还由于语音信号不仅仅是声音的载体,同时还携带了情感的意向,故对语音信号的处理,不仅携带了情感的意向,故对语音信号的处理,不仅是信号处理问题,还要抽取语意等其它信息。因是信号处理问题,还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学此可能会涉及到语言学、社会学、声学等。等。3333YOUR SITE HERE 从人与计算机交互的角度来看从人与计算机交互的角度来看音频信号相应的处理如下:音频信号相
16、应的处理如下:(1 1)人与计算机通信(计算机)人与计算机通信(计算机接收音频信号):接收音频信号):音频获取;语音识别与理解;音频获取;语音识别与理解;人与计算机交互人与计算机交互3434YOUR SITE HERE (2 2)计算机与人通信(计算机输出)计算机与人通信(计算机输出音频)音频)音音频频合合成成:包包括括音音乐乐合合成成和和语语音音合成;合成;声音定位:包括立体声模拟;声音定位:包括立体声模拟;音频音频/视频同步;目的是让计算机视频同步;目的是让计算机产生真实感声音。产生真实感声音。3535YOUR SITE HERE(3 3)人)人计算机计算机人通信:人通信:人人通通过过网网
17、络络,与与处处于于异异地地的的人人进进行语音通信,需要的音频处理包括:行语音通信,需要的音频处理包括:语音采集、音频编码语音采集、音频编码/解码、音频解码、音频传输等。这里音频编传输等。这里音频编/解码技术是信道解码技术是信道利用率的关键。利用率的关键。3636YOUR SITE HERE第二章 音频信息处理2.1 数字音频基础2.2 音频卡的工作原理2.3 音频编码基础和标准2.4 音乐合成和MIDI2.5 语音识别3737YOUR SITE HERE音频卡的功能和分类 根据多媒体计算机根据多媒体计算机(MPC)MPC)的技术标准,声卡是多媒体的技术标准,声卡是多媒体技术中最基本的组成部分,
18、技术中最基本的组成部分,是实现声波是实现声波/数字信号相互转数字信号相互转换的硬件电路。换的硬件电路。3838YOUR SITE HERE音频卡的功能和分类 声卡把来自话筒、磁带、声卡把来自话筒、磁带、光盘的原始声音信号加以转换,光盘的原始声音信号加以转换,输出到耳机、扬声器、扩音机、输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音录音机等声响设备,或通过音乐设备数字接口乐设备数字接口(MIDI)MIDI)使乐器使乐器发出美妙的声音。发出美妙的声音。3939YOUR SITE HERE一、音频卡的功能1 1、录制、录制(采集采集)数字声音文件数字声音文件 通过声卡及相应驱动程通过声卡及相
19、应驱动程序的控制,采集来自话筒序的控制,采集来自话筒(麦麦克风克风)、收录机等音源的信号,、收录机等音源的信号,压缩后存放于微机系统的内压缩后存放于微机系统的内存或硬盘中。存或硬盘中。4040YOUR SITE HERE2 2、播放数字声音文件、播放数字声音文件 将硬盘或激光盘片压将硬盘或激光盘片压缩的数字化声音文件还原,缩的数字化声音文件还原,重建高质量的声音信号,重建高质量的声音信号,放大后通过扬声器输出。放大后通过扬声器输出。4141YOUR SITE HERE3 3、编辑与合成声音文件、编辑与合成声音文件 对数字化的声音文件对数字化的声音文件进行编辑加工,以达到某进行编辑加工,以达到某
20、一特殊的效果。一特殊的效果。4242YOUR SITE HERE4 4、控制音源的音量、控制音源的音量 控制音源的音量,对控制音源的音量,对各种音源进行混合,即声各种音源进行混合,即声卡具有混响器的功能。卡具有混响器的功能。4343YOUR SITE HERE5 5、压缩和解压缩、压缩和解压缩 编码和解码。采集数据时,编码和解码。采集数据时,对数字化声音信号进行压缩,对数字化声音信号进行压缩,以便存储。播放时,对压缩的以便存储。播放时,对压缩的数字化声音文件进行解压。数字化声音文件进行解压。4444YOUR SITE HERE6 6、文语转换(语音合成)、文语转换(语音合成)通过文语转换软件,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 音频 信息处理 基础知识
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内