多媒体技术与网页制作.ppt
数字音频技术,曾兰芳 教育技术学院zenglf2003163.com,声音及其属性数字化音频音频压缩技术音频文件类型编辑制作数字音频素材GoldWave录音机,主要内容,一、声音及其属性,声音是由空气中分子的振动而产生的。它是通过空气传播的一种连续的波,叫声波。自然界的声音是一个随时间而变化的连续信号,可近似地看成是一种周期性的函数。通常用模拟的连续波形描述声波的形状,单一频率的声波可用一条正弦波表示。,声音的分类语音:人的说话声不仅是一种波形, 而且还通过语气、语速、语调携带着比文本更加丰富的信息。这些信息往往可以通过特殊的软件进行抽取。音乐:音乐是一种符号化了的声音,这种符号就是乐谱,音乐则是转变为符号媒体形式的声音。音效:为增进场面之真实感、气氛或戏剧信息,而加于声带上的杂音或声音。简单地说,音效就是指由声音所制造的效果。,声音的三要素音调:声音的高低(物理学定义);与声音的频率正相关。高音和低音音强:声音的响亮程度,与振幅相关,取决于声波信号的强弱,与声音信号的幅度成正比。分贝dB。常说的“音量”指的是音强。音色:音的感觉特性,与波形相关,取决于声波的频谱,由混入基音的泛音所决定。若中、高泛音丰富,音色就明亮;若低频泛音丰富,音色就低沉。,二、数字化音频,音频定义:人类听觉所感知范围内的频率,也称声频 按照人们听觉的频率范围,对声音的分类:次声波:频率低于20Hz的信号,也称为亚音频音频:频率范围在2020kHz的声音信号,人耳能够听到的声音信号。属于多媒体音频信息范畴。超声波:频率高于20kHz的声音信号,也称为超音频,图:按频率分类的声音,声音数字化,音频信号(Audio)是指带有语音、音乐和音效的有规律的声波的频率、幅度变化的信息载体。它分为模拟音频信号和数字音频信号两种。其中,模拟音频用模拟电压的幅度表示声音强弱,模拟声音在时间上是连续的。而数字音频是一个数据序列,在时间上是离散的,是由许多二进制数1和0组成的。,声音数字化(续1),模拟音频数字化:采样、量化、编码,采样-每隔一定时间间隔在模拟波形上取一个幅度值。量化-将每个采样点得到的幅度值以数字存储。编码-将采样和量化后的数字数据以一定的格式记录下来。,模拟信号,采样,量化,编码,数字信号,声音数字化(续2),数字音频的技术指标:采样频率: 每秒钟的采样次数奎斯特采样理论:采样频率f(1/T)高于输入信号最高频率的两倍,则经过采样后的采样信号能够包含原模拟信号的全部信息,且经过反变换和低通滤波后可不失真地恢复原模拟信号。 CD激光唱盘采样的三个标准频率分别为44.1kHz,22.05kHz和11.025kHz量化位数(采样精度、量化精度) :存放采样点振幅值的二进制位数。通常量化位数有8位、16位,分别表示有28、216个等级。声道数 :声音通道的个数 ,即一次同时产生的声波组数。,单声道比较原始的声音复制形式 ,缺乏位置感 。立体声声音在录制过程中被分配到两个独立的声道,很好的声音定位效果。准立体声在录制声音的时候采用单声道,而放音有时是立体声,有时是单声道。 四声道环绕规定了4个发音点:前左、前右,后左、后右,可以提供多个不同方向的声音环绕。5.1声道来源于4.1环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号,在欣赏影片时有利于加强人声。美国杜比AC-3(Dolby Digital)、欧洲DTS等。7.1声道在5.1的基础上又增加了中左和中右两个发音点,数字化声音的质量和存储量,数据量(Byte)(采样频率×量化精度×声道数×声音持续时间)/8,例如,CD音乐,用44.10 kHz的采样频率,16位的精度存储,一般是立体声(两个声道),则录制1秒钟的立体声节目,其WAV文件所需的存储量为:44 100×16×2/8=176 400(字节)0.176MBps一个小时的CD音乐需要约635MB的存储空间如果使用5.1声道,则存储量为: 44 100×16×5.1/8=0.45MBps一个小时的CD音乐需要约1.62G的存储空间,不同类型信号的采样频率和量化精度,三、音频压缩技术,对原始数字音频信号流(PCM)编码运用恰当的数字信号处理技术,在不损失有用信息量,或引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。,音频数据压缩比压缩后的音频数据/压缩前的音频数据,音频压缩算法的主要分类,无损压缩利用信息相关性进行的数据压缩并不损失原信息的内容。是一种可逆压缩,即经过文件压缩后可以将原有的信息完整保留的一种数据压缩方式,如wav、flac、ape等格式。有损压缩经压缩后不能将原来的文件信息完全保留的压缩,是不可逆压缩。如JEPG、MPEG压缩,常见格式如mp3、wma。,音频压缩技术标准,国际电报电话咨询委员会 CCITT(现国际电信联盟 ITU-T)标准16Kbps CCITT标准化方案G.728:面向带宽为64Kbps的ISDN线路的可视电话上32Kbps CCITT标准化方案G.721:应用于电视会议系统的语音编码和数字电话的语音合成64Kbps CCITT标准化方案G.722:面向7kHz带宽以语音和音乐为对象的标准化音响编码方案MPEG-1:规定了音频压缩三种模式层I、层II(MP2)、层III(MP3)Dolby AC-3:多声道音频信号压缩MPEG-2BC:多声道音频信号压缩,四、音频文件格式,声音文件格式MIDI文件格式,声音文件格式,波形文件,Windows本身存放数字声音的标准格式,扩展名.wav ,是一种未经压缩处理的音频数据。体积大(1分钟的波形文件需要10MB)。CD Audio,亦称CD音乐,扩展名.cda。记录的是波形流,无法编辑,文件大。Real Audio,扩展名.ra、.ram,Real公司开发的主要适用于网上实时数字音频流技术的文件格式。高保真方面不及mp3。需要使用Real Player。 MPEG-3,扩展名.mp3。压缩率大。音质不及波形文件。 MIDI,扩展名.mid,目前最成熟的音乐格式,实际上已经成为一种产业标准。优点是短小,缺点是播放效果因软、硬件而异。RMI文件,Microsoft公司的MIDI文件格式,可以包括图片标识和文本。,声音文件格式 (续1),Creative Musical Format,扩展名.cmf,Creative公司的专用音乐格式,和MIDI差不多,在音色和效果上有些特色,专用于FM音频卡,兼容性差VOC文件,Creative 公司的波形文件格式,也是声霸卡使用的音频文件格式。每个VOC文件由文件头块Header Block和音频数据块Data Block组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据静音标识ASCII码文件重复的结果及终止标志、扩展块等PCM文件,模拟音频信号经A/D转换直接形成的二进制序列,该文件没有附加的文件头和文件结束的标志。,MIDI,什么是MIDIMIDI(Musical Instrument Digital Interface)是乐器数字接口的英文缩写,它是指数字乐器与计算机连接的接口,即在数字乐器与计算机相连接时所使用的可以直接插入在计算机串口上的一个小部件,通过它可以使数字乐器与计算机相互“沟通”信息。 MIDI的特点是其文件内部记录的是演奏数字音乐的全部动作过程。比如,音色、音符、延时、音量、力度等信息,所以其数据量很小。,MIDI端口:一台MIDI设备可以有一至三个MIDI端口,MIDI In、MIDI Out、MIDI Thru。MIDI In接收来自其它MIDI设备的MIDI信息;MIDI Out发送本设备上生成的MIDI信息到其它设备;MIDI Thru将从MIDI In端口传来的信息转发到相连的另一台MIDI设备上。MIDI键盘:用于MIDI乐曲演奏,本身不发出声音,当作曲人员触动键盘上的按键时,就发出按键信息,所产生的仅仅是MIDI音乐消息,再由音序器录制生成MIDI文件。 音序器:用于记录、编辑、播放MIDI的声音文件。合成器:解释MIDI文件中的指令符号,生成所需要的声音波形,经放大后由扬声器输出 。,MIDI文件格式,MIDI扩展名为.mid,目前最成熟的音乐格式。RMI文件Microsoft公司的MIDI文件格式。,五、编辑制作数字音频素材,常见数字音频处理软件,VegasSONY公司推出的一款整合视频与音效编辑的软件。将剪辑、特效、专长、烧录等功能正合为一体。适用与专业人士或个人用户。Cool Edit/ Adobe Audition以前是数字音频软件制作公司Syntrillium Software的产品,Syntrillium的旗舰软体就是-Cool Edit Pro。现在被Adobe 公司收购了,并升级为Adobe Audition SoundForgeSonicFoundry公司开发的产品。SoundForge处理的是相对比较庞大的音频和视频文件,对磁盘空间和碎片等指标都有一定的要求。,GoldWave,可对音频编辑、播放、录制、转换,体积小巧。可打开的音频文件包括WAV, OGG, VOC, IFF, AIF, AFC, AU, SND, MP3, MAT, DWD, SMP, VOX, SDS, AVI, MOV, APE等格式。可从 CD 或 VCD 或 DVD 或其它视频文件中提取音频。,如何从CD中获取音频,把CD放入光驱在GoldWave中,选择工具菜单/CD读取器选择相应的曲目选取“保存”,修改保存路径后,单击“确定”。,录音前的准备,录音之前,一定要调整声音控制面板参数,在GoldWave中录音,新建文档:“文件”菜单/新建,设置采样频率、持续时间单击控制器上的红色录音按钮,开始录音(如录制一首诗)保存文件,选择要处理的音频,如何选择一段音乐在播放过程中,设置开始和结束标志,可以选出你需要的部分。特点是边听边选,比较精确。编辑/标记/放置开始标记 或 放置结束标记在非播放状态,首先选择选示按钮,然后利用鼠标拖动画框,就可以选择相应的部分。如何选择一个声道编辑/声道/左声道 shift+ctrl+L编辑/声道/右声道 shift+ctrl+R,简单声音编辑,删除声音片断不选择声道的时候,删除片断选择某声道的时候,删除片断剪贴片断静音处理选择编辑区域,编辑/静音与删除声音片断不同的是,变成静音的编辑区域仍然存在,其时间长度不变,声音的淡入淡出效果选择需要设置淡入或淡出效果的区域,可以是单声道,也可以是双声道单击淡入或淡出效果按钮,设置淡入或者淡出效果混响设置选择区域设置混响,特殊音效机器人声音:把原始声音加工成类似机器发出的声音。倒序声音:将声音数据反相排列。时间调整改变声音的长度(缩短或者加长)整个声音文件,或者局部编辑区域,去噪先选择波形,然后点击【效果】菜单中的“滤波器”中的“降噪”在预置中选择“减少嗡嗡声”,点击确定,制作实例:语音和背景音乐的合成,如何实现声音合成:背景音乐和人的声音打开背景音乐,并复制新建一个文件,把背景音乐粘贴过来打开人声文件,并复制在刚才新建的文件中,编辑/混音,如何去掉不想要的部分,比如开头部分在最开始的地方,单击右键,设置开始标志播放音乐,在需要的地方暂停单击右键,设置结束标志删除即可,音乐淡出-朗读声-音乐淡出首先在英语朗读文件的前面添加10秒钟的静音效果,同时把朗读文件后部不必要的部分删除。在背景音乐的前部和后部设置淡出和淡入效果,中间部分设置音量变化(把声音变小)把英语朗读文件与背景音乐文件进行混音合成,如何调整背景音乐的音量?打开背景音乐选择需要调整音量的部分效果/音量/更改,调整相关的参数即可,交叉减弱效果,比如音乐逐渐减弱,语音逐渐增强,或者相反打开语音文件打开音乐文件,并选择某段音乐复制点击语音文件,编辑/交叉减弱,设置是在文件头还是文件尾,设置交叉减弱的时间、曲线等。,GoldWave,软件主要功能以不同的采样频率录制声音信号:语音、CD等声音剪辑:截取声音、去掉某段声音、移动某段声音、连接两段声音等增加特殊效果:混响、回声、改变频率产生特殊效果、声音的淡入淡出效果等文件操作:新建、调入、保存或删除数字音频文件,录音机的使用,录音机的使用程序/附件/娱乐/录音机,如何录制声音,如何处理声音,