《音频信号处理技术.ppt》由会员分享,可在线阅读,更多相关《音频信号处理技术.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、*14.2音频信号处理技术音频信号处理技术课程内容:课程内容:11版第版第4章章 4.2*2音频信号处理技术音频信号处理技术1.1.音频的数字化与音频的数字化与MIDIMIDI合成音乐合成音乐 2.2.音频媒体的管理音频媒体的管理3.3.音频处理技术(音频处理技术(GoldWaveGoldWave)4.4.语音合成与识别技术语音合成与识别技术*3n n多媒体计算机中产生声音的方式多媒体计算机中产生声音的方式n外部声音源录制和重放:外部声音源录制和重放:Wave音频(波形音乐)音频(波形音乐)nMIDI电子电子音频音频4.2.1音频的数字化与音频的数字化与MIDI合成音乐合成音乐*4波形音频的数
2、字化波形音频的数字化nWindowsWindows中最基本的波形声音格式:中最基本的波形声音格式:扩展名是扩展名是.WAV.WAV 的文件的文件麦克风麦克风/录音机录音机/CD激光唱盘激光唱盘声卡声卡A/D转换转换(采样、量化采样、量化)声卡声卡D/A转换转换混音器混合后由混音器混合后由扬声器输出扬声器输出计算机存储计算机存储*5波形音频的数字化波形音频的数字化一、波形音频特征一、波形音频特征(三个参数三个参数)采样频率采样频率量化位数量化位数声道数声道数*6n采样频率:每秒从模拟声波中采集声音样本的个数。采样频率:每秒从模拟声波中采集声音样本的个数。频率越高,采集的样本数越多,声音质量越好,
3、占用频率越高,采集的样本数越多,声音质量越好,占用存储空间越大。存储空间越大。n人耳感受范围:人耳感受范围:0 020kHz20kHz 一般采用:一般采用:11.025kHz11.025kHz、22.05kHz22.05kHz、44.1kHz44.1kHz 波形音频三个参数波形音频三个参数n对原始声波采样对原始声波采样n采样后得到的数据采样后得到的数据*7n量化位数:将采样数据按大小存储的过程。量化位数:将采样数据按大小存储的过程。一般有一般有8 8、1616、3232位等,量化位数越大,声音的幅度分辨位等,量化位数越大,声音的幅度分辨率越高,还原时声音的品质越好,声音数据占用的存储空率越高,
4、还原时声音的品质越好,声音数据占用的存储空间越大间越大波形音频三个参数波形音频三个参数*8n声道数:数字音频声音质量的另一个因素。声道数:数字音频声音质量的另一个因素。一般有单声道一般有单声道 、双声道、多声道、双声道、多声道n存储量计算:存储量计算:采样频率采样频率量化位数量化位数声道数声道数时间时间8(8(字节字节)举例:举例:采样频率采样频率44.1kHz44.1kHz,1616位量化,双声道,一分钟的位量化,双声道,一分钟的音频所需要的存储量为:音频所需要的存储量为:44.144.11000100016162 260/8=1058400060/8=10584000(字节)(字节)波形音
5、频三个参数波形音频三个参数*9Wave音频文件音频文件 n标准数字音频,扩展名是标准数字音频,扩展名是.WAV.WAV n多数声卡能以多数声卡能以1616位、位、44.1kHz44.1kHz采样率录采样率录制和播放制和播放 n主要缺点:产生的文件太大,不适合主要缺点:产生的文件太大,不适合长时间记录长时间记录 n压缩方法:从压缩方法:从PCM(PCM(均匀量化均匀量化)到到ADPCMADPCM(自适应差分量化)自适应差分量化)*10Wave音频文件的制作工具音频文件的制作工具n录音机:录音机:WaveWave文件录制、播放和进行一些简单文件录制、播放和进行一些简单处理的基本工具处理的基本工具n
6、AdobeAdobe AuditionAuditionnUleadUlead AudioAudio EditorEditornGoldWaveGoldWave*11MIDI合成音乐合成音乐MIDIMIDI(Musical Instrument Digital InterfaceMusical Instrument Digital Interface)nMIDIMIDI是乐器数字接口的缩写,文件扩展名是是乐器数字接口的缩写,文件扩展名是 .MID.MID nMIDIMIDI文件的内容是能使文件的内容是能使合成音乐芯片合成音乐芯片演奏乐演奏乐曲的代码曲的代码n多媒体多媒体PCPC平台能够通过内部合
7、成器或连接到平台能够通过内部合成器或连接到计算机计算机MIDIMIDI端口的外部合成器播放端口的外部合成器播放MIDIMIDI文件文件 *12MIDI合成音乐合成音乐 产生:产生:合成器:合成器:电子乐器演奏时的电子乐器演奏时的指令信息指令信息声卡声卡Midi控制器控制器声卡声卡合成器合成器混音器混合后由混音器混合后由扬声器输出扬声器输出计算机存储计算机存储FM合成器合成器波表合成器波表合成器*13合成器合成器n利用利用DSPDSP或其他芯片产生音乐或声音的电子装置或其他芯片产生音乐或声音的电子装置n FMFM合成器合成器n采用频率调制的原理产生声音采用频率调制的原理产生声音 nFMFM合成器
8、能发出合成器能发出128128种乐器的声音种乐器的声音 n波表合成器波表合成器n对真实乐器声采样,制波表保存,由对真实乐器声采样,制波表保存,由DSPDSP查表调用处查表调用处理理nDSP(digital signal processor)是一种独特的微处理器,是以数字信号来处理大量信息的器件。其工作原理是接收模拟信号,转换为0或1的数字信号,再对数字信号进行修改、删除、强化,并在其他系统芯片中把数字数据解译回模拟数据。n声音效果与真实的乐器声几乎无差别声音效果与真实的乐器声几乎无差别n声卡带有波形表声卡带有波形表ROMROM的接口的接口 或或 本身带有波形表本身带有波形表ROMROMnROM
9、ROM的容量越大,可存储的乐器音就越多的容量越大,可存储的乐器音就越多*14MIDI音乐产生原理音乐产生原理nMIDIMIDI标准:规定了电子乐器与计算机连接的电缆、标准:规定了电子乐器与计算机连接的电缆、硬件标准和通信协议硬件标准和通信协议n乐谱的数字描述(乐谱的数字描述(MIDIMIDI指令信息)指令信息)n由音符序列、定时和多达由音符序列、定时和多达1616个通道的演奏音符个通道的演奏音符定义组成定义组成n演奏音符定义由键号、通道号、音长、音量和演奏音符定义由键号、通道号、音长、音量和力度组成力度组成n建立建立MIDIMIDI文件:设备演奏时输入或软件编辑产生文件:设备演奏时输入或软件编
10、辑产生nMIDIMIDI文件特点:是一系列指令不是波形,文件小文件特点:是一系列指令不是波形,文件小 nMIDIMIDI设备端口设备端口 :MIDI InMIDI In、MIDI OutMIDI Out、MIDI Thru MIDI Thru 媒体播放器可直接播放媒体播放器可直接播放*154.2.2音频媒体管理音频媒体管理 nWindows Media Playern媒体文件的导入媒体文件的导入n媒体文件的管理媒体文件的管理音频媒体管理音频媒体管理*16菜单栏功能选项卡播放列表窗口切换按钮地址栏工具栏导航窗格详细信息窗格播放控制区*17音频的格式音频的格式1.1.WAVWAV格式:格式:Win
11、dowsWindows标准波形文件,多标准波形文件,多数音频编辑软件支持,文件较大。数音频编辑软件支持,文件较大。2.2.MP3MP3格式格式:高压缩比,文件较小,音质:高压缩比,文件较小,音质接近接近CDCD。3.3.MIDIMIDI文件文件:存储指令,文件短小,播:存储指令,文件短小,播放效果因软硬件而异。放效果因软硬件而异。*18音频的格式音频的格式4.4.CDCD格式格式:音质最好的数字音频格式,:音质最好的数字音频格式,CDACDA文件只含索引信息。文件只含索引信息。5.5.RealAudioRealAudio格式格式:适用网上在线音乐欣:适用网上在线音乐欣赏,可随带宽不同改变音质。
12、赏,可随带宽不同改变音质。6.6.WMAWMA格式格式:音质强于:音质强于MP3MP3,内置版权保,内置版权保护技术,支持音频流技术。护技术,支持音频流技术。媒体的播放、转换与分享媒体的播放、转换与分享n媒体文件的播放媒体文件的播放nWindows Media Player可以播放影音媒可以播放影音媒体文件、影音体文件、影音CD、DVD、图片。、图片。n声音格式的转换声音格式的转换n将将CD音乐文件转换为音乐文件转换为WMA、MP3或或WAVnCD翻录音乐翻录音乐*194.2.3音频处理技术音频处理技术n音频处理:音频处理:n录音录音n编辑编辑n添加音效添加音效n格式转换格式转换nGoldWa
13、ve:数字音乐编辑器:数字音乐编辑器*20GoldWave界面界面*21使用使用GoldWave录音录音n录制从麦克风输入的声音录制从麦克风输入的声音n录制计算机中其他播放器通过声卡播放录制计算机中其他播放器通过声卡播放的声音的声音*22声音的编辑声音的编辑n剪裁波形剪裁波形n删除波形删除波形n复制、粘贴波形复制、粘贴波形n混音混音*23声音的特效处理声音的特效处理n调整音量调整音量n调整播放时间和播放速度调整播放时间和播放速度n添加回声添加回声n音乐淡入淡出效果音乐淡入淡出效果n消除音乐中的静音段消除音乐中的静音段*24利用利用GoldWave转换音频格式转换音频格式n单个文件转换单个文件转
14、换n文件文件/另存为另存为n“保存声音为保存声音为”对话框中选择保存类型对话框中选择保存类型n批量转换文件格式批量转换文件格式n文件文件/批处理批处理n“批处理批处理”对话框添加文件对话框添加文件n选中选中“转换文件格式为转换文件格式为”复选框复选框n选择选择“另存类型另存类型”*25*264.2.4语音合成与识别语音合成与识别 n语音合成技术语音合成技术-赋计算机赋计算机“讲话讲话”能力能力-用语音输出结果用语音输出结果n语音识别技术语音识别技术 n使计算机具有使计算机具有“听懂听懂”语音的能语音的能力力 n用语音替代键盘输入用语音替代键盘输入*27语音合成与识别语音合成与识别 一、语音合成
15、技术一、语音合成技术n方法:语音合成方法、参数合成方法方法:语音合成方法、参数合成方法 n目标:可懂、清晰、自然、具有表现力目标:可懂、清晰、自然、具有表现力 n应用:文语转换(应用:文语转换(TTSTTS)二、语音识别技术二、语音识别技术 nViaVoiceViaVoice中文连续语音识别系统中文连续语音识别系统输入速度:输入速度:150150汉字汉字/分分识别率:识别率:95%95%n发展方向:发展方向:n自然话语识别与理解自然话语识别与理解n解决语音识别中的一系列难题解决语音识别中的一系列难题习题与实践习题与实践n实验实验16 多媒体技术体验多媒体技术体验n准备:可以事先拍摄数码照片带来,并带相准备:可以事先拍摄数码照片带来,并带相关驱动程序关驱动程序n实验实验17 声音的处理声音的处理n准备:自己携带耳机话筒准备:自己携带耳机话筒n自己携带音乐自己携带音乐CD唱片唱片n体验:体验:n语音合成:语音合成:Windows讲述人讲述人n语音识别:语音识别:Windows语音识别语音识别*28
限制150内