欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年音频基础知识及编码原理 .pdf

    • 资源ID:28407064       资源大小:603.43KB        全文页数:9页
    • 资源格式: PDF        下载积分:4.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要4.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年音频基础知识及编码原理 .pdf

    读书之法 ,在循序而渐进 ,熟读而精思一、基本概念1 比特率:表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,单位常为 kbps 。2 响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。3 采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指每秒钟采集多少个样本。Nyquist 采样定律:采样率大于或等于连续信号最高频率分量的2 倍时,采样信号可以用来完美重构原始连续信号。二、常见音频格式1. WAV 格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持,压缩率低。2. MIDI 是 Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式, 规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思输的协议,可以模拟多种乐器的声音。MIDI 文件就是MIDI 格式的文件,在MIDI 文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。3. MP3 全称是 MPEG-1 Audio Layer 3,它在 1992 年合并至MPEG 规范中。 MP3 能够以高音质、低采样率对数字音频文件进行压缩。应用最普遍。4. MP3Pro是由瑞典Coding 科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3 的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro 可以在基本不改变文件大小的情况下改善原先的MP3 音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。5. MP3Pro是由瑞典Coding 科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3 的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro 可以在基本不改变文件大小的情况下改善原先的MP3 音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。6. WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA 格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18 。此外, WMA 还可以通过DRM ( Digital Rights Management)保护版权。7. RealAudio是由 Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。现在的RealAudio文件格式主要有RA(RealAudio)、RM(RealMedia ,RealAudio G2 )、 RMX(RealAudio Secured)等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽敞的听众获得较好的音质。8. Audible拥有四种不同的格式:Audible1 、2、3、4。A网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种A 专用音频格式中的一种提供保护。 每一种格式主要考虑音频源以及所使用的收听的设备。格式 1、2 和 3 采用不同级别的语音压缩,而格式4 采用更低的采样率和MP3 相同的解码方式,所得到语音吐辞更清楚,而且可以更有效地从网上进行下载。Audible 所采用的是他们自己的桌面播放工具,这就是 Audible Manager,使用这种播放器就可以播放存放在PC 或者是传输到便携式播放器上的 Audible 格式文件精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思9AAC 实际上是高级音频编码的缩写。AAC 是由 Fraunhofer IIS-A、杜比和 AT&T 共同开发的一种音频格式,它是MPEG-2 规范的一部分。AAC 所采用的运 算法 则与 MP3 的运算法则有所不同,AAC 通过结合其他的功能来提高编码效率。AAC 的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3 等)。它还同时支持多达48 个音轨、 15 个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3 文件缩小30%的前提下提供更好的音质。10. Ogg Vorbis 是一种新的音频压缩格式,类似于MP3 等现有的音乐格式。但有一点不同 的是,它是完全免费 、开放和没有专利限制的。Vorbis 是这种音频压缩机制的名字,而Ogg 则是一个计划的名字,该计划 意图 设计 一个完全开放性的多媒体系统。VORBIS 也是有损压缩,但通过使用更加先进的声学模型去减少损失,因此,同样位速率(Bit Rate) 编码的 OGG 与 MP3 相比听起来更好一些。11. APE 是一种无损压缩音频格式,在音质不降低的前提下,大小压缩到传统无损格式WAV 文件的一半 . 12 .FLAC 即是 Free Lossless Audio Codec的缩写,是一套著名的自由音频无损压缩编码,其特点是无损压缩。三、音频编码基本原理语音编码致力于:降低传输所需要的信道带宽,同时保持输入语音的高质量。语音编码的目标在于:设计低复杂度的编码器以尽可能低的比特率实现高品质数据传输。1 静音阈值曲线:只在安静环境下,人耳在各个频率能听到声音的阈值。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思2 临界频带由于人耳对不同频率的解析度不同,MPEG1/Audio将 22khz 内可感知的频率范围,依不同编码层,不同取样频率,划分成2326 个临界频带。下图列出理想临界频带的中心频率与频宽。图中可看到,人耳对低频的解析度较好。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思图 5 3 频域上的掩蔽效应:幅值较大的信号会掩蔽频率相近的幅值较小的信号,如下图:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思4 时域上的遮蔽效应: 在一个很短的时间内, 若出现了 2 个声音,SPL (sound pressure level)较大的声音会掩蔽SPL 较小的声音。 时域掩蔽效应分前向掩蔽(pre-masking )和后向掩蔽(post-masking),其中 post-masking的时间会比较长,约是pre-masking的 10 倍。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思时域遮蔽效应有助于消除前回音。四、编码基本手段1 量化和量化器量化和量化器: 量化是把离散时间上的连续信号,转化成离散时间上的离散信号。常见的量化器有:均匀量化器,对数量化器,非均匀量化器。量化过程追求的目标是:最小化量化误差,并尽量减低量化器的复杂度(这2 者本身就是一个矛盾)。(a)均匀量化器:最简单,性能最差,仅适应于电话语音。(b)对数量化器:比均匀量化器复杂,也容易实现,性能比均匀量化器好。(c)Non-uniform量化器:根据信号的分布情况,来设计量化器。信号密集的地方进行细致的量化,稀疏的地方进行粗略量化。2 语音编码器语音编码器分为三种类形:(a)波形编器;( b)声码器 ;( c)混合编码器。波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号,因此会产生高质量的样值并且耗费较高的比特率。而声码器 (vocoder )不会再生原始波形。这组编码器 会提取一组 参数 ,这组参数被送到接收端,用来导出语音产生模形。声码器语音质量不够好。混合编码器,它融入了波形编码器和声器的长处。2.1 波形编码器波形编码器的设计常独立于信号。所以适应于各种信号的编码而不限于语音。1 时域编码a)PCM :pulse code modulation,是最简单的编码方式。仅仅是对信号的离散和量化,常采用对数量化。b)DPCM : differential pulse code modulation,差分脉冲编码,只对样本之间的差异进行编码。 前一个或多个样本用来预测当前样本值。用来做预测的样本越多,预测值越精确。真实值和预测值之间的差值叫残差,是编码的对象。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思c) ADPCM : adaptive differential pulse code modulation, 自适应差分脉冲编码。即在 DPCM的基础上, 根据信号的变化,适当调整量化器和预测器,使预测值更接近真实信号,残差更小,压缩效率更高。(2)频域编码频域编码是把信号分解成一系列不同频率的元素,并进行独立编码。a)sub-band coding:子带编码是最简单的频域编码技术。是将原始信号由时间域转变为频率域, 然后将其分割为若干个子频带,并对其分别进行数字编码的技术。它是利用带通滤波器(BPF) 组把原始信号分割为若干(例如 m 个)子频带 (简称子带 )。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频率附近,分别经过BPF( 共 m 个)之后,再以规定的速率 (奈奎斯特速率)对各子带输出信号进行取样,并对取样数值进行通常的数字编码,其设置 m 路数字编码器。将各路数字编码信号送到多路复用器,最后输出子带编码数据流。对不同的子带可以根据人耳感知模型,采用不同量化方式以及对子带分配不同的比特数。b)transform coding:DCT 编码。6 声码器channel vocoder:利用人耳对相位的不敏感。homomorphic vocoder:能有效地处理合成信号。formant vocoder:以用语音信号的绝大部分信息都位于共振峰的位置与带宽上。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 9 页读书之法 ,在循序而渐进 ,熟读而精思linear predictive vocoder:最常用的声码器。7 混合编码器波形编码器试图保留被编码信号的波形,能以中等比特率(32kbps )提供高品质语音,但无法应用在低比特率场合。声码器试图产生在听觉上与被编码信号相似的信号,能以低比特率提供可以理解的语音,但是所形成的语音听起来不自然。混合编码器结合了2 者的优点。RELP :在线性预测的基础上,对残差进行编码。机制为:只传输小部分残差,在接受端重构全部残差(把基带的残差进行拷贝)。MPC:multi-pulse coding,对残差去除相关性,用于弥补声码器将声音简单分为voiced 和unvoiced ,而没有中间状态的缺陷。CELP:codebook excited linear prediction,用声道预测其和基音预测器的级联,更好逼近原始信号。MBE:multiband excitation,多带激励,目的是避免CELP 的大量运算,获得比声码器更高的质量。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 9 页

    注意事项

    本文(2022年音频基础知识及编码原理 .pdf)为本站会员(Q****o)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开