现代通信技术通信业务.ppt
《现代通信技术通信业务.ppt》由会员分享,可在线阅读,更多相关《现代通信技术通信业务.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现代通信技术通信业务现在学习的是第1页,共54页模拟与数字视音频业务u在现代通信系统中尽管数据业务与多媒体通信业务发展非常迅速u但但模拟与数字视、音频业务在所有通信业务中仍然占有主要地位。u在此类业务中包括普通电话、IP电话、移动电话、数字电话、可视电话、会议电视、广播电视、数字视频广播、点播电视等各种视音频业务。现在学习的是第2页,共54页音频信息基本概念 u在现代通信技术中音频信息主要是指由自然界中各种音源发出的可闻声和由计算机通过专门设备合成的语音或音乐。u按表示媒体的不同,此类声音主要有3类,即语音、音乐声和效果声等。p音频信号是随时间变化的连续媒体。p对音频信号的处理要求有比较强的时
2、序性,即较小的延时和时延抖动。p对音频信号的处理涉及音频信号的获取、编解码、传输、语音的识别与理解、语音与音乐的合成等内容。现在学习的是第3页,共54页视频信息u视频信息即活动或运动的图像信息,它由一系列周期呈现的画面所组成,每幅画面称为一帧,帧是构成视频信息的最基本单元。视频信息在现代通信系统所传输的信息中占有重要的地位,因为人类接受的信息约有70来自视觉,所以视频信息具有准确、直观、具体生动、高效、应用广泛、信息容量大等特点。现在学习的是第4页,共54页听觉特性与音频信号u人的听觉特性 p 人对声音强弱的感觉:通过对人群测试发现,当声音信号的强度按指数规律增长时,人会大体上感到声音在均匀地
3、增强,即将声音声强取对数后,才与人对声音的强弱感相对应。根据人类听觉的这一特点,通常用声强值或声压有效值的对数来表示声音的强弱,称为声强级LI或声压级LP,单位为分贝。p 人对声音频率的感觉:人对声音频率的感觉表现为音调的高低,当声音的频率按指数规律上升时,音调的感觉线性升高。这意味着只有对声音信号的频率取对数,才会与人的音高感觉成线性关系。为了适应人类听觉的音高感规律,在声学和音乐当中表示频率的坐标经常采用对数刻度。现在学习的是第5页,共54页听觉特性与音频信号p人类听觉的频响特性:l人的听觉频带为20 Hz20 kHz,在此频率范围内的声音称为“可闻声”。l高于 20 kHz的声音称为“超
4、声”,低于 20 Hz的声音称为“次声”。l不论声压级高低,人对 35 kHz频率的声音最敏感。l 人类听觉的掩蔽效应:在人类听觉系统中的另一个现象是一个声音的存在会影响人们对其他声音的听觉能力,使一个声音在听觉上掩蔽了另一个声音,即所谓的“掩蔽效应”。通信、电声系统常利用该特性。现在学习的是第6页,共54页听觉特性与音频信号p音频信号特性l电话通信中每一话路的频带一般限制在 300 Hz 3.4 kHz即可将语声信号中的大部分能量发送出去,同时保持一定的可懂度和声色的平衡。l与人的发声器官相比,各种乐器发声的频谱范围则要宽得多,从完美传送和记录音乐的角度,电声设备的频带下限一般要到 1620
5、 Hz以上。l实际声音信号的强度在一个范围内随时发生着改变,其最大声强与最小声之差称为声音信号的动态范围,用分贝表示。l一般语音信号约有2040dB,交响乐、戏剧等声音信号的动态范围60-80dB,甚至超过100dB。现在学习的是第7页,共54页视频技术基础u视频技术是利用光电和电光转换原理,将光学图像转换为电信号进行记录或远距离传输,然后还原为光图像的一门技术。p视频信号与图像扫描:视频技术中实现光学图像到视频图像信号转换的过程通常是在摄像机中完成的。p彩色电视系统:按照三基色的原理设计和工作的。在彩色电视中由三种基色R,G,B构成亮度信号Y的比例关系:Y=0.299R+0587G+0.11
6、4B 电视系统的亮度方程现在学习的是第8页,共54页视频技术基础.至于二个色差信号,则是分别传送至于二个色差信号,则是分别传送红基色分量红基色分量和和蓝基色分量蓝基色分量与与亮亮度分量度分量的差值信号,即的差值信号,即U和和V现在学习的是第9页,共54页视频信号频谱特点 u电视系统是通过行、场扫描来完成图像的分解与合成的尽管图像内容是随机的,但视频信号仍具有行、场或帧的准周期特性。通过对静止图像电视信号进行频谱分析。可它是由行频、场频的基波及其各次谐波组成的,其能量以帧频为间隔对称地分布在行频各次谐波的两侧。而对活动图像的电视信号,其频谱分布为以行频及其个次谐波为中心的一簇簇连续的梳状谱。u对
7、于实际的视频信号,谐波的次数越高,其相对于的基波振幅的衰减越大。u在整个视频信号的频带中,没有能量的区域远大于有能量的区域。根据这一性质,模拟彩色电视系统利用频谱交错原理将亮度信号和色差信号进行半行频或1/4行频间置,完成彩色电视中亮度信号和色度信号的同频带传输。现在学习的是第10页,共54页视音频信息数字化u视音频信息数字化p音频信息时间上的离散化和图像信息空间位置的离散化;p音频信息电平值和图像灰度电平值的离散化。现在学习的是第11页,共54页视音频压缩编码信源存储量电话(2003400Hz)8000样本数/秒x12比特/样本=96kbps 宽带语音(507000Hz)16000样本数/秒
8、x14比特/样本=224kbps 宽带音频(2020000Hz)44100样本数/秒x2通道x16比特/样本=1.412Mbps 图像512x512像素彩色图像x24比特/像素=6.3兆比特/图像视频640 x480像素彩色图像x24比特/像素x30图像/秒=221Mbps 高清晰度电视1280 x720像素色彩图像x60图像/秒x24比特/像素=1.3Gbps 未压缩信源的大致比特率 现在学习的是第12页,共54页数据的冗余性 u数据之所以能够压缩是基本原始信源的数据存在着很大的冗余度。数据中存数据之所以能够压缩是基本原始信源的数据存在着很大的冗余度。数据中存在以下种类的数据冗余。在以下种类
9、的数据冗余。u 空间冗余空间冗余 p这是图像数据中经常存在的一种冗余。在同一幅图像中,规则物体这是图像数据中经常存在的一种冗余。在同一幅图像中,规则物体和规则背景(所谓规则是指表面颜色分布是有序的而不是完全杂乱和规则背景(所谓规则是指表面颜色分布是有序的而不是完全杂乱无章的)的表面物理特征具有相关性,这些相关性的光成像结构在无章的)的表面物理特征具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余。数字化图像中就表现为数据冗余。u 时间冗余时间冗余 p这是序列图像(电视图像、动画)和言语数据中所经常包含的冗余。图这是序列图像(电视图像、动画)和言语数据中所经常包含的冗余。图像序列中
10、的两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相像序列中的两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相关性,这反映为时间冗余。同理,在言语中,由于人在说话时发音的音关性,这反映为时间冗余。同理,在言语中,由于人在说话时发音的音频是一连续的渐变过程,而不是一个完全在时间上独立的过程,因而存频是一连续的渐变过程,而不是一个完全在时间上独立的过程,因而存在时间冗余。在时间冗余。u 信息熵冗余信息熵冗余 现在学习的是第13页,共54页数据的冗余性u知识冗余知识冗余 p有许多图像的理解与某些基础知识有相当大的相关性。例如,人脸的图有许多图像的理解与某些基础知识有相当大的相关性。例如,人脸的
11、图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面图像的中线上等等。这类规律性的结构可由先验知识和背景知识得到,图像的中线上等等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。我们称此类冗余为知识冗余。u 认知(视觉听觉)冗余认知(视觉听觉)冗余 p人类视觉系统对于图像场的任何变化,并不是都能感知的。例如,对于人类视觉系统对于图像场的任何变化,并不是都能感知的。例如,对于图像的编码和解码处理时,由于压缩或量化截断引入了噪声而使图像发图像的编码和解码处理时,由于压缩或量化截断引入了噪声而使图像发生
12、了一些变化,如果这些变化不能为视觉所感知,则仍认为图像足够好。生了一些变化,如果这些变化不能为视觉所感知,则仍认为图像足够好。事实上人类视觉系统一般的分辨能力约为事实上人类视觉系统一般的分辨能力约为2626灰度等级,而一般图像量灰度等级,而一般图像量化采用化采用2828灰度等级,这类冗余我们称为视觉冗余。对于听觉,也存在类灰度等级,这类冗余我们称为视觉冗余。对于听觉,也存在类似的冗余。似的冗余。现在学习的是第14页,共54页数据的冗余性u结构冗余结构冗余 p有些图像从大的区域上看存在着非常强的纹理结构,例如布纹图像和草有些图像从大的区域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说
13、它们在结构上存在冗余。席图像,我们说它们在结构上存在冗余。u其他冗余其他冗余 p例如由图像的空间非定常特性所带来的冗余。例如由图像的空间非定常特性所带来的冗余。p数据压缩就是去掉信号数据的冗余性。数据压缩常常又称为数据信源编数据压缩就是去掉信号数据的冗余性。数据压缩常常又称为数据信源编码,或简称为数据编码。与此对应,数据压缩的逆过程称为数据解压缩,码,或简称为数据编码。与此对应,数据压缩的逆过程称为数据解压缩,也称为数据信源解码,或简称为数据解码。也称为数据信源解码,或简称为数据解码。现在学习的是第15页,共54页常用压缩编码方法分类现在学习的是第16页,共54页视频压缩编码 长期以来,为了更
14、好地传输图像信号,图像压缩编码技术一直在不断地发展。到目前为止,已经发展了第一代基于像素的图像编码技术、第二代基于图像内容及人类视觉系统特征的图像编码技术。现在学习的是第17页,共54页视频压缩编码u第一代图象编码技术的实现相对简单,其编码实体是像素或像素块(8*8或16*16),它们具有以下的共同特点:p把图像分解成一些事先确定的固定大小的像素块,其块的划分方法与图像内容无关;p接收端获得的图像中每一像素,与原始图像中相对应的像素是相似的;p利用运动补偿技术减小时间冗余度,但不考虑图像内容的结构,几乎不考虑人眼的视觉特性。u u目前,采用这类编码方法的主要技术有:p无失真压缩编码:哈夫曼编码
15、、算术编码、游程编码等。p有失真压缩编码:预测编码:DPCM、运动补偿;频率域方法:正交变换编码(DCT),子带编码;空间域方法:统计分块法;基于重要性:滤波、子抽样、比特分配、矢量量化。现在学习的是第18页,共54页视频压缩编码u随着编码技术研究的逐步深入,人们发现第一代方法用于极低比特率的视频编码时有着较严重的局限性,几乎已达到压缩的饱和状态。u1985年,正式提出第二代图像编码技术。u第一代编码方法的着重点在于“如何给一个基于一定分割方式得到的图像消息序列分配合适的码字”。u第二代图像方法的着重点则在于“按照怎样的方式获得图像消息序列”,也就是说在第二代图像编码方法中,按图像的内容分割图
16、像生成消息序列,同时还结合了人眼的视觉特性。u第二代编码方法主要有:模型基图像序列编码;分析图像序列编码基;小波变换编码。现在学习的是第19页,共54页无失真压缩编码uHuffman编码p将符号按出现的概率排序,概率大的在后,概率小的在前。给最后的两个符号各赋予一个二进码,概率大的赋1,概率小的赋0(反之也可)。p把最后两个符号的概率加起来合成一个概率,再按大小重新排序。重新排序后重复步骤一的编码过程。p重复第二步,直到最后只剩下两个概率为止。p将每个符号所对应的各分支赋予的0,1值反向逆序排出,即得到各符号的编码。现在学习的是第20页,共54页无失真压缩编码Huffman示意图码长22333
17、44码字1 11 00 1 10 1 00 0 10 0 0 10 0 0 0符号a1a2a3a4a5a6a7概率0.2 0.190.180.170.150.100.01010001011011现在学习的是第21页,共54页无失真压缩编码u算术编码算术编码p 算术编码是另一种利用信源概率分布特性、能够算术编码是另一种利用信源概率分布特性、能够趋近熵极限的编码方法。趋近熵极限的编码方法。p它也是对出现概率大的符号采用短码,对出现概率它也是对出现概率大的符号采用短码,对出现概率小的符号采用长码。小的符号采用长码。p算术码与算术码与Huffman码不同,对各符号的编码输出并码不同,对各符号的编码输出
18、并不是固定的整数码。不是固定的整数码。p在信源概率分布比较均匀的情况下,其编码效率高在信源概率分布比较均匀的情况下,其编码效率高于于Huffman编码编码现在学习的是第22页,共54页无失真压缩编码u算术编码算术编码p算术编码的基本原理是将编码的消息表示成实数算术编码的基本原理是将编码的消息表示成实数0和和1之间的一个间隔(之间的一个间隔(Interval),消息越长,编),消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。制位就越多。p算术编码用到两个基本的参数:算术编码用到两个基本的参数:符号的概率符号的概率和它的和它的编码间隔
19、编码间隔。信源符号的概率决定压缩编码的效率,。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包也决定编码过程中信源符号的间隔,而这些间隔包含在含在0到到1之间。编码过程中的间隔决定了符号压缩之间。编码过程中的间隔决定了符号压缩后的输出。后的输出。现在学习的是第23页,共54页无失真压缩编码u给定事件序列的算术编码步骤如下:给定事件序列的算术编码步骤如下:p编码器在开始时将编码器在开始时将“当前间隔当前间隔”L,H)设置为设置为0,1)。p对每一事件,编码器按步骤(对每一事件,编码器按步骤(a)和()和(b)进行处理)进行处理(a)编码器将)编码器将“当前间隔当前间
20、隔”分为子间隔,每一个事分为子间隔,每一个事件一个。件一个。(b)一个子间隔的大小与下一个将出现的事件的概)一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的生的事件相对应,并使它成为新的“当前间隔当前间隔”。p最后输出的最后输出的“当前间隔当前间隔”的的下边界下边界就是该给定事件就是该给定事件序列的算术编码序列的算术编码现在学习的是第24页,共54页无失真压缩编码 假设信源符号为假设信源符号为A,B,C,D,这些符号的概率分别为,这些符号的概率分别为 0.1,0.4,0.2,0.3 p
21、根据这些概率可把间隔根据这些概率可把间隔0,1分成分成4个子间隔:个子间隔:0,0.1,0.1,0.5,0.5,0.7,0.7,1,其中,其中x,y表示半开放间隔,即包含表示半开放间隔,即包含x不包含不包含y。上面的信息可综合在下表中上面的信息可综合在下表中 符号A B C D 概率0.1 0.4 0.2 0.3 初始编码间隔0,0.1)0.1,0.5)0.5,0.7)0.7,1)现在学习的是第25页,共54页无失真压缩编码u如果二进制消息序列的输入为:如果二进制消息序列的输入为:C A D A C D B。p编码时首先输入的符号是编码时首先输入的符号是C,找到它的编码范围是,找到它的编码范围
22、是0.5,0.7。p由于消息中第二个符号由于消息中第二个符号A的编码范围是的编码范围是0,0.1,因此它的间隔就取因此它的间隔就取0.5,0.7的第一个十分之一的第一个十分之一作为新间隔作为新间隔0.5,0.52。p依此类推,编码第依此类推,编码第3个符号个符号D时取新间隔为时取新间隔为0.514,0.52,p编码第编码第4个符号个符号A时,取新间隔为时,取新间隔为0.514,0.5146p消息的编码输出可以是最后一个间隔中的任意数消息的编码输出可以是最后一个间隔中的任意数现在学习的是第26页,共54页无失真压缩编码u整个编码过程整个编码过程现在学习的是第27页,共54页无失真压缩编码输入符号
23、编码间隔编码判决1 C 0.5,0.7 符号的间隔范围0.5,0.7 2 A 0.5,0.52 0.5,0.7间隔的第一个1/10 3 D 0.514,0.52 0.5,0.52间隔的最后一个1/10 4 A 0.514,0.5146 0.514,0.52间隔的第一个1/10 5 C 0.5143,0.51442 0.514,0.5146间隔的第五个1/10开始,二个1/10 6 D 0.514384,0.51442 0.5143,0.51442间隔的最后3个1/10 7 B 0.5143836,0.514402 0.514384,0.51442间隔的4个1/10,从第1个1/10开始8 从0
24、.5143876,0.514402中选择一个数作为输出:0.5143876 现在学习的是第28页,共54页无失真压缩编码u游程编码游程编码p一般地,典型二值图像在每一扫描行上,总是由一般地,典型二值图像在每一扫描行上,总是由若若干段连着的白象素干段连着的白象素和和连着的黑象素组成连着的黑象素组成。我们分别。我们分别称其为称其为白长白长和和黑长黑长。p白长和黑长总是交替出现。白长和黑长总是交替出现。p对不同长度的白长和黑长按对不同长度的白长和黑长按其不同的出现概率分配其不同的出现概率分配以不同长度的码字以不同长度的码字,就是,就是游程长度编码游程长度编码。p游程长度编码有两种方式。游程长度编码有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 通信 技术 业务
限制150内