多媒体技术综述PPT讲稿.ppt
《多媒体技术综述PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《多媒体技术综述PPT讲稿.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体技术综述多媒体技术综述北京市多媒体与智能软件技术重点实验室北京市多媒体与智能软件技术重点实验室 第1页,共33页,编辑于2022年,星期六 多媒体数据压缩的必要性多媒体数据压缩的必要性 音视频压缩标准的发展音视频压缩标准的发展 图像图像/视频编码技术的现状及发展趋势视频编码技术的现状及发展趋势第2页,共33页,编辑于2022年,星期六多媒体数据压缩的必要性多媒体数据压缩的必要性多媒体数据的显著特点:多媒体数据的显著特点:数据量非常大数据量非常大一张彩色相片的数据量可达一张彩色相片的数据量可达1010MBMB;一路高清晰度电视信号(一路高清晰度电视信号(HDTVHDTV),不压缩需),不压
2、缩需 1Gbps 1Gbps,利用,利用MPEG-2MPEG-2压缩后,尚需压缩后,尚需20Mbps20Mbps解决办法:解决办法:数据压缩数据压缩压缩后再进行存储和传输,到需要时再解压、还原。压缩后再进行存储和传输,到需要时再解压、还原。第3页,共33页,编辑于2022年,星期六多媒体数据压缩的必要性多媒体数据压缩的必要性多媒体数据压缩的可能性:多媒体数据压缩的可能性:多媒体数据存在高度的相关性多媒体数据存在高度的相关性 (冗余度,相似性冗余度,相似性)在位图格式的图像存储方式中,像素与像素之间在在位图格式的图像存储方式中,像素与像素之间在行方向和列方向都具有很大的相关性。行方向和列方向都具
3、有很大的相关性。第4页,共33页,编辑于2022年,星期六多媒体数据压缩的必要性多媒体数据压缩的必要性多媒体数据的冗余类型多媒体数据的冗余类型多媒体数据表示中存在着大量的冗余,多媒体数据表示中存在着大量的冗余,利用多媒体数据的冗余性来减少数据量。利用多媒体数据的冗余性来减少数据量。常常见见图像、视频、音频数据中存在的冗余类型图像、视频、音频数据中存在的冗余类型如下:如下:1.空间冗余2.时间冗余3.视觉冗余6.纹理的统计冗余5.结构冗余4.知识冗余第5页,共33页,编辑于2022年,星期六1.空间冗余 一幅图像表面上各采样点的颜色之间往往存在着一幅图像表面上各采样点的颜色之间往往存在着空间连贯
4、性空间连贯性,基于离散像素采样来表示物体表面颜色的,基于离散像素采样来表示物体表面颜色的像素存储方式可利用空间连贯性,达到减少数据量的目的。像素存储方式可利用空间连贯性,达到减少数据量的目的。例如,在静态图像中有一块表面颜色均匀的区域,例如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗余。的,因此数据有很大的空间冗余。多媒体数据压缩的必要性多媒体数据压缩的必要性第6页,共33页,编辑于2022年,星期六图图BitmapBitmap颜色相同的块颜色相同的块帧内压缩帧内压缩多媒体数据压缩
5、的必要性多媒体数据压缩的必要性第7页,共33页,编辑于2022年,星期六2.时间冗余运动图像一般为位于一时间轴区间的一组连续画运动图像一般为位于一时间轴区间的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为所以称为时间冗余时间冗余。同理,语音数据中也存在着时间冗
6、余。同理,语音数据中也存在着时间冗余。多媒体数据压缩的必要性多媒体数据压缩的必要性第8页,共33页,编辑于2022年,星期六多媒体数据压缩的必要性多媒体数据压缩的必要性第9页,共33页,编辑于2022年,星期六3.视觉冗余 人类的视觉系统由于受生理特性的限制,对人类的视觉系统由于受生理特性的限制,对于图像场的注意于图像场的注意是非均匀的、非线性的是非均匀的、非线性的,通常假定通常假定视觉系统是均匀的,线性地对敏感区视觉系统是均匀的,线性地对敏感区域和非敏感区域域和非敏感区域同等对待同等对待从而产生了更多的数从而产生了更多的数据据。多媒体数据压缩的必要性多媒体数据压缩的必要性第10页,共33页,
7、编辑于2022年,星期六视觉系统对图像的亮度和色彩的敏感性相差很大。视觉系统对图像的亮度和色彩的敏感性相差很大。RGBRGB转换为转换为YuvYuv,对亮度,对亮度Y Y的敏感性高于色彩的敏感性高于色彩u u,v v的敏感性。的敏感性。随着亮度的增加,视觉系统对亮度误差的敏感度随着亮度的增加,视觉系统对亮度误差的敏感度降低,因此,在高亮度区,灰度的量化可以更加粗降低,因此,在高亮度区,灰度的量化可以更加粗糙些。糙些。多媒体数据压缩的必要性多媒体数据压缩的必要性第11页,共33页,编辑于2022年,星期六视觉系统将图像的边缘和非边缘区分对待这是视觉系统将图像的边缘和非边缘区分对待这是将图像分成边
8、缘和非边缘编码的主要依据。将图像分成边缘和非边缘编码的主要依据。人类的视觉系统总是将视网膜上的图像分解为若人类的视觉系统总是将视网膜上的图像分解为若干个频率通道后再进一步处理,在编码时将图像干个频率通道后再进一步处理,在编码时将图像分解为符合视觉内在的特性的频率通道,则可以分解为符合视觉内在的特性的频率通道,则可以获得较大的压缩比。小波编码在一定程度上利用获得较大的压缩比。小波编码在一定程度上利用了这一特点。了这一特点。多媒体数据压缩的必要性多媒体数据压缩的必要性第12页,共33页,编辑于2022年,星期六4.知识冗余 有些图像的理解和某些基础知识有相当大的相有些图像的理解和某些基础知识有相当
9、大的相关性,人脸的图像有固定结构这类规律性的结构可关性,人脸的图像有固定结构这类规律性的结构可由先验知识和背景知识得到,称此类冗余为知识由先验知识和背景知识得到,称此类冗余为知识冗冗余。对于某些图像中的物体构造其基本模型,创余。对于某些图像中的物体构造其基本模型,创建对应的各种特征的图像,这样图像的存储只存建对应的各种特征的图像,这样图像的存储只存储某些特征参数。储某些特征参数。多媒体数据压缩的必要性多媒体数据压缩的必要性第13页,共33页,编辑于2022年,星期六5.结构冗余 有些图像的纹理区域,图像的像素值存在明有些图像的纹理区域,图像的像素值存在明显的分布模式,如方格状的地板图案等,称之
10、为显的分布模式,如方格状的地板图案等,称之为结构冗余。已知结构模式,通过某一过程生成图结构冗余。已知结构模式,通过某一过程生成图像。像。6.纹理的统计冗余 有些图像的纹理尽管不服从有些图像的纹理尽管不服从明显的分布模式,明显的分布模式,但在统计意义下符合但在统计意义下符合某一分布规律,利用这种性某一分布规律,利用这种性质可以减少图像的数据量。质可以减少图像的数据量。多媒体数据压缩的必要性多媒体数据压缩的必要性第14页,共33页,编辑于2022年,星期六 多媒体数据压缩的必要性多媒体数据压缩的必要性 音视频压缩标准的发展音视频压缩标准的发展 图像图像/视频编码技术的现状及发展趋势视频编码技术的现
11、状及发展趋势第15页,共33页,编辑于2022年,星期六庞大的数字音视频产业庞大的数字音视频产业音视频产业是电子信息产业的三大组成部分之一音视频产业是电子信息产业的三大组成部分之一 (通信、计算机、音视频)(通信、计算机、音视频)音视频产业产值约占大陆信息产业总产值的三音视频产业产值约占大陆信息产业总产值的三分之一分之一 数字化是音视频产业的发展方向,也是上个世数字化是音视频产业的发展方向,也是上个世纪前十年产业增长的最重要的因素纪前十年产业增长的最重要的因素 音视频压缩标准的发展音视频压缩标准的发展第16页,共33页,编辑于2022年,星期六庞大的数字视频产业庞大的数字视频产业 自从自从19
12、481948年信息论之父年信息论之父C.E.ShannonC.E.Shannon在论文中第一在论文中第一次给出信息熵的数学表达式,数据压缩技术已经次给出信息熵的数学表达式,数据压缩技术已经发展了发展了6060年头。年头。以音视频编解码核心技术为基础的行业标准,一直以以音视频编解码核心技术为基础的行业标准,一直以来都是该领域的来都是该领域的“兵家必争之地兵家必争之地”音视频编解码技术发展的理想方向音视频编解码技术发展的理想方向-全球统一标准,全球统一标准,(使信息管理系统具有普遍的互操作性并确保未来的使信息管理系统具有普遍的互操作性并确保未来的兼容性兼容性)音视频领域存在多种标准有其历史原因,不
13、同的标音视频领域存在多种标准有其历史原因,不同的标准代表了不同的利益。准代表了不同的利益。音视频压缩标准的发展音视频压缩标准的发展第17页,共33页,编辑于2022年,星期六音视频压缩标准的发展音视频压缩标准的发展多种互不兼容标准共存的现象多种互不兼容标准共存的现象应用领域重叠,造成标准竞争激烈应用领域重叠,造成标准竞争激烈 第18页,共33页,编辑于2022年,星期六编码分类编码分类信道编码:面向传输信道编码:面向传输 卫星、有线、地面卫星、有线、地面 互联网、移动网、光盘、便携存储互联网、移动网、光盘、便携存储 信源编码:面向内容信源编码:面向内容 文字编码:文字编码:ASCIIASCII
14、,GB 18030GB 18030,所有信息系统需要,所有信息系统需要 音视频编码:所有音视频系统需要音视频编码:所有音视频系统需要 标清数字视频原始数据超过标清数字视频原始数据超过200Mbps200Mbps,高清超过,高清超过 1Gbps1Gbps 音视频压缩标准的发展音视频压缩标准的发展第19页,共33页,编辑于2022年,星期六音视频压缩标准的发展音视频压缩标准的发展 ISO/IEC ISO/IEC 推出的推出的MPEGMPEG系列压缩标准:系列压缩标准:MPEG-1,2,4 MPEG-1,2,4 ITU-T ITU-T推出的推出的H.26XH.26X系列压缩标准系列压缩标准 H.26
15、1,2,3,3+,3+,4 H.261,2,3,3+,3+,4 第20页,共33页,编辑于2022年,星期六19931993年年,MPEG-1MPEG-1由由ISO/IEC ISO/IEC 的的MPEGMPEG(活动图像编码专家组)发布,(活动图像编码专家组)发布,标准编号标准编号ISO/IEC 11172ISO/IEC 11172,视频压缩是其中的第二部分,即,视频压缩是其中的第二部分,即ISO/IEC 11172-2,ISO/IEC 11172-2,目标是在大约目标是在大约1.2Mbps(1.2Mbps(音频视频共音频视频共1.5Mbps)1.5Mbps)时提供接近家用录像机质量的视频,在
16、时提供接近家用录像机质量的视频,在VCDVCD产业获得广泛的应用。产业获得广泛的应用。MPEG-1MPEG-1达不到广播电视质量的要求。达不到广播电视质量的要求。19951995年年,MPEG-2MPEG-2发布发布,标准编号标准编号ISO/IEC 13818ISO/IEC 13818,视频压缩是其中,视频压缩是其中的第二部分,由于该标准是由的第二部分,由于该标准是由ITU-T ITU-T 的的VCEGVCEG(视频编码专家组)(视频编码专家组)和和ISO/IEC ISO/IEC 的的MPEGMPEG(活动图像编码专家组)联合组建的联合视频组(活动图像编码专家组)联合组建的联合视频组(JVTJ
17、VT:Joint Video TeamJoint Video Team)共同开发,因此有两个标准号:)共同开发,因此有两个标准号:ISO/IEC 13818-2,H.262,MPEG-2ISO/IEC 13818-2,H.262,MPEG-2的目标是在大约的目标是在大约4-8Mbps4-8Mbps时提供时提供标准清晰度电视质量的视频。在大约标准清晰度电视质量的视频。在大约10-15Mbps10-15Mbps时提供高清晰度时提供高清晰度电视质量的视频。在电视质量的视频。在DVDDVD、数字电视产业获得广泛的应用。、数字电视产业获得广泛的应用。音视频压缩标准的发展音视频压缩标准的发展第21页,共3
18、3页,编辑于2022年,星期六20002000年年,在支持单向播放的同时,为了满足交互应用,在支持单向播放的同时,为了满足交互应用,MPEG-4 V1MPEG-4 V1版版本发布,标准编号本发布,标准编号ISO/IEC 14496ISO/IEC 14496,视频压缩是其中的第二部分,视频压缩是其中的第二部分,即即ISO/IEC 14496-2,ISO/IEC 14496-2,其目标是在大约其目标是在大约1.5-8Mbps1.5-8Mbps时提供可交互的家时提供可交互的家用录像机质量的和标准清晰度电视质量的视频,在流媒体播用录像机质量的和标准清晰度电视质量的视频,在流媒体播放领域广泛应用。放领域
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 综述 PPT 讲稿
限制150内