多媒体技术综述精.ppt
《多媒体技术综述精.ppt》由会员分享,可在线阅读,更多相关《多媒体技术综述精.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体技术综述多媒体技术综述北京市多媒体与智能软件技术重点实验室 第1页,本讲稿共33页 多媒体数据压缩的必要性多媒体数据压缩的必要性 音视频压缩标准的发展音视频压缩标准的发展 图像图像/视频编码技术的现状及发展趋势视频编码技术的现状及发展趋势第2页,本讲稿共33页多媒体数据压缩的必要性多媒体数据压缩的必要性多媒体数据的显著特点:多媒体数据的显著特点:数据量非常大数据量非常大一张彩色相片的数据量可达一张彩色相片的数据量可达1010MBMB;一路高清晰度电视信号(一路高清晰度电视信号(HDTVHDTV),不压缩需),不压缩需 1Gbps 1Gbps,利用,利用MPEG-2MPEG-2压缩后,尚需
2、压缩后,尚需20Mbps20Mbps解决办法:解决办法:数据压缩数据压缩压缩后再进行存储和传输,到需要时再解压、还原。压缩后再进行存储和传输,到需要时再解压、还原。第3页,本讲稿共33页多媒体数据压缩的必要性多媒体数据压缩的必要性多媒体数据压缩的可能性:多媒体数据压缩的可能性:多媒体数据存在高度的相关性多媒体数据存在高度的相关性 (冗余度,相似性冗余度,相似性)在位图格式的图像存储方式中,像素与像素之在位图格式的图像存储方式中,像素与像素之间在行方向和列方向都具有很大的相关性。间在行方向和列方向都具有很大的相关性。第4页,本讲稿共33页多媒体数据压缩的必要性多媒体数据压缩的必要性多媒体数据的冗
3、余类型多媒体数据表示中存在着大量的冗余,利用多媒体数据的冗余性来减少数据量。常见图像、视频、音频数据中存在的冗余类型如下:1.空间冗余2.时间冗余3.视觉冗余6.纹理的统计冗余5.结构冗余4.知识冗余第5页,本讲稿共33页1.空间冗余 一幅图像表面上各采样点的颜色之间往往存在着空间连贯性,基于离散像素采样来表示物体表面颜色的像素存储方式可利用空间连贯性,达到减少数据量的目的。例如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗余。多媒体数据压缩的必要性多媒体数据压缩的必要性第6页,本讲稿共33页图图BitmapBitmap颜色相同
4、的块颜色相同的块帧内压缩帧内压缩多媒体数据压缩的必要性多媒体数据压缩的必要性第7页,本讲稿共33页2.时间冗余运动图像一般为位于一时间轴区间的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为时间冗余。同理,语音数据中也存在着时间冗余。多媒体数据压缩的必要性多媒体数据压缩的必要性第8页,本讲稿共33页多媒体数据压缩的必要性第9页,本讲稿共33页3.视觉冗余 人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的、非线性的,通常假定视觉系
5、统是均匀的,线性地对敏感区域和非敏感区域同等对待从而产生了更多的数据。多媒体数据压缩的必要性第10页,本讲稿共33页视觉系统对图像的亮度和色彩的敏感性相差很大。RGB转换为Yuv,对亮度Y的敏感性高于色彩u,v的敏感性。随着亮度的增加,视觉系统对亮度误差的敏感度降低,因此,在高亮度区,灰度的量化可以更加粗糙些。多媒体数据压缩的必要性第11页,本讲稿共33页视觉系统将图像的边缘和非边缘区分对待这是将图像分成边缘和非边缘编码的主要依据。人类的视觉系统总是将视网膜上的图像分解为若干个频率通道后再进一步处理,在编码时将图像分解为符合视觉内在的特性的频率通道,则可以获得较大的压缩比。小波编码在一定程度上
6、利用了这一特点。多媒体数据压缩的必要性第12页,本讲稿共33页4.知识冗余 有些图像的理解和某些基础知识有相当大的相关性,人脸的图像有固定结构这类规律性的结构可由先验知识和背景知识得到,称此类冗余为知识冗余。对于某些图像中的物体构造其基本模型,创建对应的各种特征的图像,这样图像的存储只存储某些特征参数。多媒体数据压缩的必要性第13页,本讲稿共33页5.结构冗余 有些图像的纹理区域,图像的像素值存在明显的分布模式,如方格状的地板图案等,称之为结构冗余。已知结构模式,通过某一过程生成图像。6.纹理的统计冗余 有些图像的纹理尽管不服从明显的分布模式,但在统计意义下符合某一分布规律,利用这种性质可以减
7、少图像的数据量。多媒体数据压缩的必要性第14页,本讲稿共33页 多媒体数据压缩的必要性多媒体数据压缩的必要性 音视频压缩标准的发展音视频压缩标准的发展 图像图像/视频编码技术的现状及发展趋势视频编码技术的现状及发展趋势第15页,本讲稿共33页庞大的数字音视频产业庞大的数字音视频产业音视频产业是电子信息产业的三大组成部分之一音视频产业是电子信息产业的三大组成部分之一 (通信、计算机、音视频)(通信、计算机、音视频)音视频产业产值约占大陆信息产业总产值的三分之一音视频产业产值约占大陆信息产业总产值的三分之一 数字化是音视频产业的发展方向,也是上个世数字化是音视频产业的发展方向,也是上个世纪前十年产
8、业增长的最重要的因素纪前十年产业增长的最重要的因素 音视频压缩标准的发展第16页,本讲稿共33页庞大的数字视频产业庞大的数字视频产业 自从自从19481948年信息论之父年信息论之父C.E.ShannonC.E.Shannon在论文中第一次在论文中第一次给出信息熵的数学表达式,数据压缩技术已经发给出信息熵的数学表达式,数据压缩技术已经发展了展了6060年头。年头。以音视频编解码核心技术为基础的行业标准,一直以来以音视频编解码核心技术为基础的行业标准,一直以来都是该领域的都是该领域的“兵家必争之地兵家必争之地”音视频编解码技术发展的理想方向音视频编解码技术发展的理想方向-全球统一标准,全球统一标
9、准,(使信息管理系统具有普遍的互操作性并确保未使信息管理系统具有普遍的互操作性并确保未来的兼容性来的兼容性)音视频领域存在多种标准有其历史原因,不同的标准音视频领域存在多种标准有其历史原因,不同的标准代表了不同的利益。代表了不同的利益。音视频压缩标准的发展第17页,本讲稿共33页音视频压缩标准的发展音视频压缩标准的发展多种互不兼容标准共存的现象应用领域重叠,造成标准竞争激烈 第18页,本讲稿共33页编码分类编码分类信道编码:面向传输信道编码:面向传输 卫星、有线、地面卫星、有线、地面 互联网、移动网、光盘、便携存储互联网、移动网、光盘、便携存储 信源编码:面向内容信源编码:面向内容 文字编码:
10、文字编码:ASCIIASCII,GB 18030GB 18030,所有信息系统需要,所有信息系统需要 音视频编码:所有音视频系统需要音视频编码:所有音视频系统需要 标清数字视频原始数据超过标清数字视频原始数据超过200Mbps200Mbps,高清超过,高清超过 1Gbps1Gbps 音视频压缩标准的发展音视频压缩标准的发展第19页,本讲稿共33页音视频压缩标准的发展音视频压缩标准的发展 ISO/IEC ISO/IEC 推出的推出的MPEGMPEG系列压缩标准:系列压缩标准:MPEG-1,2,4 MPEG-1,2,4 ITU-T ITU-T推出的推出的H.26XH.26X系列压缩标准系列压缩标准
11、 H.261,2,3,3+,3+,4 H.261,2,3,3+,3+,4 第20页,本讲稿共33页19931993年年,MPEG-1MPEG-1由由ISO/IEC ISO/IEC 的的MPEGMPEG(活动图像编码专家组)发布,(活动图像编码专家组)发布,标准编号标准编号ISO/IEC 11172ISO/IEC 11172,视频压缩是其中的第二部分,即,视频压缩是其中的第二部分,即ISO/IEC ISO/IEC 11172-2,11172-2,目标是在大约目标是在大约1.2Mbps(1.2Mbps(音频视频共音频视频共1.5Mbps)1.5Mbps)时提供接时提供接近家用录像机质量的视频,在近
12、家用录像机质量的视频,在VCDVCD产业获得广泛的应用。产业获得广泛的应用。MPEG-1MPEG-1达不达不到广播电视质量的要求。到广播电视质量的要求。19951995年年,MPEG-2MPEG-2发布发布,标准编号标准编号ISO/IEC 13818ISO/IEC 13818,视频压缩是其中,视频压缩是其中的第二部分,由于该标准是由的第二部分,由于该标准是由ITU-T ITU-T 的的VCEGVCEG(视频编码专家组)和(视频编码专家组)和ISO/IEC ISO/IEC 的的MPEGMPEG(活动图像编码专家组)联合组建的联合视频组(活动图像编码专家组)联合组建的联合视频组(JVTJVT:Jo
13、int Video TeamJoint Video Team)共同开发,因此有两个标准号:)共同开发,因此有两个标准号:ISO/IEC ISO/IEC 13818-2,H.262,MPEG-213818-2,H.262,MPEG-2的目标是在大约的目标是在大约4-8Mbps4-8Mbps时提供标准清晰度电时提供标准清晰度电视质量的视频。在大约视质量的视频。在大约10-15Mbps10-15Mbps时提供高清晰度电视质量的视时提供高清晰度电视质量的视频。在频。在DVDDVD、数字电视产业获得广泛的应用。、数字电视产业获得广泛的应用。音视频压缩标准的发展第21页,本讲稿共33页20002000年年
14、,在支持单向播放的同时,为了满足交互应用,在支持单向播放的同时,为了满足交互应用,MPEG-4 V1MPEG-4 V1版版本发布,标准编号本发布,标准编号ISO/IEC 14496ISO/IEC 14496,视频压缩是其中的第二部分,即,视频压缩是其中的第二部分,即ISO/IEC 14496-2,ISO/IEC 14496-2,其目标是在大约其目标是在大约1.5-8Mbps1.5-8Mbps时提供可交互的家用时提供可交互的家用录像机质量的和标准清晰度电视质量的视频,在流媒体播放领域录像机质量的和标准清晰度电视质量的视频,在流媒体播放领域广泛应用。广泛应用。20012001年年,MPEG-4 V
15、2MPEG-4 V2版本发布,它在版本发布,它在MPEG-4 V1MPEG-4 V1的基础上增加了部的基础上增加了部分压缩工具。分压缩工具。20032003年年,为了进一步提高压缩效率,为了进一步提高压缩效率ISO/IECISO/IEC和和ITUITU两个标准组织两个标准组织联合发布了新的标准,在两个标准化组织的标准号分别为联合发布了新的标准,在两个标准化组织的标准号分别为14496-10(MPEG-4,Part 10,14496-10(MPEG-4,Part 10,也称也称MPEG AVC)MPEG AVC)和和H.264H.264。其目标是在其目标是在768Kbps768Kbps、2-4M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 综述
限制150内