数据压缩,算法的综述.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数据压缩,算法的综述.docx》由会员分享,可在线阅读,更多相关《数据压缩,算法的综述.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据压缩算法的综述S14050428 许申益摘要:数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。随着数 据传输技术和计算机网络通讯技术的普及应用,以及在计算机应用中,应用软件 的规模和处理的数据量的急剧增加,特别是多媒体技术在计算机通讯领域中的出 现,使数据压缩技术的研究越来越引起人们的注意。本文综述了在数据压缩算法 上一些已经取得的成果,其中包括算术编码、字典式压缩方法以及Huffman码及 其改进。关键字:数据压缩;数据存储;计算机通讯;多媒体技术L引言数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。在数据的 存储和表示中往往存在一定的冗余度,一些研究者提出了不同的理
2、论模型和编码 技术降低了数据的冗余度。提出了一种基于统计模型的压缩方法,提出了一种基于字典模型的压缩方法。随着数据传输技术和计算机网络通 讯技术的普及应用,以及在计算机应用中,应用软件的规模和处理的数据量的急 剧增加,特别是多媒体技术在计算机和通讯两个领域中的浮现,使数据压缩技术 的研究越来越引起人们的注意。本文综述了在数据压缩算法上的一些已经取得的 成果。本文主要介绍了香农范诺编码以及哈弗曼算法的基本思想,运用其算法的基 本思想设计了一个文件压缩器,用 语言内置的优先队列、对象序列化等功 能实现了文件压缩器的压缩和解压功能。2数据压缩算法的分类普通可以将数据压缩算法划分为静态的和动态的两类。
3、动态方法又是又叫做 适应性(adaptive)方法,相应的,静态方法又叫做非适应性方法(non-adaptive) o静态方法是压缩数据之前,对要压缩的数据经过预扫描,确定出信源数据的都为叶结点都为非叶结点一个叶结点和一个非叶结点对第一种情况 分配两个类型结点存放其权值而作为哈弗曼树的叶结点再分配一个类型结点存放其合并后的权值作为两个类型结点的父亲而成为哈弗曼树的非叶结点然后把该非叶结点进入队列保存同时插入单链表中相应位置 对第二种情况 分配一个 类型结点从队列中取出队首的两个元素分别作该类型结点的左孩子和右孩子然后合并所得新权值进入单链表和对应结点进入队列保存对第三种情况叶结点按第一种情况来
4、操作非叶结点按第二种情况来操作即可图 就是用该算法思想于上例来构树的整个过程。8 .综述数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。在数据的 存储和表示中往往存在一定的冗余度,一些研究者提出了不同的理论模型和编码 技术降低了数据的冗余度。随着数据传输技术和计算机网络通讯技术的普及应 用,以及在计算机应用中,应用软件的规模和处理的数据量的急剧增加,特别是 多媒体技术在计算机和通讯两个领域中的浮现,使数据压缩技术的研究越来越引 起人们的注意。本文用 语言实现了该文件压缩器。在实现过程中用优先队 列构建哈弗曼树,用对象序列化保存和加载压缩数据的方法简单易用,有一定的 通用性。本文用例举
5、的算法实现的压缩器解压过程比压缩过程慢,但该算法使用 的压缩方法属于无损压缩。9 .参考文献严蔚敏,吴伟民数据结构北京:清华大学出版社,杨学良张占军分布式多媒体计算机系统教程北京电子工业出版孙家骄 欧阳民陈文科 语言程序设计北京 北京大学出版社计算机算法 设计与分析导论影印版 北京高等教育出版社傅祖芸信息论基础理论与应用北京电子工业出版社刘 峰 袁春风 基于的数学表达式等价性的研究计算机应用研每一个符号在编码后对应的码字(codeword)。这样,信息集对码字集的映像在 数据开始之前就已经固定下来了。面动态方法则是在编码过程中,随着信源信 息的输入,根据输入流的变化,不断动态地修改编码压缩。这
6、样就省去了为统 计信源中的符号概率需要做的第一遍预扫描。也不必向编码端传送编码所用 的数据模式。于是动态的数据压缩方法比静态的方法要优越得多。3 .数据压缩技术的理论基础文件压缩的基本思想是对字符设计长度不等的编码方案,对浮现次数多的字符 用尽可能短的编码表示,这样文件的总长度就会降低,实现文件压缩。比如有字 符串“ ”,个字符需要两个比特编码,假设、的编码分别是、 和,则整个字符串可表示成 ,总长度 个比特。如果、 的编码分别是、 和,则字符串总长度为比特。设计长短 不等的编码方案时,必须满足一个字符的编码不能是另一个字符编码的前缀,以 保证解码成字符的转换过程中不发生歧义,这种编码称为前缀
7、编码。4 .数据压缩算法4.1 Huffman编码及其演变哈弗曼算法提出了一种编码方法,使得文本总长度最短。其基本思想是利用 字符的频率作为权重,以字符作为叶结点构造一颗最优二叉树也称为哈弗曼 树,使得带权路径长度 最小,其中 表示第 个字符结点的权重,表示第 个字符结点的路径长度。哈弗曼算法流程如下:()每一个字符创建一棵二叉树构成一个树集合,其中二叉树的根结点为权重,摆布子树为空。()在树集中选取两颗根结点权值最小的树作为摆布子树构成一颗新的二 叉树,根结点为摆布子树根结点的权重之和。()在树集中删除这两颗树,把新得到的二叉树加入到 中。()重复步骤和,直到 中惟独一棵树为止。例如字符串“
8、个字符、的频率分别为、。以字符频率为权重构造最优树。利用最优二叉树,、 的编码分别是、 和 。这种以字符频率为权重,构造一颗最优二叉树,使得带权路径长度最小 的前缀编码方案称为哈弗曼编码。哈弗曼算法保证了高频字符用短编码,低频字 符用长编码,到达整体编码长度最短,从而实现文件压缩的目的。哈弗曼编码方法:先按浮现的概率大小排队,把两个最小的概率相加,作为 新的概率和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到 最后变成。每次相加时都将“ ”和“ ”赋予相加的两个概率,读出时由该符 号开始向来走到最后的” ”或者“ ”,将路线上所遇到的“ ”和“ ”按最低 位到最高位的顺序排好,就
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据压缩 算法 综述
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内