数据结构课程设计(哈夫曼编码)要点(共24页).doc
《数据结构课程设计(哈夫曼编码)要点(共24页).doc》由会员分享,可在线阅读,更多相关《数据结构课程设计(哈夫曼编码)要点(共24页).doc(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上目 录1 课程设计的目的和意义在当今信息爆炸时代,如何采用有效的数据压缩技术来节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视。哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个对应的字符的编码,这就是哈夫曼编码。通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式的字符串。但在信
2、息传递时,总希望总长度尽可能最短,即采用最短码。作为软件工程专业的学生,我们应该很好的掌握这门技术。在课堂上,我们能过学到许多的理论知识,但我们很少有过自己动手实践的机会!课程设计就是为解决这个问题提供了一个平台。在课程设计过程中,我们每个人选择一个课题,认真研究,根据课堂讲授内容,借助书本,自己动手实践。这样不但有助于我们消化课堂所讲解的内容,还可以增强我们的独立思考能力和动手能力;通过编写实验代码和调试运行,我们可以逐步积累调试C程序的经验并逐渐培养我们的编程能力、用计算机解决实际问题的能力。在课程设计过程中,我们不但有自己的独立思考,还借助各种参考文献来帮助我们完成系统。更为重要的是,我
3、们同学之间加强了交流,在对问题的认识方面可以交换不同的意见。同时,师生之间的互动也随之改善,我们可以通过具体的实例来从老师那学到更多的实用的知识。数据结构课程具有比较强的理论性,同时也具有较强的可应用性和实践性。课程设计是一个重要的教学环节。我们在一般情况下都能够重视实验环节,但是容易忽略实验的总结,忽略实验报告的撰写。通过这次实验让我们明白:作为一名大学生必须严格训练分析总结能力、书面表达能力。需要逐步培养书写科学实验报告以及科技论文的能力。只有这样,我们的综合素质才会有好的提高。2 需求分析题 目:哈夫曼编码/译码器问题描述:利用哈夫曼编码进行信息通信可以大大提高信道利用率,缩短信息传输时
4、间,降低传输成本。但是这要求在发送端通过一个编码系统对待传数据预先编码;在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼码的编译码系统。具体要求:1) 初始化:键盘输入字符集大小n及n个字符和m个权值,建立哈夫曼树,并将它存于文件hfmtree中。 2) 编码:利用建好的哈夫曼树,对文件tobetrans中的正文进行编码,然后将结果存入文件codefile中。3) 解码:利用建好的哈夫曼树将文件codefile中的代码进行译码,结果存入文件textfile中。4) 打印代码文件:将文件codefi
5、le以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件codeprint中。5) 打印哈夫曼树:将已在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件treeprint中。6) 设字符集及频度如下表:字符空格ABCDEFGHIJKLM频度1866423223210321154757153220字符NOPQRSTUVWXYZ频度205619250515530101122123 系统设计(1)设计思路及方案本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n
6、种字符,则电文编码总长度为(W1*L1)+(W2*L2)+(Wi*Li)。若将此对应到二叉树上,Wi为叶结点,Li为根结点到叶结点的路径长度。那么,(W1*L1)+(W2*L2)+(Wi*Li)恰好为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。该系统将实现以下几大功能:从硬盘读取字符串,建立哈夫曼树,输出哈夫曼树的存储结构的初态和终态,输出各种字符出现的次数以及哈夫曼编码的译码等。 (2)模块的设计及介绍从硬盘读取字符串fileopen(参数) 实现命令; 打印输出;建立HuffmanTree通过三个函
7、数来实现:void select(参数) 初始化; for 接受命令; 处理命令;说明:在ht1.k中选择parent为0且权值最小的两个根结点的算法int jsq(参数) 初始化; for 接受命令; 处理命令; 说明:统计字符串中各种字母的个数以及字符的种类void ChuffmanTree() 初始化; for 接受命令; 处理命令; 输出字符统计情况;说明:构造哈夫曼树输出哈夫曼树的存储结构的初态和终态分别调用print1()和print2()来实现void print1(参数) 初始化; 输出初态;说明:输出哈夫曼树的初态void print2(参数) for 输出终态;说明:输出哈
8、夫曼树的终态哈夫曼编码和译码void HuffmanEncoding(参数) 定义变量; 处理命令;说明:哈夫曼编码char*decode(参数) 定义变量;while接受命令;处理命令;说明:哈夫曼译码(3)主要模块程序流程图下面介绍三个主要的程序模块流程图: 主函数流程图:结束统计字符种类及频率字符总数num建立哈夫曼树哈夫曼编码哈夫曼译码打开文件?开始否是 图3.1流程图注释:该图比较简单,主要是调用各个函数模块,首先代开已经存在的文件,然后统计总的字符数以及出现的各个字符和频率。然后才开始建立哈夫曼树,接着在哈夫曼树的基础上对其进行编码,编码之后才是译码。最后输出结束。构造哈夫曼树:开
9、始结束第i个结点权值i=num?创建哈夫曼树输出字符统计情况第i个根结点i=2*num-1?i=num?否是否是否是 图3.2流程图注释:该图是表示构造哈夫曼树的过程。首先输入num个叶结点的权值,当i=num是循环结束。然后进行哈夫曼树的构建,当i=2*num-1是循环结束。最后输出所得到的字符统计情况。哈夫曼编码:结束开始Tp.lchlid=c?i=num?Cd-start=0,start=numCd-start=0Cd-start=1否否是是 图3.3流程图解释:该流程图表四哈夫曼编码情况。首先初始化,Cd-start=0,start=num。然后进行编码,使用了一个三目运算符。cd-s
10、tart=(Tp.lchild=c) ? 0 : 1,即当cd-start=Tp.lchild= =c时,cd-start=0;当cd-start=Tp.lchild!= =c时,cd-start=1。这个编码循环一直到i=num时结束。4 系统实现各模块关键代码及算法的解释:(1)主调函数 代码解释:这是main函数里的各个函数调用情况。fileopen(string); /从硬盘中读取文件num=jsq(string,cnt,str); /统计字符种类及各类字符出现的频率DhuffmanTree(HT,cnt,str); printf(HuffmanTree的初态:n);print1(HT
11、); /输出哈夫曼树的初态ChuffmanTree(HT,HC,cnt,str);/建立哈夫曼树 HuffmanEncoding(HT,HC); /生成哈夫曼编码printf(HuffmanTree的终态:n);print2(HT); /输出哈夫曼树的终态s=decode(HC); /读编码文件译码printf(译码后的字符串:n);printf(%sn,s); /输出译码后的字符串(2)建立HuffmanTree 代码解释:该函数为在ht1.k中选择parent为0且权值最小的两个根结点的算法,其序号为s1和s2。void select(HuffmanTree T,int k,int &s1
12、,int &s2) int i,j;int min1=101; for(i=1;i=k;i+)if(Ti.weightmin1 &Ti.parent=0) j=i;min1=Ti.weight;s1=j;min1=32767;for (i=1;i=k;i+)if(Ti.weightmin1 & Ti.parent=0 & i!=s1)j=i;min1=Ti.weight;s2=j;代码解释:下面函数用来统计字符串中各种字母的个数以及字符的种类。当字符在A和Z之间时即被计数,并用strj保存字母到数组中,用cntj统计每种字符个数。j返回总共读取的字符数目。int jsq(char *s,int
13、 cnt,char str) int i,j,k; char *p;int temp27; for(i=1;i=A&*p=Z)k=*p-64;tempk+; /统计各种字符的个数for(i=1,j=0;i=26;+i)if(tempi!=0 ) j+;strj=i+64; /送对应的字母到数组中cntj=tempi; /存入对应字母的权值 return j; /j是输入字母总数代码解释:下面函数用来构造哈夫曼树HT。首先初始化哈夫曼树,然后输入前面统计的各结点的权值,用for循环来构造哈夫曼树。void ChuffmanTree(HuffmanTree HT,HuffmanCode HC,in
14、t cnt,char str)int i,s1,s2;for(i=1;i=2*num-1;i+)/初始化HT,2*num-1是指哈夫曼/所有的结点数目HTi.lchild=0;HTi.rchild=0;HTi.parent=0;HTi.weight=0;for(i=1;i=num;i+) /输入num个叶结点的权值HTi.weight=cnti;for(i=num+1;i=2*num-1;i+)select(HT,i-1,s1,s2);HTs1.parent=i;HTs2.parent=i;HTi.lchild=s1; HTi.rchild=s2;HTi.weight=HTs1.weight+
15、HTs2.weight;/在ht1.k中选择parent为0且权值最小/的两个根结点,其序号为s1和s2,i为双亲for(i=0;i=num;i+) /输入字符集的中字符HCi.ch=stri; /字符的种类i=1;while(i=num)printf(字符%c次数:%dn,HCi.ch,cnti+); /输出统计的情况(3)生成Huffman编码并写入文件 代码解释:根据哈夫曼树T求哈夫曼编码H。 void HuffmanEncoding(HuffmanTree T,HuffmanCode H)int c,p,i; /c和p分别指示t中孩子和双亲char cdn; /临时存放编码串int s
16、tart; /指示码在cd中的起始位置cdnum=0; /最后一位(第num个)放上串结束符for(i=1;i0) /直至上溯到tc是树根为止cd-start=(Tp.lchild=c) ? 0 : 1;c=p; /若tc是tp的左孩子/则生成0;否则生成底码strcpy(Hi.bits,&cdstart);Hi.len=num-start;代码解释:对str所代表的字符串进行编码并写入文件。将翻译的二进制码写入文本文件。void coding(HuffmanCode HC ,char *str) int i,j;FILE *fp;fp=fopen(codefile.txt,w);while(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 课程设计 哈夫曼 编码 要点 24
限制150内