计算机专转本辅导第5章数字媒体应用.ppt
《计算机专转本辅导第5章数字媒体应用.ppt》由会员分享,可在线阅读,更多相关《计算机专转本辅导第5章数字媒体应用.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第5章章 数字媒体及应用数字媒体及应用5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用5.4 数字视频及应用5.1 文本与文本处理文本与文本处理 5.1.1 字符的编码5.1.2 文本准备5.1.3 文本的分类5.1.4 文本编辑、排版与处理5.1.5 文本的展现 文字处理是计算机应用的基础文字处理是计算机应用的基础l计算机应用使用计算机进行信息处理l其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。文字文字数值数值语言语言音乐音乐图像图像信息的形态有多种信息的形态有多种写作写作编辑编辑排版排版印刷印刷发行发行写作写作 传统的文字处理过程传统的文字
2、处理过程计算机文字处理过程计算机文字处理过程l文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体l文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示l文本在计算机中的处理过程是:(文本编辑器文本编辑器)文本编辑文本编辑与排版与排版格式化的格式化的电子文本电子文本(2)文本文本展现展现(文本阅读器文本阅读器)(5)文本处理文本处理(文本处理软件文本处理软件)(3)文本准备文本准备电子文电子文本本(1)(文字与图表文字与图表 的输入的输入)文本存储文本存储与传输与传输(4)(存档存档/通信软件通信软件)5.1.1.字符在计算机中的表示字符在计算
3、机中的表示 一、西文字符的编码一、西文字符的编码ASCII码码l西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成l美国标准信息交换码(ASCII码):lASCII字符集包含96个可打印字符和32个控制字符l采用7个二进位进行编码l计算机中使用1个字节存储1个ASCII 字符l存在问题:l字符集太小(只有128个字符)l不同国家和地区使用不同的字符集及其编码,互不兼容l东亚地区使用的大字符集无法编码0X X X X X X X一级汉字一级汉字(3755个)个)二级汉字二级汉字(3008个)个)(扩充使用)(扩充使用)字母、数字和各种符号字母、数字和各种符号19423
4、位号位号191655568794区区 号号(按汉语拼音排列按汉语拼音排列)(按偏旁部首排列按偏旁部首排列)GB2312汉字编码字符集汉字编码字符集l1980年颁布信息交换用汉字编码字符集基本集(我国第一个国家标准)GB2312-1980lGB2312字符集由三个部分构成:拉丁字母、俄文、拉丁字母、俄文、日文平假名与片日文平假名与片假名、希腊字母、假名、希腊字母、汉语拼音等共汉语拼音等共682个个共共6763个汉字和个汉字和682个符号,个符号,每个每个汉字和符号都有一汉字和符号都有一个确定位置个确定位置区位码:区位码:GB2312国标字符集构成一个二维平面,它国标字符集构成一个二维平面,它分成
5、分成94行、行、94列列,行号称为,行号称为区号区号,列号称为,列号称为位号位号。问题:问题:文本中的汉字与西文字符易与单字节的标准文本中的汉字与西文字符易与单字节的标准ASCII码混淆不清。码混淆不清。例如:例如:“大大”字的字的区号区号20,位号位号83,区位码是,区位码是2083,用,用2个字节表示为:个字节表示为:0001010001010011(1453H)。)。这种高位为这种高位为l的双字节(的双字节(16位)汉字编码就称为位)汉字编码就称为GB2312汉字的汉字的“机内码机内码”,又称,又称内码内码。例如:例如:“大大”字字的内码是:的内码是:1011010011110011(B
6、4F3)。)。汉字的区位码、国标码、机内码的关系:汉字的区位码、国标码、机内码的关系:国标码国标码=区位码区位码+2020H 机内码机内码=国标码国标码+8080H 机内码机内码=区位码区位码+A0A0H汉字机内码双字节,最高位是汉字机内码双字节,最高位是1;西文字符机内码单字节,最高位是西文字符机内码单字节,最高位是0。GBK汉字内码扩充规范汉字内码扩充规范 lGB2312的不足:l汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容lGBK汉字内码扩充规范(1995):l在GB2312基础上,增加了1万多汉字(包括繁体字)和符号l共有210
7、03个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 l与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”:1 X第第1字节字节第第2字节字节X X X X X X XX X X X X X XUCS/Unicode多文种大字符集多文种大字符集l背景:为了实现全球数以千计的不同语言文字的统一编码l方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x2161,114,112 个),称为UCS/UnicodelUCS/Unicode的编码方案:l先实现部分字符的编码(共107,361个字符)l尽量与已有编码标准兼容l其中
8、包含有中、日、韩统一整理出来的近3万汉字(CJK汉字)l允许有若干不同的编码方案,例如:GB18030汉字编码标准汉字编码标准l背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同l为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。lGB18030实质上是UCS/Unicode字符集的另一种编码方案:l单字节编码(128个)表示ASCII字符l双字节编码(23940个)表示汉字,与GBK(以及G
9、B2312)保持向下兼容,GBK不再使用l四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符lGB18030目前已在我国信息处理产品中强制贯彻执行。标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)近3万汉字(包括GBK汉字和CJK及其扩充中的汉字)包含10万多字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1”双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示,双字节表示方案与GBK相同(1)UTF-8采用单字节可变长编码(
10、2)UTF-16采用双字节可变长编码兼容性编码不兼容!小结:几种汉字编码的对比小结:几种汉字编码的对比编码保持向下兼容编码保持向下兼容5.1.3 文本的分类文本的分类简单文本简单文本(纯文本纯文本)没有字体、字号的变化,不能插入图片、表格,也不能建立超没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是链接,其文件后缀名是.txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息其他的格式信息和结构信息丰富格式文本丰富格式文本本书由南京大学出版社(Publishing House of N
11、anjing University)出版 有字体字号等属性变化、设置了段落和页面排版格式的文本称为有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格丰富格式文本式文本”丰富格式文本中,除了正文内容之外,还使用了许多丰富格式文本中,除了正文内容之外,还使用了许多“标记标记”来描述字符来描述字符的属性和格式的设置。的属性和格式的设置。举例:下面标题的格式为:中文用黑体,西文用举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中体,居中 使用使用HTML语言描述为:语言描述为:本书由南京大学出版社本书由南京大学出版社(PublishingHouseofNanjing
12、University)出版出版用一对用一对指出的是标记,如指出的是标记,如 和和 等,用于说明排版的格式和文字属等,用于说明排版的格式和文字属性,它们不属于正文内容性,它们不属于正文内容正文内容正文内容超文本超文本l若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成“超文本”ABCDEFGHa1a2b2c2f1d1c1b1e1g1h1a3“超链超链”实际上就是实际上就是一个指针,用于指向一个指针,用于指向其他文本块,也可以其他文本块,也可以指向同一文本块中的指向同一文本块中的其他部分其他部分 超链是有向的,起点位置超链是有向的,起点位置称为链源,它可以是文本称为链源,它可以是文
13、本块中的一个标题、一句句块中的一个标题、一句句子、一个关键词、一幅画、子、一个关键词、一幅画、一个图标等一个图标等文本块可以是一个文本块可以是一个网页,一个文档,网页,一个文档,一段文字,也可以一段文字,也可以是一张图片,甚至是一张图片,甚至一段声音或视频一段声音或视频 小结:文本的分类小结:文本的分类文本类型 特点 在计算机内的表示 文件扩展名 用途简单文本没有字体、字号和版面格式的变化,文本在页面上逐行排列,也不含图片和表格由一连串与正文内容对应的字符的编码所组成,几乎不包含任何其他的格式信息和结构信息.txt网上聊天短信文字录入OCR输入丰富格式文本(线性文本)有字体、字号、颜色等变化,
14、文本在页面上可以自由定位和布局,还可插入图片和表格除了与正文对应的字符编码之外,还使用某种“标记语言”所规定的一些标记来说明该文本的文字属性和排版格式等.doc.rtf.htm.html.pdf公文论文书稿网页丰富格式文本(超文本)除上述特征外,文本中还含有超链,使文本呈现为一种网状结构同上,但还应包含用于指出“链源”和“链宿”的标记.doc.rtf.htm.html.pdf.hlp同上,以及软件的联机文档(帮助文件)真题讲解真题讲解一、选择题一、选择题1、在下列字符中,其在下列字符中,其ASCII码值最大码值最大的一个是的一个是。(2005年)年)A、XB、6C、5 D、Y答案:答案:D2、
15、下列汉字编码标准中,不支持繁体汉下列汉字编码标准中,不支持繁体汉字的是字的是。(2007年)年)A.GB2312-80B.GBKC.BIG5D.GB18030答案:答案:A3、在在ASCII编码中,字母编码中,字母A的的ASCII编码编码为为41H,那么字母,那么字母f的的ASCII编码为编码为_。(2008年)年)A46HB66HC67HD78H答案:答案:B4、不同的文本处理软件使用的格式控制不同的文本处理软件使用的格式控制和结构说明信息并不统一,不同的丰富格式和结构说明信息并不统一,不同的丰富格式文本互不兼容,因此一些公司联合提出了一文本互不兼容,因此一些公司联合提出了一种中间格式,称为
16、种中间格式,称为_格式。格式。、(2008年)年)ADOCBPDFCHTMLDRTF答案:答案:D5、根据根据ASCII码值的大小,下列表达式码值的大小,下列表达式中,正确的是中,正确的是。(2009年)年)A.“a”“A”“9”B.“A”“a”“9”C.“9”“a”“A”D.“9”“A”“a”答案:答案:D6、已知已知“江苏江苏”两字的区位码是两字的区位码是“2913”和和“4353”,则其机内码是,则其机内码是。(2009年)年)A.3D2D和和4B55B.4535和和535DC.6145和和7585D.BDAD和和CBD5答案:答案:D7、若内存中相邻若内存中相邻2个字节的内容为十六个字
17、节的内容为十六进制进制7451,则它们不可能是,则它们不可能是_。(2010年)年)A1条指令的组成部分条指令的组成部分B1个汉字的机内码个汉字的机内码C1个个16位整数位整数D2个英文字母的个英文字母的ASCII码码答案:答案:B三、填空题三、填空题1、1KB的内存空间能存储的内存空间能存储512个汉字内码,约存个汉字内码,约存个个2424点阵汉字的字形码。点阵汉字的字形码。(2005年)年)2、在中文在中文Windows环境下环境下,西文使用标准西文使用标准ASCII码码,汉字采用汉字采用GB2312编码编码,现有一段文本的内码为现有一段文本的内码为:ABF4D1E378C2B755,则在
18、这段文本中则在这段文本中,含有的含有的汉字和西文字符的个数分别是汉字和西文字符的个数分别是_。(2006年)年)答案:答案:14答案:答案:3、2四、判断题四、判断题1、每个汉字的机内码都用两个字节存储。每个汉字的机内码都用两个字节存储。(2005年)年)2、只要是在同一个字符集下,文本的输、只要是在同一个字符集下,文本的输出所使用的字库都是相同的。出所使用的字库都是相同的。(2009年)年)答案:答案:T答案:答案:F4、在、在ASCII码表中,数字和英文字母按码表中,数字和英文字母按照照ASCII码值从小到大排列的顺序为:数字、码值从小到大排列的顺序为:数字、大写字母、小写字母。大写字母、
19、小写字母。(2008年)年)答案:答案:T 5.2 图像与图形图像与图形5.2.1 数字图像的获取5.2.2 图像的表示与压缩编码5.2.3 数字图像处理与应用5.2.4 计算机图形5.2.1 数字图像的获取数字图像的获取图像的获取过程图像的获取过程扫扫描描模模拟拟图图像像取取样样取取样样取取样样数数字字图图像像分分色色量量化化量量化化量量化化l从现实世界中获得数字图像的过程称为图像的“获取”l常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等l图像获取过程:将画面划分为将画面划分为 M N个网格,每个网格,每个网格称为个网格称为 一一个取样点个取样点 将彩色图像取样将彩色图像取样点的颜色
20、分解成点的颜色分解成R,G,B三个三个基色基色测量每个取样点测量每个取样点的每个分量(基的每个分量(基色)的亮度值色)的亮度值对取样点每个分对取样点每个分量的亮度值进行量的亮度值进行A/D转换,使用转换,使用数字整型量表示数字整型量表示 5.2.2 图像的表示与压缩编码图像的表示与压缩编码数字数字(取样取样)图像的组成图像的组成l数字取样图像由M(列)N(行)个取样点组成l取样点是组成数字取样图像的基本单位,称为“像素”l彩色图像的像素通常由3个彩色分量组成l灰度图像和黑白图像的像素只包含1个亮度分量 Red分量分量Green分量分量Blue分量分量像素像素数字数字(取样取样)图像的主要参数图
21、像的主要参数l图像大小(图像分辨率):l用来表示组成该图像的行列数目,亦即图像所包含的像素数目l使用 水平分辨率x垂直分辨率 表示l对图像清晰度和在屏幕上显示出来的大小有影响l颜色空间的类型,指彩色图像所使用的颜色描述方法,如:lRGB(红、绿、蓝)模型,显示器使用lCMYK(青、品红、黄、黑)模型,彩色打印机使用lHSB(色彩、饱和度、亮度)模型,用户界面中使用lYUV(亮度、色度)模型,彩色电视信号传输时使用l像素深度,即像素的所有颜色分量的二进位数目之和图像类型像素的组成像素深度(位数)颜色空间单色图像黑白图像仅1个分量1位不使用灰度图像仅1个分量212位不使用彩色图像彩色图像3个分量以
22、上836位RGB,CMY,YUV等数字图像的数据量数字图像的数据量l数字图像数据量的计算公式(以字节为单位):数据量=水平分辨率垂直分辨率像素深度8 l几种常用格式的图像的数据量:图像大小8位(256色)16位(6536色)24位(真彩色)640480300 KB600 KB900 KB1024768768 KB1.5 MB2.25 MB128010241.25 MB2.5 MB3.75 MBl例:数字图像传输时间的计算假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨率为640480的6.5万种颜色的未压缩图像的最小时间为:(640 x480 x16)/56000=87.8秒数字图
23、像的数据压缩数字图像的数据压缩l图像数据压缩的必要性:l节省存储数字图像所需要的存储器容量l提高图像的传输速度,减少通信费用 l图像数据压缩的可能性:l数字图像中有大量的数据冗余l人眼视觉有局限性,允许图像有一些失真数字图像的数据压缩数字图像的数据压缩l图像数据压缩的两种类型:l无损压缩:用压缩后的数据还原出来的图像没有任何误差l有损压缩:用压缩后的数据还原出来的图像有一定的误差l压缩编码方法的评价压缩倍数的高低(压缩比大小)压缩倍数的高低(压缩比大小)重建图像的质量(有损压缩时)重建图像的质量(有损压缩时)压缩算法的复杂程度压缩算法的复杂程度数字图像的常用文件格式数字图像的常用文件格式l不同
24、的图象文件格式采用了不同的数据压缩技术和数据组织方法,有不同的应用l常用的图像文件格式有:名称压缩编码方法性质典型应用开发公司(组织)BMPRLE(行程长度编码)无损Windows应用程序MicrosoftTIFRLE,LZW(字典编码)无损桌面出版Aldus,MicrosoftGIFLZW无损因特网CompuServeJPEGDCT(离散余弦变换),Huffman编码大多数为有损因特网,数码相机等ISO/IECJP2小波变换,算术编码无损/有损因特网,数码相机等ISO/IEC5.2.3 数字图像处理与应用数字图像处理与应用数字图象处理:目的与内容数字图象处理:目的与内容l目的:(1)提高图像
25、的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护 l内容:l去噪、增强、复原、分割、提取特征、压缩、存储、检索等5.2.4 计算机图形计算机图形什么是计算机图形什么是计算机图形(graphics)l通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”或“图像合成”)l计算机图形也称为计算机合成图像l计算机制作图形的步骤如下:建模建模/造型造型(Modeling)景物的景物的模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 辅导 数字 媒体 应用
限制150内