第5部分数字媒体及应用.ppt
《第5部分数字媒体及应用.ppt》由会员分享,可在线阅读,更多相关《第5部分数字媒体及应用.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5部分数字媒体及应用 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望5.1 文本与文本处理n n文本:基于特定字符集的、按一定格式组织起来的、具有文本:基于特定字符集的、按一定格式组织起来的、具有上下文相关性的一个字符流,每个字符均使用编码表示。上下文相关性的一个字符流,每个字符均使用编码表示。文本展现(阅读器)文本处理(文本处理软件)文本生成电子文本文本编辑(编辑器)格式化的电子文本文本存储与传输2022/12/62022/12/62 2NJNUNJNU1 1
2、、西文字符的编码、西文字符的编码n n 西文字符集(拉丁字母、数字、标点等组成)西文字符集(拉丁字母、数字、标点等组成)n n 标准标准 ASCII ASCII 字符集字符集 ASCII ASCII 字符集采用字符集采用 7 7 位编码位编码 每个每个 ASCII ASCII 字符以一个字节存放字符以一个字节存放n n 扩充扩充 ASCII ASCII 字符集字符集:标准:标准ASCII ASCII 码码+扩展扩展ASCII ASCII 码码 一、字符的编码2022/12/62022/12/63 3NJNUNJNU2.汉字的编码n n汉字是记录汉语(国语,华语)的文字,属于表汉字是记录汉语(国
3、语,华语)的文字,属于表意文字,它用符号直接表达词或词素。意文字,它用符号直接表达词或词素。n n汉字的特点:汉字的特点:数量大(我国汉字自数量大(我国汉字自古至今累计已超过古至今累计已超过6 6万字万字 多个国家和地区使用:港台地区,日、韩、朝、新、多个国家和地区使用:港台地区,日、韩、朝、新、马等马等 字形复杂,同音字多,异体字多。字形复杂,同音字多,异体字多。n n我国汉字编码的国家标准:我国汉字编码的国家标准:GB2312GB2312(67636763个常用简体汉字和个常用简体汉字和682682个非汉字字符个非汉字字符 )GBK GBK(2090220902个个CJKCJK汉字和汉字和
4、符号)符号)UCS/UnicodeUCS/Unicode与与GB18030GB180302022/12/62022/12/64 4NJNUNJNU(1)GB2312 1980 汉字编码 包括包括 6763 6763 个汉字和个汉字和 682 682 个非汉字字符个非汉字字符 GB2312 GB2312 构成:构成:n n一级常用汉字一级常用汉字 3755 3755 个,按汉语拼音排列个,按汉语拼音排列n n二级常用汉字二级常用汉字 3008 3008 个,按偏旁部首排列个,按偏旁部首排列n n非汉字字符非汉字字符 682 682 个个 GB2312 GB2312 构成一个二维平面,分成构成一个
5、二维平面,分成 94 94 行和行和 94 94列,列,行号称为区号,列号称为位号,两者组合就是汉字编码。行号称为区号,列号称为位号,两者组合就是汉字编码。称为区位码。称为区位码。区位码的区号和位号分别加上区位码的区号和位号分别加上 20H 20H,得到国标码。,得到国标码。国标码的两个字节的最高位置国标码的两个字节的最高位置 1 1,得到,得到 PC PC 机常用的机常用的 机内码机内码2022/12/62022/12/65 5NJNUNJNU以汉字“啊”为例:区位码为:1601,表示区号16位号01 对应二进制数为:00010000,00000001国标码对应二进制数为:00110000,
6、00100001B机内码对应二进制数为:10110000,10100001B2022/12/62022/12/66 6NJNUNJNU(2)GBK汉字内码扩充规范总计 23940 个码位,共收入 21003 个汉字和883图形符号简体和繁体汉字在同一个字符集中;包含了中、日、韩认同的全部CJK汉字;与GB2312-80保持向下兼容;2022/12/62022/12/67 7NJNUNJNU3、UCS/Unicode 与 GB18030 汉字编码标准(1)通用编码字符集 UCS/UnicodeUCS UCS 实现了对所有字符统一编码实现了对所有字符统一编码(2)GB18030 编码(2000年)
7、目的是向目的是向 UCS UCS 过渡,同时与过渡,同时与 GB2312 GB2312、GBK GBK 兼容,目前已经在许多计算机系统中使用。兼容,目前已经在许多计算机系统中使用。用用 1 1、2 2 或或 4 4 字节编码,汉字数达到字节编码,汉字数达到 27000 27000 多个多个2022/12/62022/12/68 8NJNUNJNU二、文本的准备 n n文本信息的输入:2022/12/62022/12/69 9NJNUNJNU汉字键盘输入n n汉字的键盘输入编码汉字的键盘输入编码n n输入编码要求:易学、易记、效率高、输入编码要求:易学、易记、效率高、重码少、容量大重码少、容量大
8、n n输入编码分类:输入编码分类:数字编码数字编码 字音编码字音编码 字形编码字形编码 形音编码形音编码n n用不同的输入编码方法输入同一个汉字,其内码用不同的输入编码方法输入同一个汉字,其内码是一样的是一样的2022/12/62022/12/61010NJNUNJNU联机手写汉字识别n n原理:用专用笔在专用书写板上书写汉字原理:用专用笔在专用书写板上书写汉字(或符号或符号)计算机实时自动识别计算机实时自动识别 用该汉字用该汉字(或符号或符号)对应的代码进行保对应的代码进行保存存n n例:例:“汉王汉王”手写笔手写笔 正识率达到正识率达到 90%90%以上,识别速度超过以上,识别速度超过12
9、12字字/秒秒2022/12/62022/12/61111NJNUNJNU汉语语音识别n n分类:分类:1)1)孤立语音孤立语音/连续语音识别连续语音识别2)2)小词汇量小词汇量/大词汇量语音识别大词汇量语音识别3)3)特定人特定人/非特定人语音识别非特定人语音识别 现状:特定人连续语音识别率已达到现状:特定人连续语音识别率已达到 90%90%以以上上 目标:非特定人大词汇量的连续语音识别目标:非特定人大词汇量的连续语音识别2022/12/62022/12/61212NJNUNJNU4.印刷体汉字识别输入对于将现存的大量书、报、刊物、档案、资料等输入计算机是非常重要的手段。5.脱机手写汉字识别
10、输入是一种用于将预先手写好的文稿输入计算机的方法,也是计算机字符识别中最困难的一个问题。2022/12/62022/12/61313NJNUNJNU1 1、简单文本(纯文本)、简单文本(纯文本)除了表达正文的字符和几个打印控制字符外,不含其除了表达正文的字符和几个打印控制字符外,不含其它格式信息和结构信息。简单文本又称为纯文本,它格式信息和结构信息。简单文本又称为纯文本,ASCIIASCII文本,其文件的后缀为文本,其文件的后缀为“.txt”(“.txt”(文本文件文本文件)简单文本为一种线性结构,由若干行构成,每行由若简单文本为一种线性结构,由若干行构成,每行由若干个字构成干个字构成2 2、
11、丰富格式文本、丰富格式文本 在简单文本中增加格式控制和结构说明信息,构成丰在简单文本中增加格式控制和结构说明信息,构成丰富格式文本富格式文本 RTFRTF是一种中间格式,它的目的是使各种丰富格式文本是一种中间格式,它的目的是使各种丰富格式文本相互交换使用,以兼容不同格式文本。相互交换使用,以兼容不同格式文本。三、文本的类型2022/12/62022/12/61414NJNUNJNU3、超文本超文本采用一种网状结构来组织信息一个超文本由若干个文本块组成,这些文本块称为节点节点可以是文字、图形、图像、声音或视频基于多媒体信息结点的超文本,也称为超媒体。例:Windows中的“帮助”文件就是一种典型
12、的超文本文本的类型2022/12/62022/12/61515NJNUNJNU超文本结构 a1 a2 b2 c2 f1d1c1 b1 e1 g1h1a32022/12/62022/12/61616NJNUNJNU四、文本的编辑与处理1 1、文本编辑与文本处理、文本编辑与文本处理n n 文本编辑文本编辑:内容:对字内容:对字(词词,句句)、段落、页面等进行添加、删除、段落、页面等进行添加、删除、修改等操作修改等操作 字的处理字的处理 段落的处理段落的处理 页面布局的处理页面布局的处理 目的:使文本内容正确,版面清晰整齐、美观大方目的:使文本内容正确,版面清晰整齐、美观大方 所见即所得:所见即所得
13、:n n编辑的效果在屏幕上可以立即看到编辑的效果在屏幕上可以立即看到n n在屏幕上看到的效果与打印出来的效果一致在屏幕上看到的效果与打印出来的效果一致2022/12/62022/12/61717NJNUNJNU2.文本处理软件(1 1)面向通信的文本处理软件)面向通信的文本处理软件 :Outlook Express Outlook Express(2 2)面向办公的文本处理软件)面向办公的文本处理软件 :MS Word,WPS2000 MS Word,WPS2000(3 3)面向印刷出版的文本处理软件:)面向印刷出版的文本处理软件:“飞腾飞腾”排版软件,排版软件,PageMakerPageMa
14、ker,PDF Writer PDF Writer(4 4)面向网络信息发布和电子出版的文本处理软件:)面向网络信息发布和电子出版的文本处理软件:FrontPage,PDF Writer FrontPage,PDF Writer 2022/12/62022/12/61818NJNUNJNU五、文本的展现n n过程:过程:1.1.对文本的格式描述进行解释对文本的格式描述进行解释2.2.生成文字和图表的映像(生成文字和图表的映像(bitmapbitmap)3.3.传送到显示器或打印机输出传送到显示器或打印机输出n n承担文本输出任务的软件称为文本阅读器或浏览器:承担文本输出任务的软件称为文本阅读器
15、或浏览器:嵌入在文本编辑嵌入在文本编辑(处理处理)软件中,如微软的软件中,如微软的 WordWord 独立的软件:如独立的软件:如 Adobe Adobe 公司的公司的 Acrobat ReaderAcrobat Reader,微软,微软公司的公司的 IE IE 等等 2022/12/62022/12/61919NJNUNJNU输出过程中字形的生成 文本展现过程中,字符形状的生成是一个关键文本展现过程中,字符形状的生成是一个关键n n先根据字符的字体确定相应的字型库(先根据字符的字体确定相应的字型库(fontfont)n n再按照该字符的代码从字型库中取出该字符的形再按照该字符的代码从字型库中
16、取出该字符的形状描述信息状描述信息n n然后按形状描述信息生成字形,并按照字号大小然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必及有关属性(粗体、斜体、下横线)将字形作必要的变换要的变换n n最后将变换得到的字形放置在页面的指定位置处最后将变换得到的字形放置在页面的指定位置处2022/12/62022/12/62020NJNUNJNU字形描述方法n n点阵字形:点阵字形:“1”“1”表示对应位置是黑点表示对应位置是黑点 “0”“0”表示是空白表示是空白n n轮廓字形:用曲线描述,精度高、字形可变,轮廓字形:用曲线描述,精度高、字形可变,如:如:Window
17、s Windows 中的中的 TrueType TrueType 字符的点阵描述字符的轮廓描述2022/12/62022/12/62121NJNUNJNU5.2 图像与图形n n数字图像按其生成方法可以分为数字图像按其生成方法可以分为两大类:两大类:通过数字化设备获取的图像,它们称为取样图像通过数字化设备获取的图像,它们称为取样图像(sampled imagesampled image)、点阵图像()、点阵图像(dot matrix dot matrix imageimage)、位图图像()、位图图像(bitmap imagebitmap image),以下简称),以下简称图像(图像(imag
18、eimage)计算机合成的图像计算机合成的图像(synthetic image)(synthetic image),它们称为矢量,它们称为矢量图形(图形(vector graphicsvector graphics),或简称图形(),或简称图形(graphicsgraphics)2022/12/62022/12/62222NJNUNJNU1.图像的数字化(1)扫描:将图像分成 M*N 个点进行取样(2)分色:将每个点分成 R、G、B 三个基色。(3)取样:测量每个取样点每个分量的亮度值(4)量化:对每个分量进行 A/D 转换,再用 数字量表示一、图像的获取2022/12/62022/12/62
19、323NJNUNJNU2.数字图像获取设备 功能:将现实的景物输入到计算机内功能:将现实的景物输入到计算机内 种类:种类:2D 2D 扫描仪、数码相机、扫描仪、数码相机、3D 3D 扫描仪等扫描仪等2022/12/62022/12/62424NJNUNJNU二、图像的表示与压缩编码1.1.图像的表示方法与主要参数图像的表示方法与主要参数n n 每个取样点称为像素每个取样点称为像素n n 彩色图像用三个矩阵来表示彩色图像用三个矩阵来表示 矩阵的行数称为垂直分辩率矩阵的行数称为垂直分辩率 矩阵的列数称为水平分辩率矩阵的列数称为水平分辩率 矩阵的元素值是像素颜色分量的亮度值矩阵的元素值是像素颜色分量
20、的亮度值n n 一幅取样图像,除了像素数据外,还有以下属一幅取样图像,除了像素数据外,还有以下属性:性:图像分辩率:图像在屏幕上的大小图像分辩率:图像在屏幕上的大小 颜色空间的类型:描述彩色图像所使用的颜色描述方颜色空间的类型:描述彩色图像所使用的颜色描述方法(常用的有法(常用的有RGBRGB、CMYKCMYK、HSVHSV、YUVYUV)像素深度:各种颜色(亮度)分量的位数之和像素深度:各种颜色(亮度)分量的位数之和2022/12/62022/12/62525NJNUNJNU彩色图像的表示蓝色分量绿色分量红色分量2022/12/62022/12/62626NJNUNJNU2.图像的压缩编码n
21、 n图像数据量的计算公式(以字节为单位):图像数据量的计算公式(以字节为单位):数据量数据量 =图像水平分辨率图像水平分辨率图像垂直分辨率图像垂直分辨率像素深度像素深度8 8 n n数据压缩的必要性数据压缩的必要性n n数据压缩的两种类型:数据压缩的两种类型:无损压缩无损压缩 有损压缩有损压缩n n压缩编码方法的评价:压缩编码方法的评价:压缩倍数的大小,压缩倍数的大小,重建图像的质量(有损压缩时)重建图像的质量(有损压缩时)压缩算法的复杂程度压缩算法的复杂程度 2022/12/62022/12/62727NJNUNJNU图像压缩编码的国际标准 n nJPEGn nJPEG20002022/12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 部分 数字 媒体 应用
限制150内