文本信息加工精选课件.ppt
《文本信息加工精选课件.ppt》由会员分享,可在线阅读,更多相关《文本信息加工精选课件.ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于文本信息加工第一页,本课件共有21页一、文字及其处理技术体验文字处理技术字母文字以字母拼写方法的不同表达不同的含义象形文字使用自身的“形”直接昭示其含义汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字的造字法有四种:象形、指事、会意、形声。汉字的造字法有四种:象形、指事、会意、形声。这是一个指事字。从字体上看,就是本这是一个指事字。从字体上看,就是本字倒过来。上部为树头,下部为树梢,字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。因此,末的最初的意义
2、是树梢。象形指事第二页,本课件共有21页一、文字及其处理技术体验文字处理技术金文明为日月幷照之会意字。会意会意东巴文字东巴文字现代活着的象形文字现代活着的象形文字第三页,本课件共有21页一、文字及其处理技术体验文字处理技术历史上使用的文字处理技术历史上使用的文字处理技术手写手写刻字刻字雕版印刷雕版印刷活字印刷活字印刷机械式机械式打字机打字机计算机计算机文字处理文字处理计算机文字处理计算机文字处理只能处理英文可处理包括象形文字在内的任何文字如何在计算机中处理汉字?如何在计算机中处理汉字?第四页,本课件共有21页一、文字及其处理技术汉字的编码目前计算机上使用的汉字编码主要有三种。输入码(外码)机内
3、码(内码)输出码(字型码)用于输入汉字的编码用于存储汉字的编码用于输出汉字的编码区位码 :4860全拼编码:xiong五笔字型:CEXO熊用机内码表示、存储如国标码(GB)和BIG5码用汉字字型输出汉字第五页,本课件共有21页一、文字及其处理技术汉字的编码例:例:“春春”字在计算机中的处理过程。字在计算机中的处理过程。第六页,本课件共有21页汉字输人码 汉字的外部码汉字的外部码 汉字的外部码简称外码,又汉字的外部码简称外码,又叫输人码,是输人汉字的一组键盘符号。叫输人码,是输人汉字的一组键盘符号。使用不同的输入方法,同一汉字的外部码使用不同的输入方法,同一汉字的外部码不同。用户应选用易记忆、操
4、作简单、位不同。用户应选用易记忆、操作简单、位码少、重码少和输人速度快的外码。码少、重码少和输人速度快的外码。第七页,本课件共有21页汉字机内码 汉字的内部码汉字的内部码 汉字的内部码又称汉字内码汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区字节表示汉字的内码。为了和西文符号区分,内码的最高位设为分,内码的最高位设为“1”。内码通常用。内码通常用汉字在车库中的物理位置表示,可以是汉汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可
5、以是字库中的存字在字库中的序号,也可以是字库中的存储位置。储位置。第八页,本课件共有21页汉字输出码 汉字字形码汉字字形码 在显示或打印汉字时,还涉及到字形码,又在显示或打印汉字时,还涉及到字形码,又称输出码。汉字字形是指原来铅字排版汉字的大小和称输出码。汉字字形是指原来铅字排版汉字的大小和形状,在计算机中指组成汉字的点阵。尽管汉字字形形状,在计算机中指组成汉字的点阵。尽管汉字字形有多种变化,笔画繁简不一,但都是方块字且大小相有多种变化,笔画繁简不一,但都是方块字且大小相同,都可以写在同样的方块中。把一个方块看成同,都可以写在同样的方块中。把一个方块看成m行行n列矩阵,共有列矩阵,共有mn个点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文本 信息 加工 精选 课件
限制150内