2022年2022年计算机数据与编码 .pdf
《2022年2022年计算机数据与编码 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年计算机数据与编码 .pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品文档. 计算机数据与编码1.6.1 信息和数据信息是人们对客观世界的认识,即对客观世界的一种反映。数据是表达现实世界中各种信息的一组可以记录、可以识别的记号或符号。它是信息的载体,是信息的具体表现形式。数据形式可以是字符、符号、表格、声音、图像等。数据可以在物理介质上记录或传输,并通过输入设备传送给计算机处理加工。数据的单位分为以下几种:1) 位( bit)计算机中最小的数据单位二进制的一个数位,称为比特位,简称位。1 位二进制只能表示两种状态,即0 或 1。n 位二进制能表示2n 种状态2) 字节( Byte)相邻 8 个比特位组成一个字节,用B 表示。字节是计算机中用来表示存储容量大小
2、的基本单位。1B = 8bits 1KB = 210B = 1024B 1MB = 220B = 1024KB 1GB = 230B = 1024MB 1TB = 240B = 1024GB 3) 字( Word)在计算机中作为一个整体被存取、传送、处理的二进制数位叫做一个字,每个字中二进制位数的长度,称为字长。用 8 位字长表示一个整数与用16 位字长表示一个整数,其所表示的数的上限和下限是不一样的。字长所占位数其所表示的数的范围8 -128 127 即: -27 (27 - 1)16 -32768 32767 即: -215 (215 - 1)32 -2147483648 21474836
3、47 即: -231 (231 - 1)1.6.2 数字化信息编码在计算机内部,可用物理器件的高低电平代表二进制的“0”和“ 1”,另外,脉冲的正负极性,晶体管的导通和截止都可以用来表示二进制的“0”和“ 1”。由于二进制只有两个状态,数据的传输和处理不容易出错,另外二进制数的记数、加减法运算规则较为简单,可用开关电路实现,且二进制的“0”和“ 1”正好与逻辑命题的两个值“真”和“假”相对应,为计算机种中实现逻辑运算和逻辑判断提供了便利的条件。所以,在计算机中,广泛采用的是只有“0”和“ 1”两个基本符号组成的基二码,或称为二进制码。计算机最重要的功能是处理信息,这些信息包括数值、文字、图形、
4、符号、图象、声音等,所有这些信息都必须经过编码,转换成计算机能够识别和处理的二进制码的形式才能够被存储、传送和加工。BCD 码是二进制编码的十进制数(Binary Coded Decimal )的简写。有四位BCD 码、六位 BCD 码和扩展的 BCD 码三种。(1)非数值数据的表示1) 字符数据的表示ASCII 码(America Standard Code for Information Interchage )是美国标准信息交换码,被国际化组织指定为国际标准,分为7 位和 8 位两种版本。国际通用的是7 位 ASCII 码,它已对大、 小写英文字母、阿拉伯数字、标点符号及控制符等特殊符号
5、编码,共 128 个字符。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 精品文档. 表中特殊符号的意义如下:NUL 空白SOH 标题开始STX 正文开始EXT 正文结束EOT 传输结束ENQ 询问ACK 承认BEL 告警BS 退格HT 横向列表LF 换行VT 垂直列表FF 换页CR 回车SO 移位输出SI 移位输入SP 空格DLE 转义DC1 设备控制 1DC2 设备控制 2DC3 设备控制3DC4 设备控制4NAK 否认SY
6、N 空转同步ETB 信息组传送结束CAN 作废EM 纸尽SUB 取代ESC 扩展FS 文字分隔符GS 组分隔符RS 记录分隔符US 单元分隔符DEL 删除(2) 汉字的表示汉字与英文的主要区别:1) 英文是拼音文字,汉字是表意文字。英文字母只有26 个,汉字多达5 万个以上,常用汉字也有6000多个。2) 汉字的同音字很多,一个音往往会有几个甚至几十个字。3) 英文排序简单,汉字排序非常复杂,而且与文字本身没有本质联系。开发一个完善的中文信息处理系统必须解决以下三个主要问题:(1) 汉字输入 (2) 汉字输出 (3) 汉字与西文的兼容性汉字的编码和表示1)汉字交换码(国标码)汉字交换码(国标码
7、)主要用于汉字信息交换。国标码: 以国家标准局1980 年颁布的信息交换用汉字编码字符集基本集(代号为GB2312 80)规定的汉字交换码作为国家标准汉字编码。GB2312 80 中共有 7445 个字符符号:汉字符号 6763 个 一级汉字3755 个 (按汉语拼音字母顺序排列)二级汉字 3008 个 (按部首笔划顺序排列)非汉字符号682 个 GB2312 80 规定,所有的国标码汉字及符号组成一个94 94 的方阵。在此方阵中,每一行称为一个区,每一列称为一个 位。这个方阵实际上组成一个有94 个区(编号由 01 到 94),每个区有 94 个位(编号由 01 到 94)的汉字字符集。一
8、个汉字所在的区号和位号的组合就构成了该汉字的区位码 。其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个唯一的区位码,没有重码。区位码分布情况如下:区 号 内 容 1 区 键盘上没有的各种符号2 区 各种序号3 区 键盘上的各种符号 (按中文方式给出)4 -5区 日文字母6 区 希腊字母7 区 俄文字母8 区 标识拼音声调的母音及拼音字母名称9 区 制表符号10- 15 区 未用 16-55 区 一级汉字(按拼音字母顺序排列)56- 87 区 二级汉字(按部首笔划顺序排列)88- 94区 自定义汉字由上可以看出,所有汉字与符号的94 个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年2022年计算机数据与编码 2022 计算机 数据 编码
限制150内