计算机的信息表示.ppt
各种进制数的运算各种进制数的运算l方法:方法:逢满进一逢满进一具体计算与平时十进制的计算具体计算与平时十进制的计算类似,以十六进制为例:类似,以十六进制为例:加法:加法:减法:减法:乘法:乘法:2二数制的逻辑运算二数制的逻辑运算l逻辑运算主要包括三种基本运算:逻辑运算主要包括三种基本运算:l逻辑加法(又称逻辑加法(又称“或或”运算):运算):A或或B只要有一个为只要有一个为1,其逻辑加的结果为其逻辑加的结果为1;两者都为;两者都为1则逻辑加为则逻辑加为1。l逻辑乘法(又称逻辑乘法(又称“与与”运算):运算):A或或B都同时取值为都同时取值为1时,时,其逻辑乘积才等于其逻辑乘积才等于1。逻辑否定(又称逻辑否定(又称“非非”运算):非运算):非0等于等于1,非,非1等于等于0。l此外,此外,“异或异或”运算也很有用:两个逻辑变量相异,输运算也很有用:两个逻辑变量相异,输出才为出才为1。3第三节第三节 计算机的信息表示计算机的信息表示*数据、信息和信息编码数据、信息和信息编码二进制常用的数据单位二进制常用的数据单位常用的信息编码常用的信息编码信息组织的层次结构信息组织的层次结构4数据和信息数据和信息数据数据数据是存储在某一媒体上符号的集合。数据是存储在某一媒体上符号的集合。信息信息从不同渠道、角度观察或经过加工后的数据。从不同渠道、角度观察或经过加工后的数据。数据是信息的符号表示,或称载体;数据是信息的符号表示,或称载体;信息是数据的内涵,是数据的语义解释。信息是数据的内涵,是数据的语义解释。数据是信息存在的一种形式,只有通过解释或处理才能成为有用的数据是信息存在的一种形式,只有通过解释或处理才能成为有用的信息。信息。数据可用不同的形式表示,而信息不会随数据不同的形式而改变。数据可用不同的形式表示,而信息不会随数据不同的形式而改变。5数据与信息的关系数据与信息的关系数据数据l存储数据存储数据对于计算机只能识别对于计算机只能识别0 0和和1 1的序列。的序列。l数值:进制转换数值:进制转换l其他类型的数据:文本、图像、声音、视频等,通其他类型的数据:文本、图像、声音、视频等,通过编码方式转换过编码方式转换l组织数据组织数据信息组织的层次结构信息组织的层次结构8二进制的数据单位二进制的数据单位(1(12)2)位位(bit)(bit)计算机存储数据、表示数据的最小单位;计算机存储数据、表示数据的最小单位;字节字节(Byte)(Byte)数据处理的基本单位;数据处理的基本单位;1Byte=8 bits1Byte=8 bits计算机存储容量的大小是以字节为单位度量计算机存储容量的大小是以字节为单位度量的。的。1KB=1024B=21KB=1024B=21010B B1MB=1024KB=21MB=1024KB=22020B B1GB=1024MB=21GB=1024MB=23030B B 1TB=1024GB=2 1TB=1024GB=24040B B 9二进制的数据单位二进制的数据单位(2(22)2)字字(Word)(Word)CPUCPU通过数据总线一次存取、加工通过数据总线一次存取、加工和传送的字节数和传送的字节数不同的计算机,字长是不同的,常不同的计算机,字长是不同的,常用的字长有用的字长有8 8位、位、1616位、位、3232位和位和6464位位等,也就是经常说的等,也就是经常说的8 8位机、位机、1616位机、位机、3232位机或位机或6464位机。位机。10常用的信息编码常用的信息编码(1/31/3)l数字字符编码:数字字符编码:三种常见编码为三种常见编码为BCD编码编码(有权码有权码),余,余3码码(无权无权码码),格雷码,格雷码(无权码无权码)。l英文字符编码:英文字符编码:ASCII码码美国标准信息交换码美国标准信息交换码l文字字符编码:文字字符编码:文字处理的过程较为复杂,分别需要分解为文字处理的过程较为复杂,分别需要分解为汉汉字的输入、存储、输出字的输入、存储、输出等环节,且每个环节用等环节,且每个环节用的编码也不相同,要进行一系列的编码转换,的编码也不相同,要进行一系列的编码转换,输入环节所对应的是输入码,存储环节对应的输入环节所对应的是输入码,存储环节对应的是内部码,输出环节对应的是字形码。是内部码,输出环节对应的是字形码。11常用的信息编码(2/3)数字字符编码数字字符编码:BCD BCD码码(Binary Coded(Binary Coded Decimal)Decimal)二二十进制编码是用四位二进制码的十进制编码是用四位二进制码的10 10 种组合表示十进制数种组合表示十进制数0909,简称,简称BCDBCD码。码。8421BCD8421BCD码是最基本和最常用的码是最基本和最常用的BCDBCD码,码,它和四位自然二进制码相似,它和四位自然二进制码相似,各位的权各位的权值为值为8 8、4 4、2 2、1 1。例如:3 6 9 7 4 0011 0110 1001 0111 0100(369.74)10=(0011 0110 1001.0111 0100)BCD12常用的信息编码常用的信息编码(2/32/3)英文字符编码:英文字符编码:ASCII ASCII码码(America(America Standard Code for Information Standard Code for Information Interchange)Interchange)目前计算机中使用最广泛的西文字符集目前计算机中使用最广泛的西文字符集及其编码及其编码,即美国信息交换标准代码。它被,即美国信息交换标准代码。它被国际标准化组织批准为国际标准,已在全世国际标准化组织批准为国际标准,已在全世界通用。界通用。13ASCIIASCII码(表码(表1.61.6)编码特点:编码特点:1 1)00H00H1FH为控制码为控制码2 2)数字)数字0 09 9的的ASCIIASCII码为码为 30H30H39H39H3 3)大写字母)大写字母A AZ Z的的ASCIIASCII码为码为41H41H5AH5AH4 4)小写字母)小写字母的的ASCIIASCII码为码为61H61H7AHAH14常用的信息编码常用的信息编码(2/32/3)文字字符编码:文字字符编码:根据汉字处理过程中的不同的要求,根据汉字处理过程中的不同的要求,有多种编码,分为四类:有多种编码,分为四类:汉字输入码;汉字输入码;汉字交换码;汉字交换码;汉字内码;汉字内码;汉字字形码。汉字字形码。l汉字外码汉字外码(汉字输入码汉字输入码)(1)概念:是指从键盘上输入的代表汉字的编码,又称概念:是指从键盘上输入的代表汉字的编码,又称“汉字输入码汉字输入码”。(2)输入码分为:输入码分为:1.数字编码数字编码2.拼音码拼音码3.字型码字型码数字编码数字编码:对应于国标区位码对应于国标区位码6763个两级汉字所对应的个两级汉字所对应的编码,区位码分编码,区位码分94个区,每个区个区,每个区94位。前两位是区位。前两位是区位,后两位是字位,特点是无重码,和内码转换方位,后两位是字位,特点是无重码,和内码转换方便,前位后位都是便,前位后位都是10进制数字表示,但难以记忆。进制数字表示,但难以记忆。拼音码:通过汉语拼音进行的编码,重码率高,影响拼音码:通过汉语拼音进行的编码,重码率高,影响速度。速度。字形码:通过偏旁部首进行的编码,比较典型的是五字形码:通过偏旁部首进行的编码,比较典型的是五笔字形,表形码等笔字形,表形码等l区位码和国标码(汉字交换码)区位码和国标码(汉字交换码)(1)国标:国标:1981年,我国制订了年,我国制订了“中华人们共和国国家标准信息交换中华人们共和国国家标准信息交换汉字编码汉字编码”,代号为,代号为“GB2312-80”。国标码字符集中收集了常用。国标码字符集中收集了常用汉字和图形符号汉字和图形符号7445个,其中图形符号个,其中图形符号682个,汉字个,汉字6763个,按个,按照汉字的使用频度分为两级,第一级为常用汉字照汉字的使用频度分为两级,第一级为常用汉字3755个,第二级个,第二级为次常用汉字为次常用汉字3008个。个。(2)区位码:按国标规定,汉字编码表有区位码:按国标规定,汉字编码表有94行行94列,其行号列,其行号0194称称为区号,列号为区号,列号0194称为位号。一个汉字所在的区号和位号简单称为位号。一个汉字所在的区号和位号简单地组合在一起就构成了这个汉字的区位码。地组合在一起就构成了这个汉字的区位码。区位码区位码=区号区号+位号位号例例1:汉字:汉字“啊啊”处于处于16区的区的01位,则其区位码为位,则其区位码为1601(十进制)(十进制)(3)国标码:又称为国标码:又称为“交换码交换码”,它是在不同汉字处理系统间进行汉,它是在不同汉字处理系统间进行汉字交换时所使用的编码,是汉字信息交换的标准编码。国标码采字交换时所使用的编码,是汉字信息交换的标准编码。国标码采用两个字节表示,它与区位码的关系是:用两个字节表示,它与区位码的关系是:国标码高位字节国标码高位字节=(区号区号)16+(20)16国标码低位字节国标码低位字节=(位号位号)16+(20)16例例2:汉字:汉字“啊啊”的区位码为的区位码为1601,则其国标码为,则其国标码为(3021)16。为了避开为了避开ASCII字符中的不可打印字符字符中的不可打印字符0100001B1111110B(即即21H-7EH),国标码表示汉字的范围为国标码表示汉字的范围为2121H-7E7EH。l汉字内码汉字内码(机内码机内码)为了避免为了避免ASCII码和国标码同时使用时产生二义性问题,大码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置部分汉字系统都采用将国标码每个字节高位置1作为汉字作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关二义性,又使汉字机内码与国标码具有极简单的对应关系。系。(1)概念:在计算机内部表示汉字的代码。概念:在计算机内部表示汉字的代码。(2)特点:汉字内码采用两个字节,一个汉字占两个特点:汉字内码采用两个字节,一个汉字占两个ASCII字字符;汉字内码最高位为符;汉字内码最高位为1,ASCII码最高位为码最高位为0(3)汉字内码与区位码的关系:汉字内码与区位码的关系:汉字内码高位字节汉字内码高位字节=(区号区号)16+(A0)16汉字内码低位字节汉字内码低位字节=(位号位号)16+(A0)16例:汉字例:汉字“啊啊”的区位码为的区位码为1601,则其汉字内码为,则其汉字内码为(B0A1)16如如“保保”字在二维代码表中处于字在二维代码表中处于17区第区第3位,区位码、国标位,区位码、国标码、机内码?码、机内码?l汉字字形码汉字字形码汉汉字字字字形形码码用用于于汉汉字字的的显显示示和和打打印印,是是汉汉字字字字形形的的数数字字化化信信息息,表表示示汉汉字字字字形形的的字字模模数数据据,也也称称字字模模码码,它它是是汉字的输出形式汉字的输出形式,通常用点阵、矢量函数等方式表示。通常用点阵、矢量函数等方式表示。常常用用的的字字形形点点阵阵有有1616点点阵阵、2424点点阵阵、4848点点阵阵等等等等。字字模模点点阵阵的的信信息息量量是是很很大大的的,占占用用存存储储空空间间也也很很大大,以以1616点点阵阵为为例例,每每个个汉汉字字占占用用32(216=32)个个字字节节,两两级级汉汉字字大大约约占占用用256KB。因因此此,字字模模点点阵阵只只能能用用来构成来构成“字库字库”,而不能用于机内存储。而不能用于机内存储。字字库库中中存存储储了了每每个个汉汉字字的的点点阵阵代代码码,当当显显示示输输出出时时才才检检索索字字库库,利利用用汉汉字字字字形形检检索索程程序序根根据据汉汉字字的的内内码码从从字字模模库库中找到相应的字形码,输出字模点阵得到字形。中找到相应的字形码,输出字模点阵得到字形。19l点阵汉字点阵汉字64*64点阵,一个汉字共占点阵,一个汉字共占512字节字节00 07 00 E0 07 00 0C 00H00 07 00 E0 07 00 0C 00H第第3232行行第第6363行行第第0 0行行20l矢量汉字矢量汉字21常用的信息编码常用的信息编码(3/33/3)l各种汉字编码之间的关系其他系统代码 机内码输出码输入码交换码图像的编码图像的编码l位图图形位图图形l矢量图形矢量图形将图像分解成曲线和直线的组合,其中每将图像分解成曲线和直线的组合,其中每一曲线或直线由数学公式表示。一曲线或直线由数学公式表示。00011000000110000001100000011000 图像 矩阵表示00011000 00111100 00111100 00011000 线性表示音频音频l音频表示声音和音乐。将音频转换成数音频表示声音和音乐。将音频转换成数字数据,并存储起来。字数据,并存储起来。采样量化编码00000100000011114 6 6 4 4 4 6 6 8 8视频视频l视频是图像在时间上的表示。电影就视频是图像在时间上的表示。电影就是一系列的帧,一张接一张地播放而是一系列的帧,一张接一张地播放而形成的运动图像。形成的运动图像。l视频通常是被压缩存储的。视频通常是被压缩存储的。25第四节第四节 带符号数的表示方法带符号数的表示方法*无符号数无符号数*有符号数有符号数*定点数与浮点数定点数与浮点数26无符号数无符号数无符号数字就是没有符号的数。无符号数字就是没有符号的数。27有符号数有符号数将符号数字化,用将符号数字化,用0 0表示正号,用表示正号,用1 1表示负表示负号,并将它们放在有效数字的前面。带符号,并将它们放在有效数字的前面。带符号机器数常用的编码有原码、补码和反码号机器数常用的编码有原码、补码和反码28原码原码原码原码用用0 0表示正号,而用表示正号,而用1 1表示负号,数的有表示负号,数的有效值由二进制绝对值表示。效值由二进制绝对值表示。(+12)(+12)1010=(00001100)=(00001100)2 2(-12)(-12)1010 =(10001100)=(10001100)2 2 29反码反码反码反码对于正数,反码与原码相同;对于正数,反码与原码相同;对于负数,将原码取反。对于负数,将原码取反。(+12)(+12)1010=(00001100)=(00001100)2 2(-12)(-12)1010 =(11110011)=(11110011)2 2 30补码补码补码的作用补码的作用使符号位能与有效值部分一起参加运算使符号位能与有效值部分一起参加运算,从而简化运算规则;使减法运算转换为加法从而简化运算规则;使减法运算转换为加法运算运算,进一步简化计算机中运算器的线路设进一步简化计算机中运算器的线路设计计补码补码正数的补码与原码相同;正数的补码与原码相同;负数的补码为反码加负数的补码为反码加1 1 (+12)(+12)1010=(00001100)=(00001100)2 2(-12)(-12)1010 =(11110100)=(11110100)2 2 二进制补码表示法,是现在最普遍、最重要、应用最广泛的整数表示法。31有符号数有符号数将十进制数将十进制数5252化成二进制数,并写化成二进制数,并写出原码、反码、补码的表示(符号位出原码、反码、补码的表示(符号位和数值位共和数值位共8 8位)位)答案:答案:52=110100 52=110100 原码表示原码表示 10110100 10110100 反码表示反码表示 11001011 11001011 补码表示补码表示 11001100 11001100 32定点数定点数l表示方法简单直观,但表示数的范围小l通常用于表示整数或纯小数上溢:机器数大于定点数的最大值上溢:机器数大于定点数的最大值下溢:机器数小于定点数的最小值下溢:机器数小于定点数的最小值33浮点数浮点数l浮点数指小数点不固定的数l所表示的范围比定点数大规格化:移动小数点直到小数点后的第规格化:移动小数点直到小数点后的第1位为位为1,阶码也做相应的调整,保证数值不变阶码也做相应的调整,保证数值不变