欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第02章 信息的分类与编码(陈庄)课件.ppt

    • 资源ID:15283381       资源大小:370.50KB        全文页数:39页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第02章 信息的分类与编码(陈庄)课件.ppt

    2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)1陈庄 博士 教授2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)2内容提要(1/2)v2.1 信息元素的涵义 2.1.1 信息元素的概念2.1.2 信息元素的命名原则 信息元素的标识 信息元素的一致性v2.2 信息分类的方法2.2.1 信息分类的概念 信息分类的基本原则2.2.3 信息分类的基本方法v 线分类法v 面分类法v 混合分类法2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)3内容提要(2/2)v2.3 信息编码方法 信息编码的概念2.3.2 信息编码的功能和信息编码的基本原则 代码的分类v2.3.3.1 按符号形式分类 v2.3.3.2 按符号的含义分类2.3.4 编码的校验v 错误种类v2.3.4.2 校验方法v2.3.4.3 信息编码错误的校验步骤v2.3.4.4 校验案例 v2.4 作业 (.)2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)42.1.1 信息元素的概念v信息元素(又称数据元素或数据项)是最小的不可再分的信息单位,是一类信息的总称。v例如:船舶资料中的船名“天河轮”、“冀海轮”等,可以抽象出“船舶名称”这个数据元素;每一条船都有一个编号,可以概括出“船舶编号”这个数据元素。通常职工档案中的“简历”、“受奖情况”等,不是信息元素。因为“简历”至少包括时间、地点等信息,是可以继续分解的信息;“受奖情况”也是可以继续分解的信息。(注意:“信息元素”可以视为数据库中的“字段”)2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)52.1.2 信息元素的命名原则(1/2)v1、命名原则信息元素命名的原则就是用一简明的词组来描述一个信息元素的意义和用途。 v2、词组的一般结构类别词和基本词都只有个,修饰词可以有一个或多个;是信息元素命名中的个最重要的名词,用来识别和描述信息元素的一般,一般不具有行业持征,条目较少。如数量(AMOUNT)、名称(NAME)、编号(NUMBER)、代码(CODE)等。 是类别词的最重要的修饰词,它对一大类信息对象进一步分类(反映一小类信息对象),一般具有特征,条目较多。如会计(ACCOUNTING)、预算(BUDGET)、顾客(CUSTOMER)等。修饰词一基本词一类别词修饰词一基本词一类别词2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)62.1.2 信息元素的命名原则(2/2)v3、信息元素命名案例社会保险编码 (修饰词)、(基本词)、(类别词)学校学生学号学校贵重设备名称(修饰词)、(修饰词)、(基本词)、(类别词)2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)72.1.3 信息元素的标识v1、信息元素标识的含义又称信息元编码是计算机和管理人员共同使用的标识。v2、信息元素标识的方法用限定长度的大写字母字符串表达,字母字符可按信息元素名称的汉语拼音抽取首音字字母,也可按英文词首字母或缩写规则得出。v3、案例:2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)82.1.4 信息元素的一致性v信息元素命名和信息元素标识要在组织(政府部门或企事业单位)中保持一致。v不允许有“同名异义”的信息元素。v也不允许有“同义异名”的信息元素。这里的”名”是指信息元素的标识;“义”是指信息元素的命名或定义。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)92.2.1 信息分类的概念(1/2)v1、含义信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。v2、信息分类的两个要素分类对象,分类对象由若干个被分类的实体组成;分类依据,分类依据取决于分类对象的属性或特征。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)10信息分类的基本原则(1/3) 1、科学性使类别的划分符合信息的内涵、性质及使用与管理要求;选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定性,以供人们方便地使用。 2、系统性分类结构中各类信息按照他们之间的相互联系排成一定的顺序,形成一个系统,既便于人们区分信息、识别信息,又便于人们从整体上去把握信息之间的关系。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)11信息分类的基本原则(2/3) 3、可扩展性随着科学技术的进步和社会经济的发展,人们可利用的信息量急剧增长,信息的类别和分类体系结构也应适应这种变化的需要,这就要求:v分类体系结构在原有的基础上有扩展的余地,其中包括新的类别的增补和在原有类别的基础上进行分解、细化。 4、兼容性信息的分类是一个庞大而复杂的系统,这个大系统中存在着若干层分系统与子系统,一些子系统之间存在着相互联系和信息共享问题:v如生产类信息和人事类信息中都包含工人这一类信息。生产类信息在对工人这一信息的定义和再分类时就要和人事类信息兼容2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)122.2.2 信息分类的基本原则(3/3) 5、实用性由于信息的属性与特征的多样性,在实际生活中选择何种属性与特征进行分类还要考虑到人们实际应用的需要。例如:某企业在开发新产品时,管理部门、设计部门与制造部门从各自的应用目的出发,对信息的分类会提出不同的要求。v管理部门从企业的经营管理目标出发,希望信息的分类要便于生产的计划与控制,并能反映成本和市场需求方面的情况;v设计部门则从设计需要出发,希望信息的分类体系体现新产品开发组合化(模块化)、标准化、序列化的趋势;v制造工艺部门则从实现产品的小批量、多品种成组生产,以提高生产效率和质量的目的出发,希望信息的分类体系能反映产品的量、部件的几何特征与工艺特性。v因此,在制订企业信息分类体系时,要从企业的总体目标出发,充分考虑到各部门的合理要求,进行企业信息分类体系的整体优化。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)132.2.3.1 线分类法(1/3) 1、线分类法的基本思想(又称或)是将初始的分类对象(即被划分的事物或概念)按所选定的若干个属性/特征作为分类的划分基础,逐次地分解成若干个层级类目,并编排成一个逐级展开、有层次的分类体系。v同层级类目之间存在着并列关系,称为同位类。v一个层级类目经分解形成的下层类目,称为下位类;相应的被分解的类目称为上位类;上位类与下位类的关系是隶属关系。v同层级类目互不重复,不同层级的类目互不交叉。每个下位层的类目只对应于一个上位层。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)142.2.3.1 线分类法(2/3) 2、线分类法的典型案例(以下为河北省部分案例以下为河北省部分案例)v国民经济行业分类与代码(GBT 47541994)和职业分类与代码(GBT 65651999) 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)152.2.3.1 线分类法(3/3) 3、线分类法的优缺点优点:可容纳较多类目的信息。采用树形结构能较好反映类目之间的逻辑关系。既符合手工处理信息的思维习惯,又便于计算机处理。缺点:。分类结构一经确定,不易改动。当分类层次较多时,编码的位数较长,影响数据处理速度。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)162.2.3.2 面分类法(1/2) 1、面分类法的基本思想是将所选定的分类对象的若干属性或特征视为若干个“面”,每个“面”中又可分成彼此独立的若干个类目。 。可根据需要将这些“面”中的类目组合在一起,形成一个复合类目。 2、面分类法的典型案例某高校教师分类编码2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)172.2.3.2 面分类法(2/2) 3、面分类法的优缺点一个面内的属性内容与数量的调整不会影响其他的面。可根据需要组成任何类目,也便于机器处理。 。在面分类法形成的分类体系中,可组成的类目很多,但有时实际应用的类别不多。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)182.2.3.3 混合分类法 1、混合分类法的基本思想混合分类法是将线分类法和面分类法组合使用,以其中一种分类法为主,另一种做补充的信息分类方法。 2、案例:v上述教师的面分类体系中的从事专业,又可以分为学科门类(如管理学、工学等),学科门类下设若干一级学科,每个一级学科一般设有若干二级学科。v这样,从事专业这一面可、一级学科、二级学科三个层次,如下表所示。其中,一级学科用三位数字表示,二级学科用两位数字表示;一、二级学科之间用点隔开。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)192.3.1 信息编码的概念信息编码是将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处理的符号,形成代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值。信息编码包含数据表达成代码的方法数据表达成代码的方法、数据的代码表示形式数据的代码表示形式、代码元素集合的赋值代码元素集合的赋值。信息编码形式有多种,例如:v国际莫尔斯电报码用小点与短横表示。v国际通用的电阻元件参数值是用一组由不同颜色组成的圆环表示的,称为电阻色环码。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)202.3.2 信息代码的功能和信息编码的基本原则(1/2)代码的功能如下:代码的功能如下:v 信息的标识唯一,便于分类鉴别,防止同名异义、异名同义现象发生。v 信息的标识统一,便于信息交换与利用,实现更大范围的资源共享。v 信息的标识有序,便于信息的加工、排序、查询、检索。v 信息的标识明确,可以表达特定含义。v 信息的标识简洁,可以提高信息处理的效率。v 信息标识的形式与信息内容的对应关系可以人为设定,有利于信息的安全保密。 对信息进行编码,就是使信息的标识规范化的过程,代码就是信息规范化的标识符。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)212.3.2 信息代码的功能和信息编码的基本原则(2/2)信息编码的基本原则如下: 唯一性。唯一性。 合理性。合理性。 可扩展性。可扩展性。 简洁性。简洁性。 可识别性。可识别性。 规范性。规范性。 稳定性。稳定性。 v注意:企业代码由技术监督局、工商管理局负责给定;企业代码由技术监督局、工商管理局负责给定;人口代码(身份证)由公安局给定人口代码(身份证)由公安局给定2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)222.3.3 代码的分类 信息编码方法数字型代码字母型代码混合型代码顺序码无序码系列顺序码数字化字母顺序码层次码特征组合码矩阵码符号编码法无含义代码复合码有含义代码符号含义编码法2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)232.3.3.1 按符号形式分类(1/3) 1、数字型代码或称是用一个或多个阿拉伯数字表示分类对象的代码。结构简单,使用方便,特别是排序很容易,易于向国内外推广,但对于分类对象属性与特征描述不直观。案例:v我国国家标准人的性别代码v国民经济行业企业和代码v中华人民共和国行政区划代码。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)242.3.3.1 按符号形式分类(2/3) 2、字母型代码或称是用一个或多个字母表示分类对象的代码。 v(1)字母型代码与数字型代码相比,同样位数的代码比数字型的容量大得多。用一位英文字母型代码最多可以表示用一位英文字母型代码最多可以表示2626个个(A-Z)(A-Z)类目,而一位数类目,而一位数字型代码最多只能表示字型代码最多只能表示1010个类目,个类目,2 2位字母型代码最多可表示位字母型代码最多可表示26262626676676个类目。个类目。v(2)字母型代码由于其拼音字母的特点,还便于人们认识代码所表示的类目的内容,方便人们的记忆。 用用CNCN表示中国表示中国(China)(China),BJBJ表示北京表示北京(Beijing)(Beijing)等等. . v对象数量较多时,或增补、修改代码频繁时,用字母型代码容易出现重复与冲突现象。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)252.3.3.1 按符号形式分类(3/3) 3、混合型代码或称是由数字、字母或数字、字母、专用字符组合表示分类对象的代码。 v兼有上述数字型代码和字母型代码的优点,具有良好的直观性与表达性。 火车时刻表上的火车时刻表上的T15T15表示北京至广州的某一特别快车。表示北京至广州的某一特别快车。 表示表示263263网络集团在互联网上的域名编码。网络集团在互联网上的域名编码。 v混合型代码组成复杂,造成计算机输入不方便,录入效率低、错误率高。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)262.3.3.2 按符号的含义分类(1/8) 1 1、无含义代码:指组成代码的字符本身无实际含义的代码,代码只作为编码对象的唯一标识符。(1)顺序码是将具有顺序的数字或字母赋予编码对象。 是一种最简单和常用的无含义代码。代码简短、使用方便、易于增补 国家标准人的性别代码(GBT22611980)中,男性的代码是1,女性的代码是2 ;代码本身不包含编码对象任何其他信息,不便于标识 。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)272.3.3.2 按符号的含义分类(2/8)v(2)无序码v将无序的数字或字母赋予编码对象的代码。 v代码无任何编写规律,通常靠机器产生的随机数赋予。v此种代码仅表示编码对象是某约定的分类体系中的一个类目。 v手机网上“自助服务”的有关密码:一号通吗、二次校验码。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)282.3.3.2 按符号的含义分类(3/8) 2、有含义代码:是指代码不仅作为编码对象的唯一标识,代替编码对象,而且提供编码对象的分类、排序与逻辑意义等信息的代码。(1)系列顺序码这是一种特殊的顺序码。它是将顺序代码分成若干段(系列),并与编码对象的分类一 一对应,给每段的编码对象赋予一定的顺序。 是能表示一定的信息属性或特征,易于添加;是空码较多,不便于机器处理,不适应于复杂的分类体系。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)292.3.3.2 按符号的含义分类(4/8)v(2)数字化字母顺序码v数字化字母顺序码是将编码对象按其名称的首字母顺序排列,然后按此顺序赋以递增的数字代码 。v优点:容易归类,便于检索,适合于根据人名、机关名、事业、企业单位名称以及地名来检索信息。v缺点:新增代码调整困难,使用时间较短。 ()v01 Apples(苹果)v02 Bananas(香蕉)v03 Chenies(樱桃)v04 Dates(枣) 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)302.3.3.2 按符号的含义分类(5/8)v(3)层次码v层次码常用于线分类法,它是按编码对象的从属层次关系为排列顺序的一种代码。v编码时,将代码分成若干层级,并与分类对象的分类层级相对应。代码自左至右,表示的层级由高至低,每个层级的代码可采用顺序码或系列顺序码。 能明确表明编码对象的类别,有严格的隶属关系。代码结构简单,容量大,便于计算机汇总。当层次较多时,所用代码位数较多,弹性较差。 ()v采用三层四位数字的层级码 X X X X第一层代码(大类)第一层代码(小类)第二层代码(中类)2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)312.3.3.2 按符号的含义分类(6/8)v(4)特征组合码v特征组合码常用于面分类体系。它是将编码对象按其属性或特征分成若干个面。每个面内的诸项属性或特征按其规律分别进行编码,面与面之间的代码没有层次关系与从属关系。v使用时,按预先确定顺序,根据需要可将不同的面中代码组合起来以表示所代表的类目。 (雷同于雷同于面分类法面分类法)类目组合比较灵活,适于机器处理。 利用率低,不便于求和汇总。 机制螺钉分类v由上表可知:代码2342表示黄铜1.5方形镀铬螺钉。 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)322.3.3.2 按符号的含义分类(7/8)v(5) 矩阵码定义坐标的代码v矩阵码是一种建立在多维空间坐标位置基础上的代码,代码的值是通过赋予多维空间坐标的代码组合而成,或是通过赋予多维空间位置的序号而构成。v例如:两维矩阵吗,是通过赋予x、y坐标的数值(序号)确定代码的值。 逻辑关系明确,也容易解释其含义。编制代码时较困难,需要考虑建立一定的逻辑关系。 顺序日期表示法月份; 日期v矩阵的序号排列(逻辑关系):依次赋予001(1月1日)至365(12月31日)(若为闰年则为366)2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)332.3.3.2 按符号的含义分类(8/8)v(6)复合码是由两个或两个以上完整、独立的代码组合而成。 使用灵活、应用面较广的代码类型,可以表示具有复杂分类和标识体系的事物。代码总长度较长。 采用采用1313位数字的复合码位数字的复合码 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)342.3.4.1 信息编码错误种类 1、在录入代码时的可能错误:识别错误:1/7,0/O,Z/2,D/O,S/5,易位错误:12345/13245,双易位错误:12345/13254,随机错误:上述两种或两种以上的错误出现 2、避免代码录入出现错误的办法v在设计好的代码后,再增加一位(最低位),作为代码的组成部分。增加的一位,即为校验位。使用中,没有特别意义。v使用时,应录入包括校验位在内的完整代码,代码进入系统后,系统将取该代码校验位前的各位,按照确定代码校验位的算法进行计算,并与录入代码的最后一位(校验位)进行比较,如果相等,则录入代码正确,否则录入代码错误,进行重新录入。2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)35 2.3.4.2 信息编码错误的校验方法(1/2)v三种方法:算术级数法、几何级数法、质数法 1、算术级数法2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)362.3.4.2 信息编码错误的校验方法(2/2) 2、几何级数法 3、质数法 2022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)372.3.4.3 信息编码错误的校验步骤设有一组代码为: C1C2C3C4Ci第一步:为设计好的代码的每一位Ci确定一个权数Pi(权数可为等差数列 、等比数列、或)。第二步:求代码每一位Ci与其对应的权数Pi的成绩之和S S=C1*P1+C2*P2+Ci*Pi (i=1,2,n) n = Ci*Pi (i=1,2,n) i=1第三步:确定模M第四步:取余R = MOD(M)第五步:校验位Ci+1 = R最终代码为: C1C2C3C4CiCi+1使用时: C1C2C3C4CiCi+12022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)382.3.4.4 校验案例 v原设计的一组代码为五位,如32456,确定权数为7,6,5,4,3(算数级数)v求代码每一位Ci与其对应的权数Pi的成绩之和Sv S=C1*P1+C2*P2+Ci*Pi (i=1,2,n)=3*7+2*6+4*5+5*4+6*3v =21+12+20+20+18=91v确定模M,M=11v取余R,R = SMOD(M) = 91MOD(11) = 3v校验位Ci+1 = R = 3v最终代码为: C1 C2 C3 C4CiCi+1 ,即324563v使用时为:324563v该组代码中的其他代码按此算法,分别求得校验位,构成新的代码。v其它案例:教材教材P46P462022-5-12第02章 信息的分类与编码(陈庄)ppt课件(全)392.4 作业vP46:1,2,3,4,5

    注意事项

    本文(第02章 信息的分类与编码(陈庄)课件.ppt)为本站会员(春哥&#****71;)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开