数据资源管理技术.ppt
《数据资源管理技术.ppt》由会员分享,可在线阅读,更多相关《数据资源管理技术.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 数据资源管理技术数据资源管理技术科学管理依赖信息,信息是一个组织重要的资源。科学管理依赖信息,信息是一个组织重要的资源。数据库技术的使用是数据库技术的使用是 MIS 成熟的重要标志。成熟的重要标志。数据管理技术的发展数据管理技术的发展数据人工管理阶段:数据人工管理阶段:没有软件支持,只有程序文件的概念没有软件支持,只有程序文件的概念数据处理后程序和数据的内存空间一起被释放。数据和程序相互依赖;数据处理后程序和数据的内存空间一起被释放。数据和程序相互依赖;数据结构的变化、修改,导致整个程序的修改。数据结构的变化、修改,导致整个程序的修改。最大的问题是编程效率低,程序依赖数据,不灵活
2、,容易出错。最大的问题是编程效率低,程序依赖数据,不灵活,容易出错。文件管理阶段:文件管理阶段:有分离的程序文件和数据文件,文件系统管理数据。有分离的程序文件和数据文件,文件系统管理数据。程序使用数据文件名访问数据,不必关心其物理位置和细节。便于程序程序使用数据文件名访问数据,不必关心其物理位置和细节。便于程序访问数据,有索引文件,链接文件和散列文件等等。访问数据,有索引文件,链接文件和散列文件等等。数据不属于某个特定程序,允许重复使用,但数据文件的结构仍取决于数据不属于某个特定程序,允许重复使用,但数据文件的结构仍取决于特定的应用,程序与数据间的依赖关系并未根本改变。具有数据设备独特定的应用
3、,程序与数据间的依赖关系并未根本改变。具有数据设备独立性,但不能体现用户观点下的数据逻辑结构独立于数据在外存上物理立性,但不能体现用户观点下的数据逻辑结构独立于数据在外存上物理结构的要求,在数据物理结构修改时,仍需修改用户应用程序。结构的要求,在数据物理结构修改时,仍需修改用户应用程序。文件管理方式是数据资源管理的一大进步,它也是数据库的基础。文件管理方式是数据资源管理的一大进步,它也是数据库的基础。文件系统的缺陷:数据冗余(文件系统的缺陷:数据冗余(redundancy),),每个应用程序有对应的数每个应用程序有对应的数据文件,文件间缺乏联系,同样的数据可能重复出现。冗余浪费存储空据文件,文
4、件间缺乏联系,同样的数据可能重复出现。冗余浪费存储空间,且数据修改稍有不谨慎可能造成数据不一致性(间,且数据修改稍有不谨慎可能造成数据不一致性(inconsistency););其次,数据文件面向应用,当数据结构改变时,程序维护成为系统的主其次,数据文件面向应用,当数据结构改变时,程序维护成为系统的主要矛盾。要矛盾。1第六章第六章 数据资源管理技术数据资源管理技术数据管理技术的发展数据管理技术的发展数据库阶段:数据库阶段:数据存储在数据库中,数据资源使用数据库管理系统数据存储在数据库中,数据资源使用数据库管理系统的专门软件管理。的专门软件管理。数据库用数据结构描述了数据,数据间的联系。数据面向
5、整个应用系统,数据库用数据结构描述了数据,数据间的联系。数据面向整个应用系统,减少冗余,真正实现数据在不同应用中共享。减少冗余,真正实现数据在不同应用中共享。数据库管理系统(数据库管理系统(DBMS,Database Management System)的三级模式,的三级模式,有物理数据独立性,数据库只根据系统需求独立设计;逻辑数据独立性,有物理数据独立性,数据库只根据系统需求独立设计;逻辑数据独立性,特定用户以逻辑结构(视图)操作数据,大大提高了编程效率。特定用户以逻辑结构(视图)操作数据,大大提高了编程效率。DBMS 提供方便操作的用户接口,数据库的恢复,并发控制,数据完整提供方便操作的用
6、户接口,数据库的恢复,并发控制,数据完整性、安全性等控制功能,保证数据的安全,可靠性。性、安全性等控制功能,保证数据的安全,可靠性。数据库系统以记录为单位操作数据,也可操作数据项,增加系统灵活性。数据库系统以记录为单位操作数据,也可操作数据项,增加系统灵活性。从文件系统发展到数据库系统是信息处理领域中的一个重大变化,从文件系统发展到数据库系统是信息处理领域中的一个重大变化,以数据为中心。应用程序设计退居为外围地位。以数据为中心。应用程序设计退居为外围地位。程序A程序B程序CDBMS数据库文 件 管理系统文件B程序A程序B程序C文件A2文件A1文件C2第六章第六章 数据资源管理技术数据资源管理技
7、术访问远程数据资源访问远程数据资源 计算机网络中有多台计算机访问数据资源,系统由三部分组成:计算机网络中有多台计算机访问数据资源,系统由三部分组成:客户机(客户机(Client)用户操作的多台个人(用户操作的多台个人(PC)计算机;计算机;服务器(服务器(Server)数据集中存储的计算机。通常只有一台服务器,有些数据集中存储的计算机。通常只有一台服务器,有些系统配置有多台服务器;系统配置有多台服务器;通信网络通信网络连接客户机和服务器的通信线路。连接客户机和服务器的通信线路。传统的文件方式:传统的文件方式:客户机应用程序访问远程数据资源时,将文件服务客户机应用程序访问远程数据资源时,将文件服
8、务器上的数据文件装载到客户机上,应用程序在数据文件中找到它所需器上的数据文件装载到客户机上,应用程序在数据文件中找到它所需的数据,处理后再将整个数据文件回送文件服务器。的数据,处理后再将整个数据文件回送文件服务器。整个远程数据资源访问过程都不可见,但占据了时间和网络总线的带宽。整个远程数据资源访问过程都不可见,但占据了时间和网络总线的带宽。要求有较大内存容量,较强的处理能力的客户机。要求有较大内存容量,较强的处理能力的客户机。客户机客户机/服务器(服务器(C/SC/S,Client/ServerClient/Server)方式:方式:客户机的应用程序请求客户机的应用程序请求服务器查找它所需的数
9、据,服务器将数据文件中匹配的数据返回。服务器查找它所需的数据,服务器将数据文件中匹配的数据返回。节省时间和网络的开销。节省时间和网络的开销。发挥了服务器较强的处理功能,客户机只集中处理用户界面。发挥了服务器较强的处理功能,客户机只集中处理用户界面。在两层在两层C/S结构中,客户机必须配置访问的各种数据库的驱动程序,成本结构中,客户机必须配置访问的各种数据库的驱动程序,成本高;用户还必须考虑配置和软件维护问题。三层高;用户还必须考虑配置和软件维护问题。三层C/S结构中,插入中间件结构中,插入中间件服务器,客户机仅需与中间件服务器驱动程序通信,中间件服务器完成与服务器,客户机仅需与中间件服务器驱动
10、程序通信,中间件服务器完成与服务器的不同数据库的驱动问题。服务器的不同数据库的驱动问题。3第六章第六章 数据资源管理技术数据资源管理技术访问远程数据资源访问远程数据资源分布式客户分布式客户/服务器结构用于更复杂的和更有弹性的系统,系统中有服务器结构用于更复杂的和更有弹性的系统,系统中有多个分布配置的服务器,执行不同的功能或某些特殊功能。多个分布配置的服务器,执行不同的功能或某些特殊功能。浏览器浏览器/服务器(服务器(B/SB/S,Browser/ServerBrowser/Server)方式:方式:随着网络技术和随着网络技术和Web技术的发展,使用数据源的数据量剧增,开发技术的发展,使用数据源
11、的数据量剧增,开发Web数据库系统十数据库系统十分有意义。分有意义。在在Internet和和Intranet上,如网上银行、在线购物、产品信息、市场调查上,如网上银行、在线购物、产品信息、市场调查分析、联机数据库查询等,到处可看到分析、联机数据库查询等,到处可看到Web数据库的应用。数据库的应用。Web数据库基于数据库基于C/S结构的三层模式,即结构的三层模式,即Browser/Web server/DB server,客户层是统一界面的浏览器,数据服务器为服务层,中间层是客户层是统一界面的浏览器,数据服务器为服务层,中间层是Web服服务器和应用服务。用户通过浏览器的务器和应用服务。用户通过浏
12、览器的Web页上输入信息,并发送到页上输入信息,并发送到Web服务器,通过应用程序访问数据库,将结果以图形、图像、文本或表的服务器,通过应用程序访问数据库,将结果以图形、图像、文本或表的形式返回浏览器。形式返回浏览器。一一种种特特别别感感兴兴趣趣的的网网络络计计算算机机:没没有有磁磁盘盘驱驱动动器器或或其其它它当当地地数数据据存存储储设设备备的的PC机机,使使网网络络管管理理简简化化,又又能能处处理理图图形形用用户户界界面面,需需要要的的是是能能在在任任何何计计算算机机上上运运行行的的图图形形用用户户界界面面,在在服服务务器器上上修修改改某某个个驱驱动动程程序序或或应应用用程程序序时时,可可以
13、以在在该该服服务务器器的的每每个个网网络络计计算算机机客客户户机机上上运行。运行。面面向向对对象象的的程程序序设设计计语语言言Java,使使应应用用程程序序独独立立于于异异构构网网络络上上的的多多种种平平台,提供在任何计算机上运行的图形用户界面设计。台,提供在任何计算机上运行的图形用户界面设计。4第六章第六章 数据资源管理技术数据资源管理技术数据描述数据描述现实世界:现实世界:现实世界是在人们头脑以外的客观世界(现实世界是在人们头脑以外的客观世界(real world),),对信息系统而言,组织的业务活动涉及的物流、人、事、单位以及对信息系统而言,组织的业务活动涉及的物流、人、事、单位以及相关
14、的数据,如库存管理,涉及货物的存放、进出、搜查等业务活相关的数据,如库存管理,涉及货物的存放、进出、搜查等业务活动。业务活动中抽取的数据为管理活动提供报表、汇总、统计分析动。业务活动中抽取的数据为管理活动提供报表、汇总、统计分析图等。图等。信息世界:信息世界:人的认知一是从特殊到一般的归纳,二是从一般到特殊人的认知一是从特殊到一般的归纳,二是从一般到特殊的演绎。将现实世界中客观存在相互区别的事物或事件抽象为实体的演绎。将现实世界中客观存在相互区别的事物或事件抽象为实体集。实体集具有组成实体的共同的性质(属性)集。实体集具有组成实体的共同的性质(属性)如学生实体集有姓名、如学生实体集有姓名、年龄
15、、性别等共同属性。年龄、性别等共同属性。实体集中的具体实例实体集中的具体实例称实体,有具体的属性称实体,有具体的属性值,如某个学生姓名叫值,如某个学生姓名叫李四,年龄李四,年龄22岁,性别岁,性别为男等,属性值的不同为男等,属性值的不同用来区别不同的实体。用来区别不同的实体。实体标识符是某个属实体标识符是某个属性(代码)或一组属性,性(代码)或一组属性,唯一标别每个实体。唯一标别每个实体。属性字段现实世界现实世界信息世界信息世界计算机世界计算机世界事物类事物类实体集实体集事物事物性质性质实体实体属性属性文件文件记录记录字段字段5第六章第六章 数据资源管理技术数据资源管理技术数据描述数据描述计算
16、机世界:计算机世界:是数据存储形式,在计算机中数据以文件方式存储,是数据存储形式,在计算机中数据以文件方式存储,并分下列层次:并分下列层次:字段(字段(field)或称数据项:字段可以命名的最小数据单位,字段名表示或称数据项:字段可以命名的最小数据单位,字段名表示实体的属性。字段值表示每个具体属性值或数据,一般分两大类型:数实体的属性。字段值表示每个具体属性值或数据,一般分两大类型:数值型和字符型。值型和字符型。记录(记录(record):):记录结构是字段有序集合,记录描述一个具体实体,记录结构是字段有序集合,记录描述一个具体实体,是字段值有序集合,实体属性的数据描述。是字段值有序集合,实体
17、属性的数据描述。例例 实体集:实体集:学生(学号,学生(学号,姓名,年龄,姓名,年龄,性别,性别,)实体:实体:99064111 李四李四 22 男男 文件(文件(file):):文件是同一实体集的所有记录的集合,所有的学生记录组文件是同一实体集的所有记录的集合,所有的学生记录组成一个学生文件。成一个学生文件。其中,主关键字(其中,主关键字(key)简称主键,是能唯一标识文件中每个记录的字段简称主键,是能唯一标识文件中每个记录的字段或字段集,与信息世界中实体标识符的概念相对应。或字段集,与信息世界中实体标识符的概念相对应。数据库是数据层次最高一层,它是综合的、相关的文件集合,它表示一数据库是数
18、据层次最高一层,它是综合的、相关的文件集合,它表示一个应用项目中相关的实体集的集合及实体集间的关联。个应用项目中相关的实体集的集合及实体集间的关联。我们可以不必关心数据的存储结构和具体实现方式,因为数据库系我们可以不必关心数据的存储结构和具体实现方式,因为数据库系统的目标之一,是用户能简单、方便地访问数据库中的数据。统的目标之一,是用户能简单、方便地访问数据库中的数据。6第六章第六章 数据资源管理技术数据资源管理技术数据库数据模型:逻辑模型和物理模型。数据库数据模型:逻辑模型和物理模型。逻辑模型逻辑模型不涉及数据的表示、物理实现,只描述从系统需求到信息世界的不涉及数据的表示、物理实现,只描述从
19、系统需求到信息世界的高层抽象的信息模型。高层抽象的信息模型。创建数据逻辑模型的工具是实体联系(创建数据逻辑模型的工具是实体联系(E-R)图。图。物理模型物理模型面向信息模型所采用的具体数据结构,第二层抽象。数据的物理面向信息模型所采用的具体数据结构,第二层抽象。数据的物理模型有严格形式化定义,便于计算机中实现数据的存储和访问。模型有严格形式化定义,便于计算机中实现数据的存储和访问。实体间的联系:实体间的联系:其联系方式不外乎三种:其联系方式不外乎三种:一对一(一对一(1:1)联系:)联系:在两个实体集中,一方的一个实体最多与另一方对应的一在两个实体集中,一方的一个实体最多与另一方对应的一个实体
20、相联系。例如,已婚男性集合和已婚女性集合间实体关系是一对一的联系。个实体相联系。例如,已婚男性集合和已婚女性集合间实体关系是一对一的联系。一对多(一对多(1:M)联系:联系:在两个实体集中,一方的一个实体与另一方对应的若干个在两个实体集中,一方的一个实体与另一方对应的若干个实体相联系;反之,另一方的一个实体最多对应一方的一个实体,称一对多联系。实体相联系;反之,另一方的一个实体最多对应一方的一个实体,称一对多联系。例如,一个组织部门和职工,在一个具体部门工作的职工有若干个,而一个职工只在一例如,一个组织部门和职工,在一个具体部门工作的职工有若干个,而一个职工只在一个部门工作,工作将部门和职工两
21、个实体联系在一起,是一对多的联系。个部门工作,工作将部门和职工两个实体联系在一起,是一对多的联系。多对多(多对多(M:N)联系:联系:若两个实体集中,任何一方的一个实体都对应另一方的若若两个实体集中,任何一方的一个实体都对应另一方的若干个实体,称多对多联系。干个实体,称多对多联系。例如,在教学管理中学生和课程,一个具体学生可选修若干门课程,反之,一门课程可例如,在教学管理中学生和课程,一个具体学生可选修若干门课程,反之,一门课程可以被若干个同学选修,选修将学生和课程两个实体联系在一起,是多对多的联系。以被若干个同学选修,选修将学生和课程两个实体联系在一起,是多对多的联系。实体有属性,联系也有属
22、性。实体有属性,联系也有属性。例如,学生和课程的选修多对多的联系有成绩属性。例如,学生和课程的选修多对多的联系有成绩属性。除多对多联系的属性外,一对一和一对多联系的属性,一般都可归併相应的实体属性中。除多对多联系的属性外,一对一和一对多联系的属性,一般都可归併相应的实体属性中。递归联系是一个实体与自身相联系,也有一对一,一对多和多对多的联系。例如一个组递归联系是一个实体与自身相联系,也有一对一,一对多和多对多的联系。例如一个组件可以由多个零件组装而成,而一个零件又可以在多个组件中组装使用,这就是多对多件可以由多个零件组装而成,而一个零件又可以在多个组件中组装使用,这就是多对多的递归联系,组装使
23、用数量则是联系的属性。的递归联系,组装使用数量则是联系的属性。对对1:1(m)递归联系,事实上是超类与子类的联系,如职工与干部、领导的联系。递归联系,事实上是超类与子类的联系,如职工与干部、领导的联系。7第六章第六章 数据资源管理技术数据资源管理技术数据库数据模型数据库数据模型实实体体联联系系E ER R图图(Entity Relationship Diagram):数数据据的的逻逻辑辑模模型型强强调调语语义义表表达达功功能能,概概念念简简单单、清清晰晰,易易于于理理解解,便便于于数数据据库库设设计计人人员员和和用用户户交交流流,启发、检验、返回补充系统需求。启发、检验、返回补充系统需求。E-
24、R图使用图形符号表示组织业务活动涉及的实体及实体间联系。图使用图形符号表示组织业务活动涉及的实体及实体间联系。矩矩形形框框表表示示实实体体,两两部部分分分分别别表表示示实实体体标标识识及及其其属属性性;菱菱形形表表示示实实体体间间的的联联系系,带有联系方式的直线相关的实体连接,关系有属性直接附于菱形框。带有联系方式的直线相关的实体连接,关系有属性直接附于菱形框。在实际系统中往往有多个相互关联的实体,作图也比较复杂。在实际系统中往往有多个相互关联的实体,作图也比较复杂。例例 仓仓库库主主要要管管理理零零件件入入库库、出出库库及及采采购购等等事事项项。工工程程项项目目需需要要仓仓库库提提供供零零件
25、件,仓库需要向零件供应商采购零件,仓库需要向零件供应商采购零件,建立建立E-R图过程:确定实体集;确定实体间关系;确定实体集名称和属性。图过程:确定实体集;确定实体间关系;确定实体集名称和属性。工工程程项项目目(项项目目编编号号J#,项项目目名名称称Jname,开工日期开工日期DATE)零零件件 (零零件件编编号号P#,零零件件名名称称Pname,规规格格Psize,重量重量Pweight)供供应应商商 (供供应应商商代代号号S#,姓姓名名Sname,地地址址SADR)8第六章第六章 数据资源管理技术数据资源管理技术数据库数据模型数据库数据模型数据的物理模型数据的物理模型数据库的数据结构。数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 资源管理 技术
限制150内