现代大学计算机基础第7章数据信息管理课件.ppt





《现代大学计算机基础第7章数据信息管理课件.ppt》由会员分享,可在线阅读,更多相关《现代大学计算机基础第7章数据信息管理课件.ppt(198页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7章 数据信息管理 第7章 数据信息管理 7.1 实现实现“数字化生活数字化生活”的关键技术的关键技术数据库系数据库系统统 7.2 在计算机中模拟现实在计算机中模拟现实数据模型数据模型 7.3 二维表的王国二维表的王国关系数据库基础关系数据库基础 7.4 遏制非法用户侵入遏制非法用户侵入数据库安全数据库安全 7.5 数据库技术之冰山一角数据库技术之冰山一角Access数据库数据库 第7章 数据信息管理 7.1 实现实现“数字化生活数字化生活”的关键技术的关键技术数据库系数据库系统统7.1.1 数据为什么要管理数据为什么要管理收集数据的目的是为了高效的利用数据,通过对收集的海量数据进行分析统计
2、得到有价值的信息。如果收集了大量的数据却无法方便地使用这些数据,那么收集数据也就变得毫无意义了。数据管理就是利用计算机技术对数据进行有效的收集、存储、处理和应用的过程,目的是充分有效的发挥数据的作用。数据管理经历了人工管理、文件系统管理和数据库管理三个发展阶段。第7章 数据信息管理 1人工管理人工管理20世纪50年代中期之前,计算机主要用于科学计算。当时的计算机软、硬件都不完善,没有操作系统,没有数据管理的软件,程序员在设计程序时不仅要规定数据的逻辑结构,还要设计其物理结构;没有大容量的存储设备,当时的外存只有卡片、纸带、磁带。这一阶段数据管理的主要特点是:(1)数据不保存。当时计算机的主要用
3、途是科学计算,只是在计算某一课题时才将数据输入,计算完就撤走。一般不需要将数据长期保存。第7章 数据信息管理(2)应用程序管理数据,数据不共享、冗余大。没有相应的软件负责数据的管理工作,数据需要由应用程序自己设计、说明和管理。数据的组织是面向应用程序的,一组数据只能对应一个应用程序。不同的应用程序之间不能共享数据,程序与程序之间存在大量的数据冗余。应用程序和数据的关系见图7.1。图7.1 应用程序和数据的关系(1)第7章 数据信息管理 第7章 数据信息管理(1)数据可以长期保存。由于出现了磁盘这样的外部存储设备,可将数据长期保存,可反复用于查询、修改、插入和删除操作。(2)文件系统管理数据,有
4、一定的数据共享性。数据以文件为单位存储在外存中,由文件系统进行统一管理,操作系统为用户提供了良好的操作界面。用户的程序与数据可分别存储在外存中,应用程序之间可以共享一组数据,实现了以文件为单位的数据共享。应用程序和数据的关系见图7.2。第7章 数据信息管理 图7.2 应用程序和数据的关系(2)第7章 数据信息管理(3)具有一定的数据独立性。文件的逻辑结构与物理结构分开,程序和数据分离,使数据和程序有了一定的独立性。(4)实时处理。由于有了直接存取设备,也有了索引文件、链接存取文件、直接存取文件等机制,所以既可以采用顺序批处理方式,也可以采用实时处理方式。在文件系统阶段,一个文件基本上对应于一个
5、应用程序,即文件仍然是面向应用的。由于文件之间是相互独立的,因而不能反映现实世界中事物之间的联系,当不同的应用程序具有部分相同但又不完全相同的数据时,也必须建立各自的数据文件,而不能共享相同部分的数据,因此数据冗余度大。同时由于相同的数据重复存储,各自管理,容易造成数据的不一致性,给数据的维护和修改带来了困难。第7章 数据信息管理 第7章 数据信息管理 文件系统中每个文件内部也是有结构的,文件由若干条记录构成,每条记录又由若干个属性构成。如“学生”文件由很多条记录构成,每条记录就是一个学生信息,见图7.3。“课程”文件中保存着课程信息,每条记录就是一条课程信息,“选课”文件中保存着学生选课信息
6、,每条记录就是一条选课信息,见图7.4和图7.5。图7.4 “课程”信息 图7.5 “选课”信息图7.3 “学生”信息第7章 数据信息管理 文件系统阶段尽管记录内部已经有了结构,但是记录之间没有联系。有可能在“选课”文件中出现这样的记录:某个学生选了某一门课程,有一个对应的考试成绩,但是这个学生的学号或者所选课程的课号并不存在。也就是说该学生的学号信息并没有保存在“学生”文件中,或者该生所选课程的课号没有保存在“课程”文件中,所以不能保证数据的正确性。如果要实现这样的约束,必须由程序员在应用程序中编写相应代码来实现。而数据库系统可以通过定义约束条件来实现这种约束,如关系数据库就可以通过定义关系
7、的参照完整性规则来保证数据之间的这种联系。数据库系统阶段数据的结构见图7.6。第7章 数据信息管理 第7章 数据信息管理 数据结构化是数据库系统的主要特征之一,也是数据库系统与文件系统的本质区别。(2)具有较高的数据独立性。数据库中的数据在磁盘上如何存储,是由DBMS进行管理的,应用程序不需要关心,应用程序要处理的是程序的逻辑结构,所以当数据的物理存储设备发生改变时,应用程序不用修改。另外,数据与程序独立,把数据的定义从程序中剥离,加上存取数据的方法又由DBMS负责提供,简化了应用程序的编写,减少了应用程序的维护和修改,当数据的逻辑结构改变了,应用程序也可以不用修改。数据库阶段应用程序和数据的
8、关系见图7.7。第7章 数据信息管理 第7章 数据信息管理(3)数据共享性高,冗余小。数据库系统从整体角度看待和描述数据,数据面向整个系统,而不是面向某个应用程序,因此数据可以被多个应用程序和多个用户共享,减少了数据冗余。(4)数据由DBMS统一控制管理。DBMS在数据库建立、运行和维护时对数据库进行统一控制和管理,以保证数据的完整性、安全性、共享性,并在多用户同时使用数据库时进行并发控制,并在数据库发生故障时进行恢复。充分有效的管理和利用各类信息资源,是进行科学研究和管理决策的前提条件。数据库系统是为适应数据管理的需求而发展起来的一种较为理想的数据处理系统,它既便于数据的集中管理,又有利于应
9、用程序的开发和维护,提高了数据的利用率,为科学研究和企业决策提供了技术保证。第7章 数据信息管理 7.1.2 什么是数据库什么是数据库1数据库数据库什么是数据库?当人们从不同的角度来描述这一概念时就会有不同的定义。数据库,就是存放数据的仓库。就像粮库是存放粮食的,军火库是存放军火的,水库是存水的等。这种说法虽然形象,但并不严谨。也有人把数据库定义为“以一定的方式存储在一起的、能为多个用户、多个应用程序所共享的、具有较小冗余度的数据的集合”。这种定义侧重于数据的组织。第7章 数据信息管理 第7章 数据信息管理 通常意义下,“数据库”这个术语是指由数据库管理系统(DBMS)管理的数据聚集,数据库的
10、基本特征是“长期储存、有组织、可共享”。人们收集并抽取出一个应用所需要的大量数据以后,将其保存起来,便于进一步加工处理,从中获取有用的信息。第7章 数据信息管理 2数据数据数据(Data)是指数据库中存储的基本对象,是对客观事物的逻辑归纳,用于表示客观事物的未经加工的原始素材。数据是信息的表现形式和载体,并不仅仅指数字,它可以是数值、字符、图像、语音、视频等。数据经过加工后就成为信息。记录是关系数据库中用来表示和存储数据的一种格式。如图7.8所示的学生记录就是描述该学生的数据。图7.8 学生记录第7章 数据信息管理 在信息量不是很大的情况下,可以将数据保存在文件中,比如上面提到的学生记录,可以
11、保存在一个电子表格文件中。但是对于数据量很大,且要频繁查询、增加、修改、删除数据的时候,用文件来存储和管理数据就比较困难了,所以在信息量剧增的今天,人们需要借助计算机和数据库技术来保存和管理大量复杂的数据,以便能方便且充分的利用这些宝贵的信息资源。第7章 数据信息管理 3数据库管理系统数据库管理系统了解了什么是数据库和数据之后,读者可能就会思考数据库中的数据是如何科学的组织和存储的,又如何才能高效的从数据库中获取所需的信息呢?如何对数据库中的大量数据进行管理和维护?这些都是由数据库管理系统来实现的。数据库管理系统(DBMS)是位于用户和操作系统之间的一种大型软件,用于建立、使用和维护数据库。它
12、对数据库进行统一的操纵和管理,以保证数据库的安全性、完整性、一致性,是数据库系统的核心。它主要具有以下几方面功能:(1)数据模式定义。数据库管理系统负责为数据库构建模式,也就是为数据库构建其数据框架。第7章 数据信息管理(2)数据存取的物理构建。数据库管理系统负责为数据模式的物理存取及构建提供有效的存取方法及手段。(3)数据操纵。数据库管理系统为用户使用数据库中的数据提供方法,它一般提供查询、插入、修改及删除数据的功能。此外,它自身还具有简单算术运算及统计的能力,而且还可以与某些过程性语言结合,使其具有强大的过程性操作能力。(4)数据的完整性、安全性定义与检查。数据的完整性是保证数据库中数据正
13、确的必要条件,因此必须经常检查以维护数据的正确性;数据库中的数据具有共享性,而数据共享可能会引发数据的非法使用,必须要对数据正确使用做出必要的规定,并在使用时作检查,以保证数据的安全性。第7章 数据信息管理 第7章 数据信息管理 为了实现上述功能,数据库管理系统一般提供相应的数据语言。数据定义语言(DDL,Data Define Language)和数据操纵语言(DML,Data Manipulation Language)供用户定义数据库模式结构与权限约束,实现对数据的查询、修改等操作,通过数据控制语言(DCL,Date Control Language)对数据库运行进行控制,包括并发控制、
14、安全性检查、完整性约束条件的检查和执行,数据库的内部维护(例如索引的自动维护)等。常用的数据库管理系统有SQL Server、Oracle、DB2、Sybase、Access、MySQL等。第7章 数据信息管理 7.1.3 数据库系统的构成数据库系统的构成数据库系统是指有数据库技术支持的计算机系统,它可以实现有组织、动态地存储大量相关数据,提供数据处理和信息资源共享服务的功能。数据库系统主要由四部分构成:数据库、软件系统、硬件系统和用户,见图7.9。图7.9 数据库系统第7章 数据信息管理 1数据库数据库在一个数据库系统中,可以根据需要创建多个数据库,并且数据库中的数据通常可以被多个用户共享。
15、2软件系统软件系统软件系统包括操作系统、数据库管理系统及其应用开发工具、数据库应用系统。其中数据库管理系统是数据库系统的核心。3硬件系统硬件系统硬件系统指运行数据库系统所需要的硬件设备。一个数据库系统需要有足够快的CPU来处理数据,以便快速响应用户的数据处理和数据检索请求,同时还需要有足够大的内存和外存来运行和存储大量的数据。对于分布式数据库系统还需要有网络通信设备的支持。第7章 数据信息管理 第7章 数据信息管理(2)应用程序员:负责为终端用户设计和编写应用程序,方便终端用户对数据库进行操作。(3)终端用户:最终使用数据库的人员。如使用超市管理系统工作的超市收银员,使用图书管理系统借书的学生
16、,使用火车售票系统卖票的铁路售票员等。终端用户一般为非计算机专业人员,他们通过窗口、菜单、对话框等方式使用数据库,不需要懂编程和数据库技术。第7章 数据信息管理 7.1.4 数据库新技术数据库新技术随着计算机系统硬件、Internet和Web技术的发展,数据库技术不断应用到新的领域。数据库出现了许多新的分支:有面向决策支持的数据仓库、面向科学计算的科学数据库、面向工程设计的工程数据库、面向地理信息系统的空间数据库、面向移动计算环境的移动数据库,以及Web数据库、实时数据库、统计数据库等。第7章 数据信息管理 第7章 数据信息管理 7.2 在计算机中模拟现实在计算机中模拟现实数据模型数据模型7.
17、2.1 数据模型概述数据模型概述几个世界几个世界通俗地讲,数据模型就是对现实世界的模拟。在数据库中使用数据模型来抽象表示和处理现实世界,使之可以存放于数据库中。数据模型应满足三方面要求:(1)能比较真实地模拟现实世界。(2)容易为人所理解。(3)便于在计算机上实现。图7.10 几个“世界”间的关系一种数据模型要很好地满足这三个方面的要求,目前尚很困难。在数据库系统中应针对不同的使用对象和应用目的,采用不同的数据模型。第7章 数据信息管理 图7.10 几个“世界”间的关系第7章 数据信息管理 现实世界中的河流山川、花草树木、人和动物,都是计算机不可能直接处理的,所以必须先对现实世界中的具体事物进
18、行分析、归纳、抽象形成信息,再对这些信息进行记录、整理、归类后就构成了信息世界。将信息世界中的信息用二维表或其它形式表示出来就形成了数据世界,最后再将这些数据转换成计算机能够处理的二进制形式,就是数字世界。几个“世界”间的关系如图7.10所示。数据模型按不同的应用层次分成三种类型:概念数据模型、逻辑数据模型、物理数据模型。第7章 数据信息管理 7.2.2 概念模型概念模型信息世界信息世界概念数据模型简称概念模型,又称为信息模型。概念模型是对现实世界的第一次抽象,是按照用户的观点对现实世界进行建模,描述用户的需求,是数据库设计人员和用户之间交流的语言。概念模型既要具有较强的语义表达能力,能够方便
19、、直观地表达应用中的各种语义知识,还应该简单、清晰,易于用户理解。概念模型主要用于数据库设计,它与具体的计算机系统和DBMS无关,重点在于分析数据及数据间的联系等。第7章 数据信息管理 概念模型的表示方法有很多种,最著名也最常用的是实体联系模型。实体联系(Entity Relationship)模型也称为E-R模型,它是由Peter-Chen(美籍华裔计算机科学家陈品山)于1976年在题为“实体联系模型:将来的数据视图”论文中提出的。E-R模型中有以下几个基本概念:(1)实体:是指客观存在并可相互区别的事物。实体可以是具体的对象,如一所学校、一名学生、一门课程等;也可以是抽象的概念,如一次选课
20、、一个操作流程等。(2)属性:实体和联系所具有的特征。现实世界中的实体可由若干属性来描述,如学生有学号、姓名、性别、年龄等属性,选课有选课编号、成绩等属性。第7章 数据信息管理(3)实体集:所有属性完全相同的实体的集合。例如,全体学生、全体教师等。每个实体集都有一个名称,即实体名,在不引起混淆的情况下,实体集往往简称为实体。(4)实体型:用实体名和属性集表示。例如,学生(学号、姓名、性别、年龄、院/系、家庭住址、入学年份)就是一个实体型。(5)联系:表示相关联的实体集之间的关系。如学生和课程之间的关系为选课,教师和课程之间的关系为讲授,校长和学校的关系为任职等。E-R模型中,实体集之间的联系可
21、归为三种:第7章 数据信息管理 一对一(11)联系。如果实体集A中的每一个实体,在实体集B中至多只有一个实体与之联系;反之,对于实体集B,在实体集A中也至多只有一个实体与之联系,那么称实体集A与实体集B是11联系。如学校和校长、班级和班长之间的联系。一对多(1M)联系。如果实体集A中的每一个实体,在实体集B中有M个实体(M0)与之联系;反之,对于实体集B中的每一个实体,在实体集A中至多有一个实体与之联系,那么称实体集A与实体集B是1M联系。如学校和教师、班级和学生、部门和员工之间的联系。第7章 数据信息管理 多对多(MN)联系。如果实体集A中的每一个实体,在实体集B中有M个实体(M0)与之联系
22、;反之,对于实体集B中的每一个实体,在实体集A中也有N个实体(N0)与之联系,则称实体集A与实体集B是MN联系。如学生和课程、老师和学生之间的联系。实体联系模型用E-R图来描述,实体集用矩形表示,联系用菱形表示,属性用椭圆表示。例如有一个简单的教务系统,能实现对学生、教师、学生选课和老师授课进行管理,那么在该教务系统涉及的实体有:第7章 数据信息管理 学生(学号,姓名,性别,年龄,院/系,家庭住址,入学年份)课程(课号,课程名称,课程性质,学分,课时)选课(学号,课号,成绩)授课(授课ID,课号,教师编号)教师(教师编号,姓名,性别,出生日期,职称,院/系)用E-R图可描述为图7.11。实体联
23、系模型是抽象和描述现实世界的有效工具,它独立于计算机系统,独立于数据库管理系统,是各种数据模型的基础。第7章 数据信息管理 图7.11 简单教务系统的E-R图第7章 数据信息管理 7.2.3 逻辑模型逻辑模型数据世界数据世界逻辑模型又称为数据结构模型,简称数据模型。它负责将概念模型具体化,要实现概念模型所描述的信息。目前,数据库领域中常用的数据模型有层次模型、网状模型和关系模型,其中层次模型和网状模型又称为非关系模型。关系模型是目前使用最广泛的数据模型。由于面向对象的方法和技术在计算机各个领域都产生了深远的影响,也促进了数据库技术中面向对象数据模型的研究和发展,许多关系数据库厂商为了支持面向对
24、象技术,对关系模型作扩展,从而产生了对象关系模型。本节简要介绍一下常用的三种数据模型。第7章 数据信息管理 1层次模型层次模型层次模型是数据库系统中最早出现的数据模型。层次模型用树型结构来表示实体与实体间的联系,它只能直接表示出一对多(包括一对一)的联系,对于多对多的联系必须先分解成一对多联系。所以层次模型比较适合于表示自然的层次关系,如家族关系、行政机构等,描述直观、自然,容易理解,这是层次数据库的突出优点。层次模型的典型代表是IBM公司于1968年推出的第一个大型商用的数据库管理系统IMS(Information Management System)。第7章 数据信息管理 2网状模型网状模
25、型现实世界中很多实体之间的联系是非层次结构的,用树型结构描述就很不直接,网状模型可以克服这一弊端。网状模型用网状结构表示实体之间的联系,最具有代表性的网状数据库管理系统是1971年4月数据系统语言协会(CODASYL,Conference On Data System Language)下属的数据库任务组(DBTG,Database Task Group)提出的一个系统方案,习惯称为CODASYL系统或DBTG系统。虽然DBTG不是实际的系统软件,但是它对网状数据库系统的研制和发展起了重大影响。网状模型能够直观地表示现实世界,但是结构复杂,用户不容易掌握和使用。第7章 数据信息管理 3关系模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 大学计算机 基础 数据 信息管理 课件

限制150内