数据模型数据模型的三要素数据模型的分类和各自的特点.ppt
《数据模型数据模型的三要素数据模型的分类和各自的特点.ppt》由会员分享,可在线阅读,更多相关《数据模型数据模型的三要素数据模型的分类和各自的特点.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据模型数据模型的三要素数据模型的分类和各自的特点 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望数据库系统概论数据库系统概论An Introduction to Database System第四章第四章 关系系统及其查询优化关系系统及其查询优化AnIntroductiontoDatabaseSystem第四章第四章 关系系统及其查询优化关系系统及其查询优化4.1关系系统4.2关系系统的查询优化4.3小结AnIntroductiontoDatabaseSyste
2、m4.1 关系系统关系系统关系模型n关系数据结构n域及域上定义的关系n关系操作n并、交、差、广义笛卡尔积、选择、投影、连接、除等n关系完整性n实体完整性、参照完整性、用户自己定义的完整性AnIntroductiontoDatabaseSystem关系系统关系系统n能够在一定程度上支持关系模型的数据库管理系统是关系系统。n由于关系模型中并非每一部分都是同等重要的n并不苛求一个实际的关系系统必须完全支持关系模型。AnIntroductiontoDatabaseSystem4.1.1 关系系统的定义关系系统的定义 一个数据库管理系统可定义为关系系统,当且仅当它至少支持:1.关系数据库(即关系数据结构
3、)系统中只有表这种结构2.支持选择、投影和(自然)连接运算对这些运算不要求用户定义任何物理存取路径对关系系统的最低要求AnIntroductiontoDatabaseSystem关系系统的定义关系系统的定义 不支持关系数据结构的系统显然不能称为关系系统仅支持关系数据结构,但没有选择、投影和连接运算功能的系统仍不能算作关系系统。n原因:不能提高用户的生产率n支持选择、投影和连接运算,但要求定义物理存取路径,这种系统也不能算作真正的关系系统n原因:就降低或丧失了数据的物理独立性n选择、投影、连接运算是最有用的运算AnIntroductiontoDatabaseSystem4.1.2 关系系统的分类
4、关系系统的分类 n分类依据:支持关系模型的程度n分类表式系统:支持关系数据结构(即表)(最小)关系系统支持:关系数据结构选择、投影、连接关系操作关系完备的系统支持:关系数据结构所有的关系代数操作全关系系统支持:关系模型的所有特征特别是:数据结构中域的概念AnIntroductiontoDatabaseSystem关系系统的分类关系系统的分类(续)(续)数据结构数据结构数据操作数据操作完整性完整性表式系统表式系统表表 (最小最小)关系系统关系系统表表选选择择、投投影影、连接连接 关系完备的系统关系完备的系统表表 全关系系统全关系系统 AnIntroductiontoDatabaseSystem第
5、四章第四章 关系系统及其查询优化关系系统及其查询优化4.1关系系统4.2关系系统的查询优化4.3小结AnIntroductiontoDatabaseSystem4.2 关系系统的查询优化关系系统的查询优化 4.2.1查询优化的必要性4.2.2查询优化概述4.2.3查询优化的一般准则4.2.4关系代数等价变换规则4.2.5关系代数表达式的优化算法4.2.6优化的一般步骤AnIntroductiontoDatabaseSystem4.2.2 查询优化的必要性查询优化的必要性 例:求选修了课程2的学生姓名SELECTStudent.SnameFROMStudent,SCWHEREStudent.Sn
6、o=SC.SnoANDSC.Cno=2;AnIntroductiontoDatabaseSystem查询优化的必要性(续)查询优化的必要性(续)假设1:外存:Student:1000条,SC:10000条,选修2号课程:50条假设2:一个内存块装元组:10个Student,或100个SC,或10个连接结果元组内存中一次可以存放:5块Student元组,1块SC元组和若干块连接结果元组假设3:读写速度:20块/秒假设4:连接方法:基于数据块的嵌套循环法AnIntroductiontoDatabaseSystem代价模型代价模型n集中式数据库n单用户系统总代价=I/O代价+CPU代价n多用户系统总
7、代价=I/O代价+CPU代价+内存代价n分布式数据库总代价=I/O代价+CPU代价+内存代价+通信代价AnIntroductiontoDatabaseSystem执行策略执行策略11 name(Student.Sno=SC.Sno SC.Cno=2(StudentSC)2.2 name(SC.Cno=2(Student SC)3.2 Sname(Student SC.Cno=2(SC)4.假设假设SC表在表在Cno上有索引,上有索引,Student表在表在Sno上有索引上有索引AnIntroductiontoDatabaseSystem执行策略执行策略11name(Student.Sno=SC
8、.SnoSC.Cno=2(StudentSC)StudentSC读取总块数=读Student表块数+读SC表遍数*每遍块数=1000/10+(1000/(105)(10000/100)=100+20100=2100读数据时间=2100/20=105秒AnIntroductiontoDatabaseSystem不同的执行策略不同的执行策略,考虑考虑I/O时间时间中间结果大小=1000*10000=107(1千万条元组)写中间结果时间=10000000/10/20=50000秒读数据时间=50000秒总时间=1055000050000秒=100105秒=27.8小时AnIntroductionto
9、DatabaseSystem查询优化的必要性(续)查询优化的必要性(续)2.2name(SC.Cno=2(StudentSC)读取总块数=2100块读数据时间=2100/20=105秒中间结果大小=10000(减少1000倍)写中间结果时间=10000/10/20=50秒读数据时间=50秒总时间1055050秒205秒=3.4分AnIntroductiontoDatabaseSystem查询优化的必要性(续)查询优化的必要性(续)3.2Sname(StudentSC.Cno=2(SC)读SC表总块数=10000/100=100块读数据时间=100/20=5秒中间结果大小=50条不必写入外存读S
10、tudent表总块数=1000/10=100块读数据时间=100/20=5秒总时间55秒10秒AnIntroductiontoDatabaseSystem查询优化的必要性(续)查询优化的必要性(续)4.2name(StudentSC.Cno=2(SC)假设SC表在Cno上有索引,Student表在Sno上有索引 读SC表索引=读SC表总块数=50/1001块读数据时间中间结果大小=50条不必写入外存AnIntroductiontoDatabaseSystem查询优化的必要性(续)查询优化的必要性(续)读Student表索引=读Student表总块数=50/10=5块读数据时间总时间连接运算例:
11、Student.Sno=SC.Sno(StudentSC)StudentSCn提取公共子表达式AnIntroductiontoDatabaseSystem4.2.4 关系代数等价变换规则关系代数等价变换规则 n关系代数表达式等价n指用相同的关系代替两个表达式中相应的关系所得到的结果是相同的n上面的优化策略大部分都涉及到代数表达式的变换AnIntroductiontoDatabaseSystem常用的等价变换规则常用的等价变换规则设E1、E2等是关系代数表达式,F是条件表达式l.连接、笛卡尔积交换律E1E2E2E1E1E2E2E1E1FE2E2FE1AnIntroductiontoDatabas
12、eSystem关系代数等价变换规则(续)关系代数等价变换规则(续)2.连接、笛卡尔积的结合律(E1E2)E3E1(E2E3)(E1E2)E3E1(E2E3)(E1E2)E3E1(E2E3)FFFFAnIntroductiontoDatabaseSystem关系代数等价变换规则(续)关系代数等价变换规则(续)3.投影的串接定律A1,A2,An(B1,B2,Bm(E)A1,A2,An(E)假设:1)E是关系代数表达式2)Ai(i=1,2,n),Bj(j=l,2,m)是属性名3)A1,A2,An构成Bl,B2,Bm的子集AnIntroductiontoDatabaseSystem关系代数等价变换规则
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 三要素 分类 各自 特点
限制150内