《华南理工大学本科毕业设计开题报告.docx》由会员分享,可在线阅读,更多相关《华南理工大学本科毕业设计开题报告.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、华南理工大学本科毕业设计开题报告华南理工大学本科毕业设计开题报告一、选题的背景及意义近四十年来,传统确实定性数据(deterministicdata)管理技术得到了极大的发展,造就了一个数百亿的数据库产业。数据库技术和系统已经成为信息化社会基础设施建设的重要支撑。在传统数据库的应用中,数据的存在性和准确性均确定无疑。近年来,随着技术的进步和人们对数据收集和处理技术理解的不断深化,不确定性数据(uncertaindata)得到了广泛的重视。在很多现实的应用中,例如经济、军事、物流、金融、电信等领域,数据的不确定性普遍存在,不确定性数据扮演着关键角色。传统的数据管理技术却无法有效管理不确定性数据,
2、这就引发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣。由于不确定性数据的产生原因比拟复杂可能是原始数据本身不准确或是采用了粗粒度的数据集合,可以能是为了知足特殊应用目的或是在处理缺失值、数据集成经过中而产生的,因而,不确定性数据的种类较多,例如关系型数据、半构造化数据、流数据、移动对象数据等,相应地也出现了很多与数据类型严密相关的数据模型。定义与应用场景相匹配的数据模型是不确定性数据管理的首要任务.在不确定性数据管理领域,最常用的模型是可能世界模型(possibleworldmodel)。该模型从一个不确定性数据库演化出很多确定的数据库实例(称为可能世界实例),而且所有实例的概率之和
3、为1.不确定性数据的种类较多,例如关系型数据、半构造化数据、流数据、移动对象数据等,尽管存在很多与数据类型严密相关的数据模型,但是这些模型最终都能够转化为可能世界模型.其中,基于xml的不确定性数据建模的研究对象主要是半构造化数据模型。半构造化数据模型(semistructureddatamodel)能有效描绘缺乏严格形式构造的数据。半构造化数据通常能够用文档树来描绘。Dekhtyar等人提出了一种管理概率半构造化数据(probabilisticsemistructureddata)的方法,该方法以关系数据库技术为基础,支持丰富的代数查询。更多的工作则是直接以文档树形式描绘不确定性半构造化数据
4、,例如p2文档模型(p2documentmodel)、概率树模型,以及PXML模型、Keulen等人的概率树模型、PrXML模型等。二、工作任务分析我在小组中的研究部分是不确定性数据的模型。项目开启后,我的工作与任务可分解分下面几个部分1、学习与整理前辈们在不确定性数据方面的研究成果。这项目工作任务主要分三个阶段进行。第一阶段是广泛地采集与了解不确定性数据的相关知识,了解不确定性数据的轮廓,知道相关的术语、概念,方便以后与别人作相关的沟通。第二阶段是有针对性学习与理整理现有的不确定性数据模型方面的理论知识。这一阶段,要知道各种模型的概念、所针对不同种类的数据、以及它们优势与缺乏之处。第三阶段是
5、把精神放在不确定性数据研究的某种数据的模型上。此阶段要做到对相关的模型在较深化的理解,不单要知道他们的定义、优劣、详细应用情况,还要理解它们在数学上表述、证实。2、对现有的不确定性数据模型提出本人的见解。主要包括下面一系列的活动:1仔细研究如今模型的优点与缺乏之处;2与其它组员还有指导教师以及相关的研究人员沟通看法,尤其是向其它组员了解在不确定性数据的存储与查询方面算法知识,为优化工作提供根据与灵感。3整理所采集到的不确定性数据模型的资料。三、调研报告1不确定性数据与xml的发展史实际上,针对不确定性数据的研究工作已经有几十年历史了。从二十世纪八十年代末开场,针对概率数据库probabilis
6、ticdatabase的研究工作就从未间断,这类研究工作将不确定性引入到关系数据模型中去,获得较大研究进展。近年来,针对不确定性数据的研究工作则在更广的范围之内获得更大的进展,即:在更丰富的数据类型上处理更多种类的查询任务。不确定性数据管理技术的典型框架包含四大部分:模型定义、预处理与集成、存储与索引、查询分析处理。可扩展标记语言XMLeXtensibleMarkupLanguage1是一种简单灵敏的文本格式的可扩展标记语言,起源于SGML(StandardGeneralizedMarkupLanguage),是SGML的一个子集合,也就是SGML的一个简化版本,非常合适于在Web上或者其它多
7、种数据源间进行数据的交换。随着Web上数据的增加,HTML的缺点越来越突出。W3C的成员认识到,必须有一种方法能够把数据本身和数据的显示分离开来,这样W3C在1996年提出了XML的概念。XML不仅保留了SGML的很多优点,而且愈加容易操作以及在WorldWideWeb环境下实现。1998年,XML成了W3C的推荐标准。2不确定性数据的发展方向在传统数据库的应用中,数据的存在性和准确性均确凿无疑。近年来,随着技术的进步和人们对数据收集和处理技术理解的不断深化,不确定性数据uncertaindata得到广泛的重视。在很多现实的应用中,例如:经济、军事、物流、金融、电信等领域,数据的不确定性普遍存
8、在,不确定性数据扮演关键角色。传统的数据管理技术却无法有效管理不确定性数据,这就引发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣。针对不确定性数据的研究工作则在更广的范围之内获得更大的进展,即:在更丰富的数据类型上处理更多种类的查询任务。四、方案拟定与分析1、采用由大到小,由浅入深的顺序进行研究。不确定性数据对于我来讲,是比拟新的东西。要想快速把握一样新的东西,并不断深化,从整体上了解它的整个框架,是很重要的。这样能够防止在研究的经过中迷失方向,同时,从整体上把握了不确定性数据后,可以以更方便更有效率地与别人进行沟通,更有效地从网络上检索到有用的信息。万丈高楼平地起,把握不确定性数据
9、的整体,就是为不确定性数据的模型研究打基础。基础扎实,深化研究阶段才能底气。五、毕业论文撰写提纲摘要Abstract第一章绪论1.1不确定性数据的背景1.2不确定性数据的管理框架1.2.1模型定义1.2.2预处理与集成1.2.3存储与索引1.2.4查询分析处理1.3不确定性数据的模型1.4建模的要求与挑战1.4.1庞大的可能世界实例集合1.4.2新出现的维度概率维1.4.3不确定性数据管理的理论问题第二章可能世界模型2.1可能世界模型的简介2.2可能世界模型的举例与讲明第三章针对关系型数据的模型3.1Probabilistic?-table模型3.2Probabilisticor-settab
10、le模型3.3Probabilisticor-set-?Table模型3.4Probabilisticc-table模型3.4.1三个简单的表达系统3.4.2Probabilisticc-table第四章针对半构造化数据的模型4.1p-document模型4.1.1模型简介4.1.2xml4.1.3模型定义的相关问题与解决方法4.2概率树模型模型probabilistictreemodel4.2.1模型快照4.2.2模型的定义4.2.3模型的缺乏之处4.3PXDB模型4.3.1PXDB模型引入4.3.2模型定义4.3.3c-formulae4.3.4模型评价第五章其它模型5.1针对数据流的模型
11、5.1.1针对数据流的模型5.1.2一个常用模型的定义5.1.3相关窗口的分类5.2针对多维数据的模型5.2.1关于OLAP5.2.2针对多维数据的模型5.2.3相关模型第六章总结6.1内容总结6.2瞻望参考文献致谢六、施行计划设计总共用时3个半月左右。详细安排如下:论文选题,采集资料,并完成开题报告初稿。学习与整理不确定性数据的相关资料。进入不确定性数据模型深化研究阶段,并完成论文初稿。修改毕业论文整理好材料,装订好论文,进行答辩准备。指导老师意见:签名:年月日备注:1、要有10篇以上相关文章的阅读量。2、理、工科开题报告撰写不少于2500字,人文社科开题报告不少于3500字,包括论文选题的背景和意义、工作任务分析、调研报告、方案拟定与分析、毕业论文撰写提纲及施行计划、文献综述理、工科可不提交文献综述等。3、电脑打印,用A4纸,页边距左边3。2cm,右边2。54cm,上下边距2。54cm,在左边装订;内容为小四号宋体,行距为固定值20磅。4、文献综述按文献综述格式打印附在开题报告后面一起装订。
限制150内