《科学数据共享概念与术语》标准培训教材.pdf
《《科学数据共享概念与术语》标准培训教材.pdf》由会员分享,可在线阅读,更多相关《《科学数据共享概念与术语》标准培训教材.pdf(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 科学数据共享通用标准培训系列教材 科学数据共享概念与术语 标准培训教材 科学数据共享工程办公室 2005 年 12 月 目目 录录 目 录.3 科学数据共享概念与术语科学数据共享概念与术语.-1-标准培训教材标准培训教材.-1-一、一、编制背景编制背景.-1-(一)、科学数据共享工程介绍.-1-(二)、统一基本概念的必要性.-2-二、二、编制思路编制思路.-2-(一)、本标准的目标.-2-(二)、国外的情况.-2-(三)、本标准的编制原则.-6-三、三、标准总体结构标准总体结构.-7-四、四、标准内容要点解析标准内容要点解析.-9-(一)、重要概念.-9-(二)、科学数据共享体系.-10-(
2、三)、科学共享工程基本框架.-11-(四)、科学数据共享机制.-12-(五)、科学数据资源的来源.-14-(六)、科学数据的分级分类.-15-(七)、科学数据的发布方式.-16-(八)、共享服务体系结构与功能.-16-(九)、共享体系部署.-17-(十)、共享技术标准.-21-五、五、标准使用标准使用.-25-(一)、数据管理.-26-(二)、数据集分发服务.-33-科学数据共享通用标准培训教材 -1-科学数据共享概念与术语科学数据共享概念与术语 标准培训教材标准培训教材 一、一、编制背景编制背景(一)、科学数据共享工程介绍(一)、科学数据共享工程介绍 各行业部门产生和积累的海量科学数据,得不
3、到有效共享和利用,制约了我国科技创新和社会经济发展的进程。“科学数据共享工程”将建成功能强大、结构合理的国家科学数据中心群及其数据共享网络体系,实现我国科学数据的全面共享。本工程的建设范围是,在资源环境、生物、农业、医学、信息、材料、能源、交通、先进制造与自动化和基础科学与重大科技前沿领域,构建60个左右的国家科学数据中心和国家科学数据网,形成覆盖全面、结构合理、功能先进的科学数据共享服务体系。国家科学数据中心属于国家科学数据共享平台的组成部分。以国家部门、行业系统为基础,按不同科学技术领域建立的社会公益型的科学数据主中心以及根据需要设立的科学数据分中心,统称国家科学数据中心;主要负责国家长期
4、布局的公益性、基础性科学数据的汇交、管理、交换与共享服务。国家科学数据共享平台的组成部分。以国家部门、行业系统为基础,按不同科学技术领域建立的社会公益性的科学数据主中心以及需要设立的科学数据分中心的总称。国家科学数据网是国家科学数据共享平台的组成部分。面向国家重大科技计划、重点区域以及基础科学领域,基于因特网连接分布于各科研院所、高等院校和国际组织的相关专业数据库,开展数据组织、加工与服务,所构建的物理上分布、逻辑上统一的科学数据网。科学数据共享通用标准培训教材 -2-科学数据共享技术平台的特点是面向全社会、网络化、智能化。其要求是,要形成科学数据管理与共享服务体系,提供科学数据的汇交、管理和
5、共享等基本服务。(二)、统一基本概念的必要性(二)、统一基本概念的必要性 建设科学数据共享工程、科学数据共享服务体系,必须要保证对科学数据共享技术体系架构、相关的概念有统一的理解。因此,统一基本概念十分必要。首先,科学数据共享工程的资源类型复杂,涉及资源环境、生物、农业、医学、信息、材料、能源、交通、先进制造与自动化和基础科学与重大科技前沿等多个领域,科学数据资源类型也复杂多样;其次,建设科学数据共享技术平台,所采用的通用技术和专用技术分别具有同一性和多样性的特点;再次,科学数据共享工程服务体系建成后,其应用也是是多样化的。所以,迫切需要需要形成对平台的目标、范围、共享的内容、体系结构等各方面
6、的内容有统一的理解。二、二、编制思路编制思路(一)、本标准的目标(一)、本标准的目标 本标准制定的主要目标在于规范科学数据共享工程相关标准、技术文件、资料和书刊文献等制定与编写过程中的概念和术语;帮助工程相关人员对科学数据共享技术体系架构有统一的理解;对与技术体系架构相关的概念理解一致;对科学数据资源体系的相关概念理解一致。(二)、国外的情况(二)、国外的情况 国外的一些政府及其机构、专门信息化组织以及学术研究团体在科学数据共享方面的工作以及相关标准化工作方面已经取得了一些进展和成果,对编制本标准具有十分重要的借鉴意义。1、空间信息共享领域加拿大空间信息共享领域加拿大CGDI 科学数据共享通用
7、标准培训教材 -3-加 拿 大 地 理 空 间 数 据 基 础 设 施 (Canadian Geospatial Data Infrastructure,CGDI)由地理信息跨部门委员会(Inter-Agency Committee on Geomatics,IACG)、地理信息加拿大委员会(Canadian Council on Geomatics,CCG)和加拿大地理信息产业联合会(Geomatics Industry Association of Canada,GIAC)支持。目前,加拿大正在实施一个由各界人士参与的国家计划,即地理信息联网(GeoConnections)计划。地理信息联
8、网(GeoConnections)是加拿大地理空间信息基础设施的具体成果和体现,其任务是提供地理信息和服务的在线共享和访问。如图2-1所示。图2-1 CGDI概念结构 CGDI的主要元素有三个:数据、服务和应用。表明了数据共享标准建设主要围绕着三个方面来进行,确立了数据共享标准建设的基本范围。(1)数据。CGDI创建的目标就是要解决数据访问的实际困难。框架数据(Framework Data)是CGDI数据建设的重点内容之一。框架数据的包括三种类型的数据:校准类图层(Alignment layers)、土地类数据(Land Feature/Form layers)和概念数据层(Conceptua
9、l layers)。科学数据共享通用标准培训教材 -4-(2)服务。CGDI定义了一系列和地理空间信息访问相关的服务,包括:目录和注册服务、WEB覆盖服务、WEB要素服务、地图表示以及符号库服务、事件通知服务和空间参照系字典服务。同时,CGDI定义了所有这些服务的接口规范。这样其它组织和软件厂商就可以根据这些接口规范来建设系统和开发软件产品。(3)应用。用户通过服务来访问和操纵数据,这种工作通常通过具体应用来实现。应用的领域可以是多种多样的。例如卫生健康、社会、文化、经济以及自然资源管理等领域的具体应用。此外,CGDI规定数据交换要基于加拿大和国际的相关标准规范。总体上来说,CGDI倾向于使用
10、ISO TC211的相关规范。2、政府信息共享领域美国政府信息共享领域美国FEA 为了推动美国电子政务,OMB在2002年开始建立联邦组织架构(Federal Enterprise Architecture,FEA)。FEA 全面描述各个组织机构的职能:这些职能是如何实现的,信息技术如何支持这些职能的实现。FEA由5个参考模型组成(如图2-2所示),包括绩效参考模型(Performance Reference Model,PRM)、业务参考模型(Business Reference Model,BRM)、服务构件参考模型(Service Component Reference Model,SR
11、M)、数据参考模型(Data Reference Model,DRM)和技术参考模型(Technical Reference Model,TRM)。图2-2 FEA参考模型 科学数据共享通用标准培训教材 -5-它们共同提供了联邦政府的业务、绩效与技术的通用定义和架构,其中:(1)绩效参考模型(绩效参考模型(PRM)PRM是为整个联邦政府提供一般结果与产出指标的绩效测评框架。它为政府机构提供了一种对照理想的FEA并缩短现实与理想之间差距的方法,与此同时,它也能够让政府机构从战略高度更好地管理政府业务。(2)业务参考模型(业务参考模型(BRM)BRM是描述联邦政府机构所实施的但与具体的政府机构无关
12、的业务框架,它构成FEA的基础内容。该模型描述了联邦政府内部运行与对外向公民提供服务的业务流程,而这些业务流程与联邦政府的某个具体的委、办、局没有关系。因此,由于它抛开了政府部门的狭隘观念,它能够有效地促进政府各机构之间的协作。(3)服务构件参考模型(服务构件参考模型(SRM)SRM是一种业务驱动的功能架构,它根据业务目标的改进方式而对服务架构进行分类。所谓构件就是一项可以自我控制的、事先已经进行功能设定的业务过程或服务,其功能可以通过业务或技术界面加以体现。SRM基于横向的业务领域,与具体的部门业务职能无关,因此,它能够为实现业务重用、提高业务功能、优化业务构件及业务服务种类提供基础杠杆。(
13、4)数据参考模型(数据参考模型(DRM)DRM的主要目标是促进数据、信息的公共标识、使用,实现跨部门的数据、信息的共享。为了达到这个目标,DRM包含了三个方面的标准:数据分类、数据交换和数据结构。通过公共的数据分类和结构,可以实现信息的共享。如果通过DRM可以理解数据的业务内容,就可以更加准确的知道数据的内容和目的,这样DRM就能够提高联邦政府对信息的共享能力。(5)技术参考模型(技术参考模型(TRM)TRM是一种分级的技术架构,是用于描述传输服务构件与提高服务性能的技术支持方式。它规定了一套技术要素,用以采用与实施基于构件的参考模型以及科学数据共享通用标准培训教材 -6-确定联邦政府的工作项
14、目(如FirstGov、Pay.Gov 以及24个总统优先的电子政务计划)所采用的成熟的技术与工具。3、政府信息共享领域英国政府信息共享领域英国E-GIF 英国电子政务从实用的角度出发,以服务电子化(Electronic Service Delivery,ESD)为目标,在总体上定义了英国电子政务互操作框架(e-Government Interoperation Framework,e-GIF),定义了一系列跨部门使用信息的规则,英国政府这种从顶层互操作设计、规范到应用实践整个过程紧密结合,对我国科学数据共享工程建设也有许多借鉴意义。4、美国战略美国战略C4ISR系统系统 C4ISR是指挥、控
15、制、通信、计算机、情报及监视与侦察的英文单词的缩写。C4ISR系统是现代军队的神经中枢,是兵力的倍增器。美国战略C4ISR系统是美国军事指挥当局作出重大战略决策以及战略部队的指挥员对其所属部队实施指挥控制、进行管理时所用的设备、器材、程序的总称,是美国整个军事C4ISR系统的重要组成部分。此外,还有德国的SAGA和网格资源共享组织OGSA。(三)、本标准的编制原则(三)、本标准的编制原则 本标准本着科学性、准确性、系统性、易理解和遵循标准等原则进行编制。主要体现在:科学性是指在标准内容的确定、标准编制基本方法方面,要参考国际先进的经验和成果,包括:ISO/IEC 10746 信息技术 开放分布
16、式处理 参考模型(Information technology Open Distributed Processing Reference model);德国联邦政府内务部,“电子政府应用标准与架构2.0”(Standards and Architectures for e-government Applications 2.0)等。准确性是指,对科学数据共享体系结构、概念的解释力求简明、准确。科学数据共享通用标准培训教材 -7-系统性是指,从多角度、多层次描述科学数据共享体系,有助于更加方面的理解科学数据共享体系的基本内容。为了方便理解,本标准在按照ISO/IEC 10746 RM ODP
17、的五个不同的角度(业务视图、信息视图、计算视图、工程视图和技术视图)的对科学数据共享概念进行描述的同时,采用了大家比较能理解的词汇进行描述。同时,本标准的术语部分的编写遵循了GB 1011288 确立术语的一般原则与方法。三、三、标准总体结构标准总体结构 科学数据共享概念与术语概念标准除参考文献外,主要包括九个章节,分别如下:第一章,范围。注明了本标准规定了科学数据共享工程技术体系的结构、功能、基本运行方式、共享数据内容等方面的基本概念。本标准可用于科学数据共享工程相关标准、技术文件、材料和书刊文献等的制定与编写。第二章,规范性引用文件。注明了本部分所引用的文件,包括SDS/T 2321200
18、4 科学数据中心建设规范、SDS/T 23222004 科学数据网建设规范和SDS/T 23222004 科学数据共享标准化工作指南。第三章,术语和定义。定义了三个术语,包括科学数据资源、目录服务和交换服务。第四章,科学数据共享体系概述。说明了本标准的主要内容,即从五个不同的角度(业务视图、信息视图、计算视图、工程视图和技术视图)对科学数据共享概念进行描述。第5章,建设目标、范围和策略。从业务视图的角度出发,定义了科学数据共享工程的建设目标、建设范围、基本框架和共享机制。第6章,共享数据内容。从信息视图的角度出发,描述科学数据共享的信息的范围和限制。科学数据共享通用标准培训教材 -8-第7章,
19、共享服务体系结构与功能。从计算视图的角度出发,描述科学数据共享服务体系的基本结构和功能。第8章,共享体系部署。从工程视图的角度出发,描述共享服务体系在物理上的部署情况,重点网络和数据的部署。第9章,共享技术标准。从计算视图的角度出发,定义和描述科学数据共享工程的标准体系及其在技术系统中的应用。科学数据共享概念与术语术语 标准主要包括七个章节和三个参考文献,分别如下:第一章,范围。说明了本标准规定了科学数据共享工程技术体系的相关技术术语及其定义,适用于科学数据共享工程相关标准、技术文件、材料和书刊文献等的制定与编写。第二章,规范性引用文件。注明了本部分所引用的文件,包括 GB 1.12000标准
20、化工作导则 第1部分:标准的结构和编写规则、GB 1.6 标准化工作导则 第2部分:术语标准编写规定、GB/T 20001.12001 标准编写规则 第1部分:术语和GB 1011288 确立术语的一般原则与方法。第三章,科学数据共享标准概念术语的体系。介绍了科学数据共享标准概念术语的体系所包含的主要内容:科学数据共享工程体系结构的术语,包括共享网络(如数据中心、数据网)和共享系统逻辑结构等;科学数据共享工程共享功能的术语,包括服务和服务流程(如数据发现、数据发布、数据获取);科学数据共享工程运行方式的术语,包括共享方式、政策法规和保密规定等;科学数据共享工程数据模型的术语,包括数据共享流程(
21、如数据加工、建库)、数据内容、数据属性、数据质量。第四章,选择术语的原则。原则包括:对科学数据共享技术体系架构有统一的理解;对与技术体系架构相关的概念理解一致;对科学数据资源体系的相关概念理解一致;IT领域的术语和专业领域的术语原则上不列入本标准。第五章,撰写定义的原则。本标准在给出概念的定义时遵循以下原则:应尽可能使用标准化的定义;如果取自其他规范性文件,应在定义之后的方括号中加科学数据共享通用标准培训教材 -9-注引用文件;定义应说明概念而不是构成名词的单词;定义尽可能简洁和按照需要进行复合;避免单一定义和定义体系中的循环推理;避免同语反复。第六章,术语与定义。从四个方面定义了149条术语
22、和定义,包括科学数据共享体系结构的术语、科学数据共享功能的术语、科学数据共享运行方式的术语以及统一建模语言的术语。第七章,缩略语。给出了科学数据共享工程技术体系中所使用到的缩略语的定义。附录A和B提供了本标准所有术语的中、英文索引;附录C给出了一系列专业术语标准。四、四、标准内容要点解析标准内容要点解析(一)、重要概念(一)、重要概念 本标准规定了科学数据共享工程技术体系中的概念和术语,其中较为重要的概念有:1、科学数据资源科学数据资源 科学数据资源是指科技活动或通过其它方式所获取到的反映客观世界的本质、特征、变化规律等的原始基本数据,以及根据不同科技活动需要,进行系统加工整理的各类数据集,用
23、于支撑科研活动的科学数据的集合。2、主体数据库主体数据库 主体数据库是依据国际标准、国家标准或行业标准分类体系构建的二级学科及其分支学科的科学数据集,并基于计算机系统运行的数据库。主体数据库是科学数据共享数据资源的主要存在形式,它具有稳定的数据来源和足够的数据存量,在数据汇集、归档和服务诸方面具有与开展科学数据共享管理相适应的能力。3、数据集数据集 科学数据共享通用标准培训教材 -10-数据集是可以标识的数据集合。主体数据库由一系列的数据集组成。4、目录服务目录服务 提供科学数据资源的发现与定位功能的信息服务。5、交换服务交换服务 提供科学数据资源的访问与获取功能的信息服务。(二)、科学数据共
24、享体系(二)、科学数据共享体系 本标准对科学数据共享体系进行描述,主要是为了达到以下目标:对科学数据共享技术体系架构有统一的理解;对与技术体系架构相关的概念理解一致;对科学数据资源体系的相关概念理解一致。如图4-1所示,本标准从五个不同的角度(业务视图、信息视图、计算视图、工程视图和技术视图)对科学数据共享概念进行了描述:业务视图信息视图工程视图技术视图计算视图共享技术标准目标、范围与策略共享数据内容共享服务体系结构与功能共享体系部署科学数据共享体系科学数据共享体系业务视图信息视图工程视图技术视图计算视图共享技术标准目标、范围与策略共享数据内容共享服务体系结构与功能共享体系部署科学数据共享体系
25、科学数据共享体系 图4-1 科学数据共享体系内容关系 1、从业务视图的角度出发,定义科学数据共享工程的建设目标、建设范围、基本框架和共享机制。2、从信息视图的角度出发,描述科学数据共享的信息的范围和限制。科学数据共享通用标准培训教材 -11-3、从计算视图的角度出发,描述科学数据共享服务体系的基本结构和功能。4、从工程视图的角度出发,描述共享服务体系在物理上的部署情况,重点网络和数据的部署。5、从计算视图的角度出发,定义和描述科学数据共享工程的标准体系及其在技术系统中的应用。(三)、科学共享工程基本框架(三)、科学共享工程基本框架 如图4-2所示,科学共享工程基本框架是由主体数据库、科学数据中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科学数据共享概念与术语 科学 数据 共享 概念 术语 标准 培训教材
限制150内