平台门户建设工作手册.doc
1附件2007 年度国家科技基础条件平台门户建设年度国家科技基础条件平台门户建设工作要求工作要求2007 年度国家科技基础条件平台门户(以下简称平台门户)建设的主要任务是以实现开通与运行为目标,以执行中的平台建设项目为切入点,以统一窗口向全社会展现平台建设成果,发布和展示科技基础条件资源信息,实现分散异构数据库资源信息的检索导航。有关具体要求如下:一、 工作要求1、平台中心承担平台门户建设和运行管理工作。负责平台门户的整体设计,研究制定建设方案;组织协调平台门户管理制度和标准规范体系建设以及相关共性技术研发工作;开展有关宣传、培训;评估项目承担单位资源信息整合的质量、数量和服务情况,并向科技部、财政部提出进一步支持的建议。2、项目承担单位按照平台建设项目的计划任务书, 规范、整理已建资源信息库,并将标准化的资源信息整合到平台门户。3、项目承担单位妥善保管原始实物资源和资源信息,建立必要的规章制度,对资源信息的变化情况进行实时检查,并及时更新和安全备份,保证资源信息的安全性、真实性和有效性。4、对于采用离线方式整合到平台门户的资源信息,项目承担单位应负责其持续不断的更新与维护,并定期提交更新后的资源信息;对于采用在线检索方式连通的资源信息库,2项目承担单位要确保连接渠道的畅通、便捷和安全。5、项目承担单位在保障国家安全、遵守国家保密规定和保护知识产权的前提下,提供具体的资源信息和实物资源服务,向社会开放共享,保证运行服务质量和效果。6、请项目承担单位的上级主管部门对项目实施进度、资源信息更新维护等工作情况进行监督和管理,组织专家对资源信息进行审核,确保资源信息的科学性和准确性,并提供必要的经费支持和制度保障。二、 技术要求1、项目承担单位填报平台项目资源信息建设情况调查表 (见附件1) ,加盖单位公章后,于 2007 年 12 月 15 日前报送到平台中心,同时以电子邮件方式报送电子版。2、项目承担单位于 2007 年 12 月 15 日之前,按照核心元数据标准格式 (见附件 2)以及资源信息整合接口规范 (见附件 3) ,提供资源信息检索接口,或通过离线方式提交核心元数据。3、项目承担单位按照文件格式、提交方式和命名规则等要求(见附件 4) ,定期向平台门户提供资源站点用户访问日志。4、项目承担单位安排有关人员配合开展平台门户建设工作,指定专门联络员,并将项目承担单位联络员信息表 (见附件 5)于 2007 年12 月 15 日前以电子邮件方式报送到平台中心。平台中心定期组织召开联络员会议,通报工作进展情况,部署相关工作任务。三、 说明1、实际工作中出现的具体问题,由平台中心与项目承担单位及其上级主管部门共同协商解决。32、附件电子版可通过平台中心网站(www.nstic.gov.cn)下载。3、联系方式:平台中心联系人:卢凡 黄珍东电 话:010-58881116/58881118 传真:010-58881109邮 箱:lufmost.cn、huangzdmost.cn 地 址:北京市复兴路乙 15 号平台中心 邮编:1008624附件 1平台项目资源信息建设情况调查表平台项目资源信息建设情况调查表项目编号项目名称资源信息建设情况资源信息建设情况资源信息元数据总量实体资源建设总量资源信息库建设总量是否对资源信息进行结构化存储?资源结构化存储情况(若没有则填暂无):采用何种存储技术、软件或工具?存储技术、软件或工具(若没有则填暂无):采用何种计算机编程语言和实现技术?计算机编程语言和实现技术(若没有则填暂无):是否制定资源元数据标准规范?元数据标准规范情况(若没有则填暂无):资源整合方式?离线汇交、在线检索或其他整合方式?能否按照规范提供(核心)元数据?核心元数据标准规范(共性字段+扩展字段):平台项目宣传内容平台项目宣传内容项目简介(1500 字左右,强调特色,提供图片素材)(包括工作部署及工作目标完成情况、主要开展的工作及执行情况、主要取得成效成果、运行服务情况等)5规章制度和标准规范建设(请在表格后附已颁布的规章制度和制定的相关标准规范,国标或行标请标注)网站建设情况网站建设情况网站建设单位网站负责人联系电话电子邮箱首页 URL网站概述重点栏目 URL重点栏目概述特色服务 URL特色服务介绍检索请求格式检索结果反馈格式6附件 2核心元数据标准格式核心元数据标准格式平台信息资源核心元数据是国家科技基础条件平台信息资源内容中元数据部分必选的元数据,可用于平台资源编目、描述和数据交换活动。平台资源核心元数据包括 9 个元数据元素,具体见下表:属性名称属性名称说明说明数据类型数据类型资源标识符资源的唯一标识字符串必选项资源名称赋给资源的名称字符串必选项资源发布日期管理者对资源进行发布的日期日期型(GB/T 7408)必选项资源摘要资源内容的简单说明字符串必选项资源负责单位负责单位名称字符串必选项关键字说明用于描述资源主题的通用词、 形式化词或短语字符串必选项资源访问限制为保护隐私权或知识产权,对 访问资源施加的限制或约束访问限制限制分级公开级1限制级2必选项资源分类类目编码类目名称对应的编码字符串必选项在线资源链接地址可以获取资源的网络地址字符串(RFC 2396)可选项*注:“资源访问限制”应与“资源安全限制分级”代码保持一致。7附件 3资源信息整合接口规范资源信息整合接口规范一、分类导航一、分类导航查询请求是一个由前缀加后缀组成的符合 RFC2396 格式要求的URL,格式如下:查询请求前缀 + 后缀 例1:http:/www.amadata.net.cn/resource?sort=01&page=1&pagesize=15其中,前缀:http:/www.amadata.net.cn/resource后缀:sort=值&page=值&pagesize=值。具体的含义指:请求 sort 号为 01 下的所有元数据,当前显示结果集的第一页,每页包含 15 条记录;注意:(1)为了开发维护方便以及系统的稳定性,建议每页返回的记录条数固定,即 pagesize 大小固定。二、一般检索二、一般检索主要用于为用户提供针对某一类资源的查询定位服务,其查询请求是一个由前缀加后缀组成的符合 RFC2396 格式要求的 URL,格式如下:查询请求前缀 + 后缀例如:http:/www.amadata.net.cn/resource?sort=04&keyword=值&page=1&pagesize=15其中,前缀:http:/www.amadata.net.cn/resource,8后缀:sort=值&keyword=值&page=值&pagesize=值。其中 keyword 为用户提交的关键字。三、高级检索三、高级检索主要是为用户提供针对各科技资源站点的所有资源的查询定位服务,用户可以选择几项或者全部选项来定位查找资源,查询范围为所有资源。其查询请求是一个由前缀加后缀组成的符合 RFC2396 格式要求的 URL,格式如下:查询请求前缀 + 后缀 例如:http:/www.amadata.net.cn/resource?sort=01|02|03&keyword=值1|值 2&page=1&pagesize=15其中,前缀:http:/www.amadata.net.cn/resource,后缀:sort=值 1|值 2|值 3&keyword=值 1|值 2&page=值&pagesize=值。具体含义指:sort 号为 01、 02、03 中查找记录包含 keyword=值 1或者值 2 的所有元数据,返回当前第一页。四、返回四、返回 xml 的格式的格式值(总的元数据条数)值9值值值值值值值值值注意:1)值,多个关键词用空格隔开2)值年月日用“-”隔开,如:2007-11-263)其中的 ower 字段表示该元数据的产生单位。10附件 4资源站点用户访问日志要求资源站点用户访问日志要求一、日志文件格式一、日志文件格式各平台项目资源站点向平台门户提交 Web 服务器运行日志文件,提交的日志文件的格式应符合 NCSA(National Center for Supercomputing Applications) Combined 日志格式、微软 IIS 日志格式(Microsoft IIS Format)和 W3C 扩展日志格式(W3C Extended Log File Format)三种日志文件标准格式中的任何一种。为保证平台门户能够正确获得平台项目资源站点的信息和访问情况,进行评估监测,平台项目资源站点应当对其 Web 服务器进行配置,使其产生的日志至少包含以下数据:1主机 IP:向 Web 服务器发出 HTTP 请求的客户端计算机的 IP 地址或域名;2用户名:发出 HTTP 请求的用户登录到 Web 服务器所使用的用户ID;3日期和时间:用户向 Web 服务器发送 HTTP 请求的日期和时间;4HTTP 请求:用户向服务器发出的 HTTP 请求,包括要访问的资源及其路径、发送 HTTP 请求的方式等信息。5HTTP 服务状态:标明 HTTP 请求成功或者失败的服务状态编码;6字节数:处理 HTTP 请求,Web 服务器所接收的和发送的字节数;7反向链接:标明用户发出本次 HTTP 请求之前所访问的 URL。118用户代理:用户访问 Web 服务器时所使用的浏览器和操作系统等软件信息。日志数据项与三种日志格式中日志字段的对应关系如下表所示:日志数据项与日志字段对应关系表编号编号监测指标监测指标NCSA Combined日志格式日志格式微软微软 IIS 日志格式日志格式W3C 扩展日志扩展日志格式格式1主机 IPRemotehostClient IP adddressc-ip2用户名AuthuserUser namecs-username3日期和时间DateDate、 TimeDate、 Time4HTTP 请求RequestRequest Type、 Target of operationcs-method、 cs-uri-stem、 cs-uri-query5HTTP 服务状态StatusService status codesc-status6字节数BytesClient bytes sent、 Server bytes sentsc-bytes、 cs-bytes7反向链接referrerParameterscs(Referer)8用户代理user_agentParameterscs(User-Agent)二、日志提交方式二、日志提交方式1基于基于 FTP 协议的协议的提交方式提交方式(1)平台项目资源站点建立日志 FTP 服务器,设定其 FTP 地址和FTP 端口。(2)在 FTP 服务器上,为平台门户创建用户,并指定密码和相应权限。(3)提交日志 FTP 服务器的地址、端口、日志文件所在目录、平台门户用户名及密码等信息。12(4)保证 FTP 服务器始终处于运行状态,评估监测系统能够通过网络随时从该服务器获取日志数据。2基于基于 HTTP 协议协议的提交方式的提交方式(1)平台项目资源站点创建用于发布日志文件的网页,并将日志文件发布到 HTTP 服务器。(2)在 HTTP 服务器上,为平台门户创建用户,并指定密码和相应权限。(3)提交相关网页的 URL、平台门户的用户名及密码等信息。(4)保证 HTTP 服务器始终处于运行状态,评估监测系统能够通过网络随时从该服务器获取日志数据。三、命名规则三、命名规则各平台项目资源站点需要对 Web 服务器进行配置或者使用日志维护程序,保证日志目录下的日志文件是按天生成的、日志记录是连续的。日志文件的命名规则如下:日志文件名平台项目编号“_”日志记录日期“_”“access.log”。日志记录日期:标识该日志文件的记录日期,格式是:“YYYYMMDD”。日志文件名样例:“2005DKA3900_20051001_access.log”。13附件 5项目承担单位联络员信息表项目承担单位联络员信息表项目名称姓 名性别职称行政职务专业领域工作单位通信地址邮政编码电子邮箱办公室电话手机备注(第二联络员)