《DCI已收录社会科学数据的统计分析,社会科学论文.docx》由会员分享,可在线阅读,更多相关《DCI已收录社会科学数据的统计分析,社会科学论文.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、DCI已收录社会科学数据的统计分析,社会科学论文引言 社会科学数据( Social Scientific Data) 是描绘叙述社会科学研究对象、方式方法、条件、状态和其他因素的事实、数字、文字和符号,主要类型有调查数据、统计数据、记录数据、实验及模拟数据等1,2。在大数据背景下,社会科学数据已经越来越被视为国家的一种战略资源3。开放及分享社会科学数据,能够再现和验证社会科学研究经过与结果,提升研究成果质量; 能够启发其他研究者利用现有数据提出新的研究问题,推动研究创新; 能够促进社会科学研究成果为公众、企业、所用,充分发挥研究成果的潜在价值4,5。 2020 年,汤森路透在 Web of K
2、nowledge 平台上推出了新产品 DCI ( Data Citation Index) ,它搭建了科学研究工作者与全球数据知识库之间连接的桥梁6。在 DCI 数据库中,每条数据记录包括数据所属的数据知识库、国家、机构、文献类型、出版年、被引频次、SU 类别等字段。截止 2020 年 6月 12 日,DCI 收录自然科学( 3291397 条) 及社会科学( 551059 条) 数据记录共 3842456 条。 本文对 DCI 收录的社会科学数据记录的国家/地区分布、机构分布、文献类型分布、学科分布及被引用情况进行统计分析,以期发现其规律、特征,为我们国家社会科学数据的管理与应用提供参考。
3、一、数据采集 在本文中,所采集的社会科学数据记录包括DCI 在 SU( Subject Area) 分类下的社会科学、人文 艺术和图书情报学。在 DCI 的高级检索界面下,将社会科学的 24 个子类学科、人文 艺术的14 个子类学科、图书情报学科通过逻辑连接词 or 构成一个检索式,即 su = Women s Studiesor su = Urban Studies or or su = InformationScience Library Science ,根据这个检索式进行检索并采集数据。截止2020 年6 月12 日,通过这种采集方式方法,获得 DCI 社会科学数据记录 551059条
4、。 二、数据分析 为分析社会科学数据的开放分享程度和学术影响力,本文从国家/地区、机构、文献类型、学科类别 4 个方面统计并计算了 DCI 社会科学数据的记录数、被引记录数、被引次数、H 指数 4 个评估指标。记录数指标用于评估社会科学数据的开放分享程度,该指标越大,讲明开放分享程度越高。 被引记录数、被引次数、H 指数用于评估社会科学数据的学术影响力,这 3 个指标越大,讲明学术影响力越高。 ( 一) 国家/地区统计分析 本文利用从 DCI 中采集的 551059 条记录统计并计算了各个国家/地区的评估指标,并列出记录数靠前的10 个国家,如表 1 所示。从记录数看,美国的记录数最大,为 8
5、1261 条,占总记录数的 14746% ,其次是德国和英国,记录数分别为 13351、2180 条,所占百分比分别为 2 423% 、0 396% 。从被引记录数看,美国的被引记录数最大,为 2714 条,其次是澳大利亚和英国,被引记录数分别为 396、256 条。从被引次数看,美国的被引次数最多,为37843 次 ,其次是英国和澳大利亚,被引次数分别为3533、2905 次。从 H 指数看,美国的 H 指数最大,为84,其次是英国和加拿大,H 指数分别为 25、21。 由此看出,在社会科学数据领域中,美国、德国、英国的数据开放分享程度相对较高。同时,美国、澳大利亚、英国的平均被引记录数、平
6、均被引次数、平均 H 指数分别为 1122、14760、43,明显超过其他国家的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,美国、澳大利亚、英国的数据学术影响力相对较高。【1】 本文利用从 DCI 中采集的 551059 条记录统计并计算了各个机构的评估指标,并列出记录数靠前的 10 个机构,如表 2 所示。从记录数看,美国商务部的记录数最大,为 35484 条,占总记录数的 6 439%,其次是慕尼黑大学和国际粮食政策研究机构,记录数分别为 9602、5080 条,所占百分比分别为 1 742%、0 922%。从被引记录数看,密歇根大学的被引记录数最大,为 418 条 ,其次是
7、美国商务部和美国司法部,被引记录数分别为 396、326条。从被引次数看,美国商务部的被引次数最多,为 8164 次 ,其次是密歇根大学和美国司法部,被引次数分别为 5863、3052 次。从 H 指数看,美国商务部的 H 指数最大,为 45,其次是密歇根大学和美国司法部,H 指数分别为 41、25。 由此看出,在社会科学数据领域中,美国商务部、慕尼黑大学、国际食品政策研究机构的数据开放分享程度相对较高。同时,美国商务部、密歇根大学、美国司法部的平均被引记录数、平均被引次数、平均 H 指数分别为 380、5693、37,明显超过其他机构的被引记录数、被引次数、H 指数,可知在社会科学数据领域中
8、,美国商务部、密歇根大学、美国司法部的数据学术影响力相对较高。 ( 三) 文献类型统计分析 DCI 将其收录的记录分为 3 种文献类型,数据知识库( epository) 、数据研究( Data Study) 、数据集( Data Set) 。数据知识库是包含数据研究和数据集的数据库或集合,提供原始数据的存储和访问。数据研究是对知识库中保存的研究或实验的描绘叙述,包括长期的系列或纵向研究。数据集是数据知识库提供的一个或一组具有内在联络的数据文件,是集合、数据研究或实验的一部分7。 本文利用从 DCI 中采集的 551059 条记录统计并计算了 3 种文献类型的评估指标,如表 3 所示。从记录数
9、看,数据集的记录数最大,为 507220条,占总记录数的 92 045%,其次是数据研究和数据知识库,记录数分别为 43790、49 条,所占百分比分别为 7 947%、0 009% 。从被引记录数看,数据研究的被引记录数最大,为 5841 条 ,其次是数据集和数据知识库,被引记录数分别为 30、9条。从被引次数看,数据研究的被引次数最多,为78509 次 ,其次是数据知识库和数据集,被引次数分别为 6859、71 次。从 H 指数看,数据研究的 H指数最大,为 140,其次是数据知识库和数据集,H指数分别为 7、4。【2】 由此看出,在社会科学数据领域中,文献类型为数据集的数据开放分享程度相
10、对较高,文献类型为数据研究的数据学术影响力相对较高。 ( 四) 学科类别统计分析 本文利用从 DCI 中采集的 551059 条记录统计并计算了各个学科类别的评估指标,并列出记录数靠前的 10 个学科,如表 4 所示。从记录数看,地理的记录数最大,为 376918 条,占总记录数的 68 399%,其次是社会学和人口统计学,记录数分别为 48260、45750 条,所占百分比分别为 8758% 、8 302% 。从被引记录数看,社会学的被引记录数最大,为 2117 条 ,其次是商业与经济和人口统计学,被引记录数分别为 1114、1005 条。从被引次数看,社会学的被引次数最多,为 35505次
11、,其次是人口统计学和商业与经济,被引次数分别为 21992、1884 次。从 H 指数看,人口统计学的H 指数最大,为 96 ,其次是社会学和商业与经济,H 指数分别为 94、85。 由此看出,在社会科学数据领域中,地理、社会学、人口统计学的数据开放分享程度相对较高。同时,这3 个学科类别的平均被引记录数、平均被引次数、平均 H 指数分别为1412、19793、91,明显超过其他学科类别的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,社会学、人口统计学、商业与经济学科的数据学术影响力相对较高。【3】 三、结论及对我们国家的启示 本文从 DCI 中采集了社会科学、人文 艺术、图书情报
12、学的数据,利用这些数据从国家/地区、机构、文献类型、学科类别4 个方面进行统计分析,得出了相关结论,并得到对我们国家的相关启示: ( 1) 从国家/地区分析结果能够看出,在社会科学数据领域中,欧美国家的数据开放分享程度和学术影响力相对较高。建议我们国家完善社会科学研究管理办法,建立我们国家社会科学数据开放制度,提高我们国家社会科学开放数据的量与质,在这里基础上,逐步建立我们国家的社会科学数据引文索引库,促进我们国家社会科学数据的开放与应用。 ( 2) 从机构分析结果能够看出,在社会科学数据领域中,的社会科学数据开放分享程度和学术影响力相对较高。建议我们国家在遵循(国家保密法的前提下,建立数据中
13、心,加强对数据的开放与应用,中心可由委托国家图书馆、国家档案馆、公立高校图书馆等建设。 ( 3) 从文献类型分析结果能够看出,在社会科学数据领域中,文献类型为数据研究的数据的学术影响力相对较高。建议我们国家的社会科学研究管理部门构成原始研究数据报告与公开制度,并建立相应的原始研究数据中心。如国家社科规划办可构成国家社科基金项目的原始研究数据报告与公开制度,并建立 国家哲学社会科学基金项目原始研究数据中心 。同样,各省( 市、区) 社科规划办可以构成各省( 市、区) 社科基金项目的原始研究数据报告与公开制度,并建立 各省( 市、区) 哲学社会科学基金项目原始研究数据中心 。这样,有利于确保社科基金项目的研究质量,有利于社科研究成果的再利用,有利于哲学社会科学的创新发展。 ( 4) 从学科类别分析结果能够看出,在社会科学数据领域中,社会学、人口统计学的数据开放分享程度和学术影响力相对较高。建议我们国家建立以我们国家社会科学重点学科、重点实验室、重点研究基地为中心及图书馆积极介入的各个学科的数据中心。
限制150内