2021-2022年收藏的精品资料软件工程研究中的效度问题.doc
《2021-2022年收藏的精品资料软件工程研究中的效度问题.doc》由会员分享,可在线阅读,更多相关《2021-2022年收藏的精品资料软件工程研究中的效度问题.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、软件工程研究中的效度问题摘要 在过去十年中,由于开源项目存档的可利用性,使用软件资源库构件的经验研究已经成为了流行。在本文中,我们调查了过去3年对ICSE和FSE会议记录的研究,并对其按照开源项目与专利项目,以及在这些研究中所使用主题程序的多样性进行分类。我们的调查显示,最近的经验研究中几乎有一半(49)仅仅使用了开源项目。目前的研究或是从这些结果中得出一般性结论,或是明确否定任何超出特定主题软件的领域所得出的结论。我们得出结论,经验性软件工程的研究人员必须考虑到由于只使用几个知名的开源软件项目所引起的外部效度问题,这些对数据源选择的讨论是软件工程研究的一个重要的议题。而且,我们建议,软件资源
2、库基准应有一个共同的研究架构,并共享经验性分析结果,这是为了更好地解决外部效度问题,并促进经验软件工程中分析软件构件的研究。分类和主题描述D 2.0软件工程:通用通用术语 效度关键词 经验研究,外部效度,开源软件1.介绍在过去的几年中,软件工程研究人员充分利用了开源软件项目提供的丰富信息。研究人员已经开发了开源代码库,问题追踪器,邮寄档案列表和其他产品来进行他们的经验研究。从表面上看,这些研究的进行是为了获悉更多的软件开发状态,以及可以如何改善它。 在严格审查开源软件时,这些研究中有许多得出了关于软件工程的一般性的结论。尽管这些研究结果是有用的,这类研究的作者很少就效度面临的威胁发表意见,特别
3、是仅仅在研究现有的开源软件的时候呈现出的外部效度问题。一些研究人员明确否认特定研究项目以外的任何结论,从而在其他方向走得太远。这两种方法都无助于提高目前的技术水准或改进软件工程中的实践。 在本文中,我们探索软件工程研究中效度面临的潜在威胁,这些研究使用软件构件档案作为一个数据集。通常在讨论效度时,我们特别强调关于选择使用开源数据作为主要研究数据源时的外部效度问题。我们调查了过去几年FSE和ICSE的会议记录,以确定被发现问题的普遍性,提出了我们觉得有关改善经验性软件工程研究现状的问题,以及用何种方式可以让这方面知识的研究方法有所改进的建议。2.实验的效度对于任何类型的实验,为了给出有说服力的论
4、据,它们必须具有高度有效性。当对一个实验效度的完整处理被更好地留给了另外的资源,这个部分可以简单应对在软件工程研究中对于内部,外部,以及建构效度的挑战。2.1 建构效度建构效度是指具体的测量值是否真的模拟构成假设定理的自变量和因变量。 换句话说,一个具有高建构效度的经验研究能够确保研究参数与研究问题紧密相关。2.2 内部效度 在经验研究中,干扰因素对内部效度是一个主要的威胁。我们的调查显示,在软件工程研究中,选择性偏差是一个普遍的问题,并且限制了这些研究的效度。内部效度对计算者来说很难处理,因为观察变量的变化可能归因为其他一些变量的存在或者变化度,这些与被控变量有联系,但没有明确地模式化变量。
5、 2.3 外部效度 一般地,外部效度指的是除了那些直接观察结果以外的领域,其研究或实验结果的适用性。如果一个研究的结论支持整个研究领域,那么就说这个研究具有高外部效度。在大多数科学科目中,研究者们非常重视对外部效度的研究,因为研究结果可以广泛适用于其他情况。 一个给定研究的外部效度有几个方面: 研究是否在领域中推广到了其他学科 是否存在足够的根据和论点来支持声明的普遍性 研究成果是否能验证预期的理论 减轻建构和内部效度问题常常比应对面向内部效度的威胁更重要,因为解决前两者是先决条件,之后才能考虑研究结果超出进行研究的主题领域之外的普遍性。然而,每个软件工程研究应该争取一个高层次的外部效度,因为
6、软件世界太大,太复杂了,无法全面地研究。研究人员选择研究代表性的项目,然后对其总体概括出结论是很重要的。3.研究中的开源数据 随着最近的开源软件开发和数据的激增,研究人员已经转向这些容易取得开发数据和构件的资源。尽管有困难,不管是否能够被理解,这样做的情况已经发生。有一段时间在开源研究领域,从开源资料库中获得一套平衡的数据已经成为一个难题,一些数据集合已经尝试着去解决这个问题。然而,开源数据在一些方面要区分于专利软件数据。首先,当使用开源数据集时,研究人员们经常可以使用软件工程过程中的产品,而当审查专利软件时,研究人员们通常可以得到一个关于软件系统以及软件系统构建和维护环境的更为完整的视图。其
7、次,进一步偏置源数据是开源软件的领域。许多最成熟的开源项目是系统领域软件,这可能会引起它自己特有的一系列发展倾向。以其他领域方向为发展目标的软件工程可能会有特殊的问题,并且不能被系统特有的软件偏置精准地捕获到。第三,大量存在的工作决定了开源项目的社会结构。与此同时,专利项目已经建立了组织结构,通过研究它们,研究人员们可能放弃探索社会关系的时间密集型过程。此外,考恩威法则指出软件的设计和构建是否开放或私化,可能会被组织结构深远影响。由于开源项目的组织结构通常是自发形成的,能够使用开源项目数据解答的关于通信和组织结构的研究问题类型,不能推广到结构明确定义的封闭源项目。 最后,使用开源项目数据进一步
8、使研究方法的验证变得复杂,因为很难找到合适的工作人员(开发者,管理者,测试者),让他们验证自动化软件分析的结果,因为贡献者的角色常常是隐蔽的,他们的工作都基于自愿的原则。3.1 在研究中开源数据的调查一个关于过去会议的简单调查有助于说明我们的观点。这样一个调查,尽管不能完全代表所有的软件工程研究,却可以表明目前在主要的软件工程会议上的普遍观点。在这个调查中,我们研究了相对于使用合适的源软件构件,仅仅使用开源软件构件进行经验研究的范围。虽然可操作的开源定义可能是不固定的,但是我们决定用这样一个定义去区分开源项目和封闭性项目,那就是“现成的源代码和开发工具”。此外,开源项目存在于一个开放的发展实践
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021 2022 收藏 精品 资料软件 工程 研究 中的 问题
限制150内