医学统计学之科研方法 第一讲 科研方法绪论.ppt
-
资源ID:60888781
资源大小:169.50KB
全文页数:54页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
医学统计学之科研方法 第一讲 科研方法绪论.ppt
l刘启贵刘启贵1第一讲第一讲 绪论绪论2科学的特点科学的特点l科学(科学(science)是由拉丁文是由拉丁文Scare而来,意指而来,意指“探讨自然现象和其间关探讨自然现象和其间关系的知识体系系的知识体系”。l科学研究是一种有系统地探索和解决科学研究是一种有系统地探索和解决问题的活动,并能从中获得客观规律问题的活动,并能从中获得客观规律和产生新知识和产生新知识,进而阐明实践与理论进而阐明实践与理论间的关系间的关系。3科学的特点科学的特点l科学精神科学精神:最根本的内容是实事求是最根本的内容是实事求是l科学本质应是科学本质应是:合乎逻辑合乎逻辑 可验证:即可被重复可验证:即可被重复 科学研究着重一般共性问题科学研究着重一般共性问题 探讨事物因果关系探讨事物因果关系 4科学研究的特点科学研究的特点l科研工作具有科研工作具有 探索性、创造性和连续性探索性、创造性和连续性l科研工作表现为三方面的内容科研工作表现为三方面的内容 描述事物的现状描述事物的现状 发现事物的内在联系和本质规律发现事物的内在联系和本质规律 引出定律或产生理论引出定律或产生理论 5医学研究的任务医学研究的任务 l医学研究的任务是揭示人体生命本质医学研究的任务是揭示人体生命本质和疾病机理,认识健康和疾病互相转和疾病机理,认识健康和疾病互相转化的规律,并按此规律创造防病治病化的规律,并按此规律创造防病治病的医学技术和恢复健康的方法。的医学技术和恢复健康的方法。6l技术层次技术层次 在医学研究中不同学科有不同在医学研究中不同学科有不同的研究方法,同一学科中不同研究的研究方法,同一学科中不同研究课题所使用的技术方法也各有不同。课题所使用的技术方法也各有不同。这这些方法是医学研究的具体技些方法是医学研究的具体技术术方方法,是医学研究方法学中的特殊方法,是医学研究方法学中的特殊方法。法。医学研究方法医学研究方法7l逻辑层次逻辑层次 这是医学研究方法中更高的层这是医学研究方法中更高的层次,是医学各个学科研究共同使用次,是医学各个学科研究共同使用的一般方法。包括演绎法、归纳法、的一般方法。包括演绎法、归纳法、类比法、分析法、综合法、假说法、类比法、分析法、综合法、假说法、验证法等。验证法等。8演绎法演绎法 l演绎法演绎法是从一般到个别的推理形式,是从一般到个别的推理形式,从普遍性的理论知识出发去认识特殊的从普遍性的理论知识出发去认识特殊的个别现象的思维过程。演绎最常用的是个别现象的思维过程。演绎最常用的是三段论式,由三部分构成,即两前提三段论式,由三部分构成,即两前提(一一个大前提、一个小前提个大前提、一个小前提)和一个结论。和一个结论。9归纳法归纳法 l归纳法是从个别到一般的推理形式,即归纳法是从个别到一般的推理形式,即由个别或特殊的现象推出普遍的判断,由个别或特殊的现象推出普遍的判断,即一般的规律性。即一般的规律性。l归纳法是从许多同类的个别事物中找出归纳法是从许多同类的个别事物中找出它们的共同点的方法。可分为完全归纳它们的共同点的方法。可分为完全归纳法、不完全归纳法法、不完全归纳法(包括包括判明因果判明因果联联系系归归纳纳法法 、统计统计法法)。10 研究步骤和内容概述11提出问题和确立研究问题提出问题和确立研究问题查阅文献查阅文献假设形成假设形成研究设计(确定研究对象和选择研究方法)研究设计(确定研究对象和选择研究方法)确认研究变量和预试验;确认研究变量和预试验;收集资料(原始数据的积累和处理)收集资料(原始数据的积累和处理)统计学分析统计学分析撰写论文撰写论文12提出问题和确立研究问题提出问题和确立研究问题 l科研的选题多来自实际经验和日常工作科研的选题多来自实际经验和日常工作 个人的实践个人的实践 受他人研究结果的启发受他人研究结果的启发 现在或未来需要探讨的内容现在或未来需要探讨的内容 研究者的兴趣研究者的兴趣l研究题目的方向常见有研究题目的方向常见有 研究各临床专业问题研究各临床专业问题 比较两种或两种以上的治疗方法比较两种或两种以上的治疗方法 评价新的检查手段与方法评价新的检查手段与方法 预防与管理等问题预防与管理等问题 发展测量工具等发展测量工具等 13选题的注意事项l选择对临床有指导意义的问题进行研究,要立足于创新。l选题范围不可太大,涉及面过大则不易深入。l研究内容要避免完全重复别人的工作。l最好结合自己熟悉的专业选题。l研究问题的可行性。14查阅文献查阅文献 l了解关于研究课题的研究历史、现状、了解关于研究课题的研究历史、现状、动态和水平动态和水平l查看自己选题的内容有无与他人工作完查看自己选题的内容有无与他人工作完全重复,以减少盲目性全重复,以减少盲目性l可以启发自己的研究思路可以启发自己的研究思路l寻找相关的理论依据寻找相关的理论依据15陈述问题和理论框架陈述问题和理论框架 l 陈陈述述所所提提出出研研究究问问题题的的背背景景和和主主要要思思路路,说说明明立立题题依依据据和和预预期期目目的的,根根据据研研究究相相关关的的理理论论框框架架(theoretical framework)或或概概念念框框架架(concept framework),以以指指导导课课题题的的研研究究。在在研研究究中中理理论论的的应应用用是是很很重重要要的的,它它影影响响着着假假设设的的形形成成、研研究究设设计计和和结结果果分分析析,根根据据理理论论引引导导进进行行研研究究,所所得得结结果果也也必必然然纳纳人人理理论论框框架架中中。理理论论是是解解释释观观察察事事物物现现象象的的依依据据,也也起起着着指指导导研研究究方向的作用,使研究结果更具深度。方向的作用,使研究结果更具深度。16假设形成假设形成 假设是研究前对要研究的问题提出假设是研究前对要研究的问题提出的预期目的,根据假设确定研究对象、的预期目的,根据假设确定研究对象、方法和观察指标等。通过获得的试验结方法和观察指标等。通过获得的试验结果来验证或否定假设,并对提出的问题果来验证或否定假设,并对提出的问题进行解释和回答。假设是科学性和推测进行解释和回答。假设是科学性和推测性的统一,常由理论推测而得,所以假性的统一,常由理论推测而得,所以假设能提供研究方向、指导研究设计。设能提供研究方向、指导研究设计。17研究设计研究设计 l 研究设计是科学研究中具体内容和研究设计是科学研究中具体内容和方法的设想及计划安排,从而获得有意方法的设想及计划安排,从而获得有意义的资料和结果。义的资料和结果。l研究设计的主要内容有:研究设计的主要内容有:研究对象(受试者)研究对象(受试者)随机分组(随机分组(randomization)设对照组设对照组 观察指标(观察项目)观察指标(观察项目)18预试验预试验 l 预预试试验验是是指指在在正正式式开开始始研研究究工工作作前前,按按研研究究设设计计内内容容,先先做做一一些些小小量量样样本本的的试试验验,目目的的为为检检验验课课题题设设计计中中有有无无需需要要修修正正的的地地方方,同同时时也也可可熟熟悉悉和和摸摸清清研研究究条条件件。一一般般在在大大规规模模或或大大样样本本的的研研究究开开始前进行预试验。始前进行预试验。19原始资料的收集和处理原始资料的收集和处理 l 通通过过各各种种测测量量、问问卷卷、调调查查和和观观察察等等方方法法从从研研究究对对象象处处直直接接收收集集到到的的科科研研资资料料,称称之之为为原原始始资资料料,也也叫叫第第一一手手资资料料,记记录录必必须须可可靠靠,不不可可自自行行更更改改并并应应完完整整保保存存。在在原原始始资资料料整整理理后后再再进进一一步步分析资料的价值和意义。分析资料的价值和意义。20统计学分析统计学分析l医学数据的统计处理涉及到医学专业医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经知识、统计专业知识、处理数据的经验和技巧等,是一门很高超的艺术。验和技巧等,是一门很高超的艺术。l在数据处理过程中,在数据处理过程中,原始数据的采集原始数据的采集和录入,数据的管理,恰当的选取统和录入,数据的管理,恰当的选取统计方法,熟练使用统计软件等计方法,熟练使用统计软件等,都是都是必须重视的关键环节。必须重视的关键环节。21例例1:冠心病病人冠心病病人编脂肪摄体重家族总胆编脂肪摄体重家族总胆号入量指数史固醇号入量指数史固醇非冠心病人非冠心病人编脂肪摄体重家族总胆编脂肪摄体重家族总胆号入量指数史固醇号入量指数史固醇1低低2高高3中中 30高高26.527.024.523.4有有7.88有有9.16无无5.67有有6.831低低2中中3中中 30高高24.123.524.625.2无无5.68有有3.21无无3.15无无3.0622或如下形式或如下形式:编脂肪摄体重家族总胆冠心病编脂肪摄体重家族总胆冠心病号入量指数史固醇否号入量指数史固醇否1低低2高高3中中 30高高1低低2中中3中中 30高高26.527.024.523.424.123.524.625.2有有7.881有有9.161无无5.671 有有6.831无无5.680有有3.210无无3.150 无无3.06023例例2:WBC前前后后体温体温前前后后病情病情前后前后阴阳性阴阳性前后前后12.5610.349.528.478.567.345.526.4738.537.936.839.236.5.37.035.936.224例例3WBC治疗前治疗后治疗前治疗后1天治疗后天治疗后3天治疗后天治疗后7天天12.5610.349.528.478.567.347.526.476.566.347.527.475.567.346.526.4025原始数据的录入原始数据的录入 l原始数据的记录形式原始数据的记录形式 l原始数据的录入方式原始数据的录入方式 26原始数据的记录形式原始数据的记录形式 l 医学研究的原始数据常列成类似下医学研究的原始数据常列成类似下表的二维结构,即行与列结构的数表的二维结构,即行与列结构的数据集形式。在表中,每一行称为一据集形式。在表中,每一行称为一个记录(个记录(record)或一个观察单位或一个观察单位(case););每一列称为一个变量每一列称为一个变量(variable),),用以表示变量、项目用以表示变量、项目或观察指标等。或观察指标等。2728原始数据录入工具原始数据录入工具 l 录入的文件类型大致有:数据库文件,如录入的文件类型大致有:数据库文件,如 dBASE、FoxBASE、Lotus、EPI info、Excel文件。统计应用软件,如文件。统计应用软件,如SPSS数据数据文件、文件、SAS数据文件、数据文件、STATA数据文件等。数据文件等。29原始数据录入原则原始数据录入原则l录人数据时,应遵循录人数据时,应遵循便于录入,便于核查,便便于录入,便于核查,便于转换,便于分析于转换,便于分析的原则。的原则。1.便于录入:是指尽可能地减少录入工作量便于录入:是指尽可能地减少录入工作量2.便于核查:是指一定要设有标识变量,以方便便于核查:是指一定要设有标识变量,以方便数据核查数据核查 3.便于转换:是指录入数据时要考虑不同软件对便于转换:是指录入数据时要考虑不同软件对字节和字符的要求字节和字符的要求 4.便于分析:是指每项研究最好录成一个数据文便于分析:是指每项研究最好录成一个数据文件,录入的格式最好满足各种统计分析的需要件,录入的格式最好满足各种统计分析的需要30数据处理中的几个问题数据处理中的几个问题l数据核查数据核查l离群数据的处理离群数据的处理l统计方法前提条件的检验统计方法前提条件的检验l选择统计方法的思路选择统计方法的思路31 数据核查数据核查 l逻辑检查逻辑检查l数据核对数据核对 采用双份录入的方式,然后用程序作一一采用双份录入的方式,然后用程序作一一 比较,不一致者一定是录错的数据。比较,不一致者一定是录错的数据。32离群数据的处理离群数据的处理l当个别数据与群体数据严重偏离时,被称当个别数据与群体数据严重偏离时,被称为为离群数据离群数据(outlier)或极端数据或极端数据(extreme value)。)。l统计软件一般都有判断离群数据的方法。统计软件一般都有判断离群数据的方法。最常用的最常用的方法方法是采用箱式图来判定是采用箱式图来判定。3334l离群数据可分为两种情况处理离群数据可分为两种情况处理:1.如果确认数据有逻辑错误,又无法纠正,如果确认数据有逻辑错误,又无法纠正,可直接删除该数据。可直接删除该数据。2.2.若数据并无明显的逻辑错误,可将该数若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,若结果不矛据剔除前后各做一次分析,若结果不矛盾,则不剔除;若结果矛盾,并需要剔盾,则不剔除;若结果矛盾,并需要剔除,必须给以充分合理的解释,例如用除,必须给以充分合理的解释,例如用何种方法确定偏离数据,该数据在实验何种方法确定偏离数据,该数据在实验中何种干扰下产生等。中何种干扰下产生等。35统计方法前提条件的检验统计方法前提条件的检验l 应用参数方法进行假设检验往应用参数方法进行假设检验往往要求数据满足某些前提条件,如往要求数据满足某些前提条件,如要求方差齐性、正态分布,因此需要求方差齐性、正态分布,因此需要做方差齐性检验和正态分布检验。要做方差齐性检验和正态分布检验。36选择统计方法的思路选择统计方法的思路第一个层面:看属于三种资料类型中的哪第一个层面:看属于三种资料类型中的哪 一种;一种;第二个层面:看单因素还是多因素;第二个层面:看单因素还是多因素;第三个层面:看单样本、两样本或多样本;第三个层面:看单样本、两样本或多样本;第四个层面:看是否是配对或配伍设计;第四个层面:看是否是配对或配伍设计;第五个层面:看是否满足检验方法所需的第五个层面:看是否满足检验方法所需的 前提条件。前提条件。37分析目的分析目的l比比较较差差异异:比比较较两两组组或或多多组组均均值值、率率或或中中位位数数有有无无差差异异(单单因因素素单单指指标)。标)。l研研究究相相关关与与回回归归:每每两两个个变变量量间间的的变变化化是是否否有有关关系系,其其数数量量上上的的函函数数形形式式如如何何(两两个个指指标标或或多多个个指指标标之之间关系)。间关系)。l多因素分析:多因素分析:研究多个因素对一个研究多个因素对一个变量的影响。变量的影响。38计量资料与等级资料计量资料与等级资料t检验检验t检验检验F检验检验配对配对t检验检验配伍配伍F检验检验秩和检验秩和检验偏态分布或等级资料偏态分布或等级资料正态分布正态分布频数表频数表5点法点法最小值最小值P25MP75最大值最大值正态分布正态分布等级资料等级资料偏态分布偏态分布统计推断统计推断统计描述统计描述计量资料或等级资料计量资料或等级资料39计数或无序分类资料计数或无序分类资料样本与总体率的比较样本与总体率的比较u样本率与构成的比较样本率与构成的比较2配对差异性比较配对差异性比较2趋势性趋势性2检验检验率率构成比构成比相对比相对比(OR值值或或RR值值)统计推断统计推断统计描述统计描述计数资料计数资料40生存时间的资料生存时间的资料l 若若因因变变量量Y为为生生存存时时间间,并并含含有有截截尾尾数数据据,自自变变量量只只有有一一个个处处理理因因素素,可可选选用用Kaplan-Meier法做生存分析法做生存分析。41相关与回归相关与回归l 当当资资料料是是正正态态分分布布时时:研研究究两两者者在在变变化化时时的的关关联联或或趋趋势势用用相相关关系系数数r,若若问问数数量量上上的的函函数数关关系系用用普普通通线线性性回归回归.l 当当资资料料不不是是正正态态分分布布时时:研研究究两两者者在在变变化化时时的的关关联联或或趋趋势势用用等等级级相相关关rs,若若问问数数量量上上的的函函数数关关系系用用秩秩回回归归.42相关与回归相关与回归l 曲曲线线回回归归分分析析 分分析析两两变变量量的的回回归归关关系系时时,若若两两变变量量呈呈曲曲线线趋趋势势,可可按按曲曲线线类类型型选选择择指指数数曲曲线线、多多项项式式曲曲线线、生生长长曲曲线线、LogisticLogistic曲曲线线等等。也也可可选选用用非非线性回归分析方法。线性回归分析方法。l 若若多多个个因因素素对对一一个个因因素素的的影影响响时时可可采采用用:多多元元线线性性回回归归、多多元元LogisticLogistic回回归或归或CoxCox回归。回归。43论文的撰写论文的撰写 l科研论文(科研论文(research paper)是科研工作是科研工作的书面总结。撰写论文是科研工作的最后的书面总结。撰写论文是科研工作的最后一个步骤,没有写出论文,任何研究工作一个步骤,没有写出论文,任何研究工作就不能称之为完成。就不能称之为完成。l论文要求立意要新,注意科学性,实事求论文要求立意要新,注意科学性,实事求是,取材要可靠和真实,方法和结果要经是,取材要可靠和真实,方法和结果要经得起重复验证。得起重复验证。l医学论文中的结构主要由医学论文中的结构主要由摘要、引言、材摘要、引言、材料与方法、结果、讨论料与方法、结果、讨论五个部分组成。五个部分组成。44 统计结果在论文中的正确表达统计结果在论文中的正确表达 l 在论文的在论文的“摘要摘要”部分,要报告处理组部分,要报告处理组与对照组的与对照组的最重要最重要均值(中位数、率)、标均值(中位数、率)、标准差(标准误)、准差(标准误)、P值,或两组最重要均数值,或两组最重要均数(率)之差(率)之差,95%可信区间可信区间(CI),OR值、多个值、多个观察指标的相关系数等。观察指标的相关系数等。l 重要的统计表达和解释主要集中在论文重要的统计表达和解释主要集中在论文的的“材料与方法材料与方法”、“结果结果”和和“讨论讨论”三三个部分。个部分。45“材料与方法材料与方法”的统计表达的统计表达 l描述研究描述研究对象的来源和选择方法对象的来源和选择方法,包括观察,包括观察对象的基本情况、有无随机分组(随机抽样)对象的基本情况、有无随机分组(随机抽样)、样本含量估计的依据等。、样本含量估计的依据等。l若进行了随机化分组,应说明具体的若进行了随机化分组,应说明具体的随机化随机化方法方法。l对于非随机化分组的观察性研究(含调查研对于非随机化分组的观察性研究(含调查研究),除要明确说明观察对象的选择方法外究),除要明确说明观察对象的选择方法外(如是否配对、随机抽样),还应给出影响(如是否配对、随机抽样),还应给出影响因素(如年龄、性别、病情)的因素(如年龄、性别、病情)的均衡性均衡性分析分析结果。结果。46分组分组观观 察察 例例 数数年龄年龄(岁)(岁)病程病程(年)(年)男男女女合计合计对照组对照组糖糖尿尿病病A A组组糖糖尿尿病病B B组组151510101919141414148 82929242427275959 1 10 06262 8 86767 7 74.44.4 3.3.2 26.86.8 3.3.9 947“材料与方法材料与方法”的统计表达的统计表达l 论文中采用的论文中采用的统计分析方法和统计软统计分析方法和统计软件件的名称也要说明。的名称也要说明。l 常用统计方法简单说明即可,如卡方常用统计方法简单说明即可,如卡方检验、检验、t检验、单因素方差分析检验、单因素方差分析(ANOVA)等,对一些特殊的统计方法,等,对一些特殊的统计方法,如协方差分析、因子分析、生存分析等,如协方差分析、因子分析、生存分析等,要给出相应的参考文献。统计计算软件一要给出相应的参考文献。统计计算软件一般给出名称即可。如般给出名称即可。如SPSSSPSS、SASSAS等。等。48“材料与方法材料与方法”的统计表达的统计表达l“材料与方法材料与方法”统计表达常见的问题:统计表达常见的问题:1.1.对研究对象的来源和选择方法不做任何对研究对象的来源和选择方法不做任何说明或只做非常简单的说明。说明或只做非常简单的说明。2.2.观察对比的研究只说明组间均衡,未给观察对比的研究只说明组间均衡,未给出反映均衡性的统计指标出反映均衡性的统计指标 3.3.对统计分析方法不做任何说明或说明有对统计分析方法不做任何说明或说明有误误 ,尤其对一些特殊的统计方法。,尤其对一些特殊的统计方法。4.4.实验选取或调查所得的样本量很小,却实验选取或调查所得的样本量很小,却不说明任何理由,等等。不说明任何理由,等等。49“结果结果”的统计表达的统计表达 l 1.统计表的应用:统计表的应用:l 2.数据的精确度数据的精确度:l 计量资料的统计指标(均值、标准计量资料的统计指标(均值、标准差、中位数、百分位数等)要保留的小差、中位数、百分位数等)要保留的小数位数,应该与原始数据记录的小数位数位数,应该与原始数据记录的小数位数相同;计数资料的百分比保留一位小数相同;计数资料的百分比保留一位小数,一般不超过两位小数。数,一般不超过两位小数。50“结果结果”的统计表达的统计表达l3.选择最能说明问题的统计指标选择最能说明问题的统计指标 计量资料常用计量资料常用均值均值 标准差标准差描述研描述研究结果的数据特征,但必须注意前提是究结果的数据特征,但必须注意前提是要求资料近似服从正态分布。当数据不要求资料近似服从正态分布。当数据不符合正态分布时,描述应采用适合偏态符合正态分布时,描述应采用适合偏态分布的中位数和四分位数间距有时称分布的中位数和四分位数间距有时称五五点法点法。51“结果结果”的统计表达的统计表达l4.计数资料常用的统计指标有率和构成比计数资料常用的统计指标有率和构成比(百分比)。医学论文中率与构成比应(百分比)。医学论文中率与构成比应用的主要问题之一是分母太小。分母太用的主要问题之一是分母太小。分母太小时,率(构成比)的可靠性不能保证。小时,率(构成比)的可靠性不能保证。在这种情况下,宜直接用绝对数进行描在这种情况下,宜直接用绝对数进行描述而不宜计算相对数。应用问题之二是述而不宜计算相对数。应用问题之二是将构成比误用为率来说明事物发生的强将构成比误用为率来说明事物发生的强度。度。52“结果结果”的统计表达的统计表达l假设检验结果的表达假设检验结果的表达 P值的表达:要逐渐改变把值的表达:要逐渐改变把P0.05记为记为“NS”,P0.05记为记为“*”,P0.01记记为为“*”的传统的传统P值的表达方式,提倡报值的表达方式,提倡报告告P P的具体数值,如的具体数值,如P=0.023P=0.023或或P=0.437P=0.437等,等,目的是考虑两类错误的大小。目的是考虑两类错误的大小。53“讨论讨论”的统计表达的统计表达l在论文的在论文的“讨论讨论”部分,通常要部分,通常要引用引用P值值,并,并对假设检验结果作出专业上的解释。对假设检验结果作出专业上的解释。lP P值的解释值的解释 P P值是在值是在“无效假设无效假设”正确的前正确的前提下,说明实际观察结果与提下,说明实际观察结果与“无效假设无效假设”吻吻合的概率。合的概率。P P值小则怀疑值小则怀疑“无效假设无效假设”的正确的正确性,性,P P值大则不能拒绝值大则不能拒绝“无效假设无效假设”。lP值大小只能说明统计学意义的值大小只能说明统计学意义的“显著显著”,不,不说明实际效果的说明实际效果的“显著显著”。因此,对于。因此,对于P P值的值的解释一定要解释一定要结合专业知识结合专业知识,并且有时用两均,并且有时用两均数(率)之差的可信区间反映出实际差别的数(率)之差的可信区间反映出实际差别的大小。大小。54