统计方法选择与结果解释.ppt
《统计方法选择与结果解释.ppt》由会员分享,可在线阅读,更多相关《统计方法选择与结果解释.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于关于统计方法方法选择与与结果解果解释现在学习的是第1页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松第一节第一节 统计方法的正确选择统计方法的正确选择 现在学习的是第2页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松一、统计方法选择的基本思路一、统计方法选择的基本思路二、统计分析需注意的若干问题二、统计分析需注意的若干问题现在学习的是第3页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松数据特征数据特征数据特征数据特征样本含量样本含量样本含量样本含量研究目的研究目的研究目的研究目的对比组数对比组数对比组数对比组数设计类型
2、设计类型设计类型设计类型资料类型资料类型资料类型资料类型 综合判断综合判断现在学习的是第4页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松 1.研究目的研究目的uu一一一一是是是是通通通通过过过过比比比比较较较较,回回回回答答答答观观观观测测测测指指指指标标标标的的的的差差差差别别别别是是是是否否否否归归归归因因因因于于于于处处处处理理理理因因因因素素素素或或或或分分分分组组组组因因因因素素素素,在在在在本本本本教教教教材材材材范范范范围围围围内内内内所所所所涉涉涉涉及及及及的的的的主主主主要要要要是是是是单单单单变变变变量量量量问问问问题。题。题。题。uu二二二二是是
3、是是分分分分析析析析变变变变量量量量之之之之间间间间是是是是否否否否存存存存在在在在某某某某种种种种联联联联系系系系,这这这这主主主主要要要要涉涉涉涉及及及及相相相相关关关关分分分分析析析析和和和和回回回回归归归归分分分分析析析析,在在在在本本本本教教教教材材材材范范范范围围围围内内内内所所所所涉涉涉涉及及及及的的的的主主主主要要要要是是是是双双双双变量问题。变量问题。变量问题。变量问题。现在学习的是第5页,共87页表表表表1.1.两种方法检测两种方法检测两种方法检测两种方法检测1212名妇女最大呼气率名妇女最大呼气率名妇女最大呼气率名妇女最大呼气率(L/min)(L/min)结果结果结果结果
4、现在学习的是第6页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松组别组别有效有效无效无效合计合计甲药甲药271845乙药乙药40545合计合计672390表表2.甲、乙两药治疗小儿上消化道出血的效果甲、乙两药治疗小儿上消化道出血的效果 现在学习的是第7页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松2.设计类型设计类型 从实验研究设计来看,常见的设计类型为从实验研究设计来看,常见的设计类型为完全随机设计完全随机设计(成组设计成组设计成组设计成组设计)配对或配伍设计配对或配伍设计配对或配伍设计配对或配伍设计(随机区组设计随机区组设计)现在学习的是第
5、8页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松 FF两样本两样本两样本两样本(成组成组成组成组)t t 检验检验检验检验FF单因素单因素单因素单因素(完全随机设计完全随机设计完全随机设计完全随机设计)方差分析方差分析方差分析方差分析FF卡方检验卡方检验卡方检验卡方检验(独立样本独立样本独立样本独立样本)FF两两两两样样样样本本本本WilcoxonWilcoxon秩秩秩秩和和和和检检检检验验验验或或或或多多多多样样样样本本本本Kruskal-WallisKruskal-Wallis秩秩秩秩和检验和检验和检验和检验对对完全随机设计完全随机设计的数据,应选择相应的方法:的
6、数据,应选择相应的方法:现在学习的是第9页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松FF配对配对配对配对t t检验检验检验检验FF配伍组配伍组配伍组配伍组(随机区组随机区组随机区组随机区组)设计方差分析设计方差分析FF配对卡方检验配对卡方检验配对卡方检验配对卡方检验F配配对对(符符号号秩秩和和检检验验)或或配配伍伍设设计计的的秩秩和和检检验验(Friedman秩和检验秩和检验)等。等。等。等。对于对于配对或配伍设计配对或配伍设计的数据,应选择相应的方法的数据,应选择相应的方法:现在学习的是第10页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松
7、3.资料类型资料类型v对于对于定量变量定量变量,选择它所对应的统计方法?,选择它所对应的统计方法?v对于对于定性变量定性变量,选择它所对应的统计方法?选择它所对应的统计方法?现在学习的是第11页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松4.数据特征数据特征 对对于于同同一一设设计计类类型型和和同同一一资资料料类类型型,仍仍然然有有许许多方法可以选择。多方法可以选择。现在学习的是第12页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松表表表表3.3.九九九九个测定点用甲、乙两种方法的测定结果个测定点用甲、乙两种方法的测定结果个测定点用甲、乙两种方
8、法的测定结果个测定点用甲、乙两种方法的测定结果(g/m(g/m3 3)现在学习的是第13页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松t检检验验和和方方差差分分析析属属参参数数检检验验方方法法,对对数数据据要要求求较较高高,通通常要求数据服从常要求数据服从正态分布正态分布和和方差齐性方差齐性。如如果果服服从从该该条条件件或或经经变变量量变变换换后后服服从从条条件件,则则采采用用参参数检验数检验方法,否则采用秩和检验这类方法,否则采用秩和检验这类非参数检验非参数检验方法。方法。能否不考虑分布和方差齐性问题,直接采用非参数检验?现在学习的是第14页,共87页医医 学学 统
9、统 计计 学(第二版)学(第二版)李晓松李晓松5.对比组数对比组数v单组问题单组问题(样本与与已知总体参数比较样本与与已知总体参数比较)v两组问题两组问题v多组多组(3组或以上组或以上)比较比较注注意意,多多组组比比较较在在差差别别有有统统计计学学意意义义时时,需需再再进进行两两比较。行两两比较。现在学习的是第15页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松6.样本含量样本含量FF在样本较小时:在样本较小时:在样本较小时:在样本较小时:uu如如如如果果果果是是是是一一一一个个个个样样样样本本本本率率率率与与与与总总总总体体体体率率率率的的的的比比比比较较较较,可可可
10、可采采采采用用用用直直直直接接接接计计计计算算算算概概概概率率率率的的的的方方方方法法法法如如如如基基基基于于于于二二二二项项项项分分分分布布布布的的的的确确确确切切切切概概概概率率率率法。法。法。法。uu如如如如果果果果是是是是四四四四格格格格表表表表资资资资料料料料则则则则采采采采用用用用FisherFisher确确确确切切切切概概概概率率率率法法法法或或或或校校校校正正正正卡方检验。卡方检验。卡方检验。卡方检验。uu对于均数比较问题,一般情况下采用对于均数比较问题,一般情况下采用对于均数比较问题,一般情况下采用对于均数比较问题,一般情况下采用t t检验。检验。检验。检验。FF在大样本时:
11、在大样本时:在大样本时:在大样本时:可考虑可考虑可考虑可考虑Z Z检验检验检验检验作近似。作近似。作近似。作近似。现在学习的是第16页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松F在在实实际际工工作作中中,遇遇到到的的实实际际问问题题可可能能并并非非如如此此简简单单,须须结结合合专专业业问问题题和和所所要要分分析析的的具具体体内内容容加加以以综综合合考考虑虑和和仔仔细细判判断断,有有时时需需对对各各种种统计方法加以综合运用。统计方法加以综合运用。现在学习的是第17页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松此外:此外:v当当分分析析目目的的
12、是是分分析析变变量量之之间间是是否否存存在在某某种种联联系系时时,这这就就涉涉及及到到双双变变量量的的分分析析方方法法,即即相相关关关关系系或或回归关系回归关系的分析。的分析。v需注意相关分析和回归分析的需注意相关分析和回归分析的区别与联系区别与联系现在学习的是第18页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松关联性分析:关联性分析:vv对对对对于于于于定定定定量量量量变变变变量量量量,需需需需根根根根据据据据两两两两个个个个变变变变量量量量是是是是否否否否满满满满足足足足双双双双变变变变量量量量正正正正态态态态分分分分布布布布,相相相相应应应应地地地地采采采采用用
13、用用PearsonPearson积积积积矩矩矩矩相相相相关关关关分分分分析析析析或或或或SpearmanSpearman秩秩秩秩相相相相关分析。关分析。关分析。关分析。vv对于对于对于对于等级变量等级变量等级变量等级变量则直接采用则直接采用则直接采用则直接采用SpearmanSpearman秩相关分析。秩相关分析。秩相关分析。秩相关分析。现在学习的是第19页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松v对分类变量,常计算列联系数进行分析对分类变量,常计算列联系数进行分析 对对对对于于于于RC C表表表表资资资资料料料料,需需需需注注注注意意意意区区区区分分分分是是是是
14、单单单单向向向向有有有有序序序序或或或或者是者是者是者是双向有序双向有序对对于于一一个个二二分分类类变变量量和和一一个个等等级级变变量量之之间间的线性关联通常采用线性趋势卡方检验的线性关联通常采用线性趋势卡方检验现在学习的是第20页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松表表表表4.4.某市不同年级中学生吸烟率某市不同年级中学生吸烟率某市不同年级中学生吸烟率某市不同年级中学生吸烟率 年级年级年级年级调查人数调查人数调查人数调查人数(n n)吸烟人数吸烟人数吸烟人数吸烟人数(t t)吸烟率吸烟率吸烟率吸烟率(%)(%)初一初一初一初一144144171711.811
15、1.81初二初二初二初二148148191912.8412.84初三初三初三初三135135252518.5218.52高一高一高一高一157157414126.1126.11高二高二高二高二168168555532.7432.74高三高三高三高三139139727251.8051.80合计合计合计合计891891229229现在学习的是第21页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松生存分析:生存分析:v是是一一类类较较为为特特殊殊的的针针对对具具有有截截尾尾数数据据的的生生存存时间数据所进行的分析时间数据所进行的分析v针对分组和未分组资料,方法有所不同针对分组
16、和未分组资料,方法有所不同现在学习的是第22页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松多变量的数据分析:多变量的数据分析:vv多多多多重重重重线线线线性性性性回回回回归归归归是是是是对对对对反反反反应应应应变变变变量量量量为为为为定定定定量量量量变变变变量量量量进进进进行行行行的的的的多多多多变变变变量量量量分析分析分析分析vvLogisticLogistic回回回回归归归归是是是是对对对对反反反反应应应应变变变变量量量量为为为为分分分分类类类类变变变变量量量量所所所所进进进进行行行行的的的的多多多多变变变变量量量量分析分析分析分析vvCoxCox比比比比例例例例
17、风风风风险险险险回回回回归归归归是是是是对对对对反反反反应应应应变变变变量量量量为为为为含含含含有有有有截截截截尾尾尾尾数数数数据据据据的的的的生生生生存时间存时间存时间存时间所进行的分析所进行的分析所进行的分析所进行的分析现在学习的是第23页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松一、统计方法选择的基本思路一、统计方法选择的基本思路二、统计分析需注意的若干问题二、统计分析需注意的若干问题现在学习的是第24页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松1.数据分析通常的步骤数据分析通常的步骤 数据探测数据探测统计描述统计描述统计推断统计推
18、断现在学习的是第25页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松数据探测数据探测v数数据据分分布布特特征征、方方差差齐齐性性、散散点点图图绘绘制制、离离群群值值的的发发现现,以以及及了了解解数数据据是是否否符符合合特特定定统统计计方方法法的的应应用用条条件件等等,必必必必要要要要时时时时可可可可进进进进行行行行变变变变量量量量变变变变换换换换或或或或转转转转换换换换以以以以满满满满足足足足分分分分析析析析的的的的需要。需要。需要。需要。vv数数数数据据据据探探探探测测测测将将将将增增增增加加加加对对对对数数数数据据据据的的的的基基基基本本本本了了了了解解解解,为为为
19、为进进进进一一一一步步步步的的的的分分分分析析析析奠定基础。奠定基础。奠定基础。奠定基础。现在学习的是第26页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松统计描述统计描述vv统计描述内容?统计描述内容?统计描述内容?统计描述内容?vv注意首先要区分注意首先要区分注意首先要区分注意首先要区分变量类型变量类型变量类型变量类型现在学习的是第27页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松统计推断统计推断 在在数数据据探探测测和和统统计计描描述述的的基基础础上上选选择择恰恰当当的的统计推断方法分析资料统计推断方法分析资料。现在学习的是第28页,共8
20、7页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松v区间估计:区间估计:总总总总体体体体均均均均数数数数区区区区间间间间估估估估计计计计:可可采采用用t t t t分分分分布布布布或或或或正正正正态态态态分分分分布布布布原原原原理进行估计理进行估计理进行估计理进行估计总总体体率率区区间间估估计计:可可可可采采采采用用用用二二二二项项项项分分分分布布布布、PoissonPoisson分分布或正态分布原理进行估计布或正态分布原理进行估计现在学习的是第29页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松2.混杂因素的控制混杂因素的控制v非研究因素非研究因素的的“
21、可比性可比性”问题问题v可可比比性性好好,各各组组观观测测指指标标之之间间的的差差异异只只能能归归因因于研究因素而不是其它原因于研究因素而不是其它原因现在学习的是第30页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松v如如果果各各组组在在研研究究因因素素之之外外的的某某种种或或某某些些因因素素有有所所不不同同,那那么么这这个个或或这这些些其其它它因因素素的的效效应应就就可可能能同同研究因素的效应混淆在一起研究因素的效应混淆在一起v在在这这种种情情况况下下,通通常常的的统统计计分分析析结结论论在在进进行行因因果果推推断时断时常常是不可靠的常常是不可靠的常常是不可靠的常常是
22、不可靠的现在学习的是第31页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松v对对于于非非研研究究因因素素不不具具可可比比性性的的资资料料,应应采采用用统统计调整技术计调整技术消除那些因素的影响消除那些因素的影响vv对对对对于于于于具具具具有有有有多多多多个个个个变变变变量量量量的的的的复复复复杂杂杂杂情情情情况况况况,则则则则需需需需采采采采用用用用多多变变量量分析分析技术加以调整技术加以调整技术加以调整技术加以调整现在学习的是第32页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松分析阶段控制混杂因素可采用:分析阶段控制混杂因素可采用:1)分层分
23、析分层分析2)标准化法标准化法3)协方差分析协方差分析4)多重回归多重回归现在学习的是第33页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松1)分层分析分层分析Example:研究吸烟与健康的关系:研究吸烟与健康的关系吸烟与非吸烟者死亡率的比较吸烟与非吸烟者死亡率的比较现在学习的是第34页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松 吸吸烟烟者者与与不不吸吸烟烟者者死死亡亡率率的的直直接接比比较较可可能能存存在在问问题题因为:因为:v吸吸烟烟者者多多为为男男性性,而而男男性性比比女女性性更更易易患患心心脏脏病病而而发发生生死死亡亡,吸吸烟烟者者
24、与与未未吸吸烟烟者者之之间间死死亡亡率的差异也许是因为率的差异也许是因为性别性别的差异的差异 现在学习的是第35页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松v为了排除这种可能性,可以为了排除这种可能性,可以性别性别性别性别因素分层,再因素分层,再因素分层,再因素分层,再比较吸烟与非吸烟者的死亡率:比较吸烟与非吸烟者的死亡率:比较吸烟与非吸烟者的死亡率:比较吸烟与非吸烟者的死亡率:v男性人群中,吸烟与不吸烟者进行比较男性人群中,吸烟与不吸烟者进行比较v女性人群中,吸烟与不吸烟者进行比较女性人群中,吸烟与不吸烟者进行比较现在学习的是第36页,共87页医医 学学 统统 计
25、计 学(第二版)学(第二版)李晓松李晓松F年年龄龄可可能能又又是是另另外外一一个个混混杂杂因因素素,这这就就需需要要对年龄进行分层分析:对年龄进行分层分析:男男男男 40404040岁岁岁岁 40404040岁岁岁岁女女女女 40404040岁岁岁岁 40404040岁岁岁岁现在学习的是第37页,共87页医医 学学 统统 计计 学(第二版)学(第二版)李晓松李晓松 以以以以上上上上是是是是通通通通常常常常的的的的分分分分层层层层分分分分析析析析思思思思路路路路,但但但但这这这这并并并并不不不不能能能能保保保保证证证证这样分析的结论一定是正确的这样分析的结论一定是正确的这样分析的结论一定是正确的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 方法 选择 结果 解释
限制150内