医学统计学总复习.ppt
医学统计学总复习医学统计学总复习宁波大学医学院宁波大学医学院 沈其君沈其君医学统计学总复习医学统计学总复习在研究设计与资料分析中统计方法选择在研究设计与资料分析中统计方法选择统计方法选择的思路统计方法选择的思路统计方法的流程图统计方法的流程图教学中各类统计方法的应用条件教学中各类统计方法的应用条件几个容易混淆的基本概念几个容易混淆的基本概念统计方法选择的思路统计方法选择的思路l统计方法选择的四级思维统计方法选择的四级思维 资料类型资料类型 分布类型分布类型 设计类型设计类型 具具体条件体条件l统计分析的两个方面统计分析的两个方面 统计描述(统计指标与图表)统计描述(统计指标与图表)统计统计推断推断 统计方法的流程图统计方法的流程图资资料料资资料料类类型型数数值值变变量量正正态态 非正态非正态X,G,S,参考值范参考值范围围,统计图表等统计图表等线性相关与回归线性相关与回归统计推断统计推断r计算与检验计算与检验,Y=a+bX均数可信区间估计均数可信区间估计假设检验假设检验:t:t与与u u检验检验 方差分析方差分析M,QUQL,参考参考值范围值范围,统计图表统计图表等等秩和秩和检验检验等级相关等级相关有序有序多分多分类变类变量量构成比,中位数构成比,中位数两两分分类,类,无序无序多分多分类类二项二项分布分布率,相对比,率,相对比,构成比构成比假设检验假设检验两组率两组率比较:比较:u u检验与检验与卡方检验卡方检验多组率和两组或多组多组率和两组或多组构构成比比较:卡方检验成比比较:卡方检验配对两分类资料卡方检验配对两分类资料卡方检验参数估计参数估计正态正态近似法近似法直接查表法直接查表法统计方法应用条件和适用资料统计方法应用条件和适用资料集中趋势与离散趋势的统计指标集中趋势与离散趋势的统计指标t t检验与检验与u u检验检验方差分析方差分析 2 2检验检验非参数检验非参数检验线性相关与回归线性相关与回归集中趋势与离散趋势统计指标集中趋势与离散趋势统计指标 集中趋势集中趋势 离散趋势离散趋势正态分布正态分布 均数均数 方差、标准差方差、标准差对数正态对数正态 几何均数几何均数 几何标准差几何标准差偏态等偏态等 中位数中位数 四分位数间距四分位数间距变异系数:在两组或多组资料变异度比较变异系数:在两组或多组资料变异度比较组间单位不同组间单位不同组间均数相差较大组间均数相差较大思思 考考 题题l完全随机设计实验资料如何作假设完全随机设计实验资料如何作假设检验检验?l配对试验设计资料如何进行假设检配对试验设计资料如何进行假设检验验?t t检验与检验与u u检验的应用条件检验的应用条件l两组数值变量资料比较;两组数值变量资料比较;l小样本时用小样本时用t t检验,要求资料为随机样本检验,要求资料为随机样本并服从正态分布;并服从正态分布;l大样本时用大样本时用u u检验,仍要求资料为随机样检验,仍要求资料为随机样本,但正态性条件可以放宽;本,但正态性条件可以放宽;l在两样本均数比较的在两样本均数比较的t t和和u u检验中,要求检验中,要求两组总体方差相等,即方差齐性;两组总体方差相等,即方差齐性;l组间要求具有均衡可比性。组间要求具有均衡可比性。方差分析的应用条件l多组多组定量资料的比较定量资料的比较l观察值为独立随机样本,并服从正态分观察值为独立随机样本,并服从正态分布;布;l样本较大时正态性条件可以放宽;样本较大时正态性条件可以放宽;l方差齐性方差齐性l组间可比性组间可比性 2检验的适用资料检验的适用资料两两组样本率的比较;组样本率的比较;多组样本率的比较;多组样本率的比较;两组或多组构成比的比较;两组或多组构成比的比较;配对设计下两分类资料检验。配对设计下两分类资料检验。非非参数检验的适用资料参数检验的适用资料l有序多有序多分类资料(双向有序,且分类属分类资料(双向有序,且分类属性相同);性相同);l极度偏态分布;极度偏态分布;l分布不规则和未知分布资料;分布不规则和未知分布资料;l数据变异较大,方差不齐数据变异较大,方差不齐线性相关与回归的应用条件线性相关与回归的应用条件散点图有线性趋势;专业上要求分析两变量间关系密切程度 和变化方向,通过一个变量预测或控制另一变量;两变量服从双变量正态分布,或X可以精确测量的,Y服从正态分布。几个容易混淆的基本概念几个容易混淆的基本概念l样本与总体样本与总体l资料(变量)类型资料(变量)类型l相对数指标:构成比、率、相对比相对数指标:构成比、率、相对比l统计图类型统计图类型l统计图的适用条件统计图的适用条件l统计表统计表几个容易混淆的基本概念几个容易混淆的基本概念1 1、抽样误差与标准误、抽样误差与标准误抽样研究才有抽样误差抽样研究才有抽样误差抽样误差的概念抽样误差的概念标准误是衡量抽样误差大小的指标标准误是衡量抽样误差大小的指标2 2、标准差与标准误关系、标准差与标准误关系联系:离散度指标,计算上的联系联系:离散度指标,计算上的联系区别:描述对象不同,意义与应用不同区别:描述对象不同,意义与应用不同 与与n n的关系不同的关系不同几个容易混淆的基本概念几个容易混淆的基本概念3 3、参考值范围与可信区间关系、参考值范围与可信区间关系联系:均为一个数值范围联系:均为一个数值范围区别:意义不同,区别:意义不同,与与 同一资料两范围的不同同一资料两范围的不同4 4、假设检验的意义、假设检验的意义 是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同(不能推断差别大小)。几个容易混淆的基本概念几个容易混淆的基本概念5 5、检验假设与检验结论、检验假设与检验结论无效假设与备择假设(单双侧);无效假设与备择假设(单双侧);是对总体所作,是对总体所作,H H0 0假设总体相同或两者假设总体相同或两者无关,检验方法建立于此;无关,检验方法建立于此;对检验方法的对检验方法的H H0 0与与H H1 1作总结;作总结;检验结论有统计结论与专业结论;检验结论有统计结论与专业结论;是针对检验假设(总体)而作的;是针对检验假设(总体)而作的;几个容易混淆的基本概念几个容易混淆的基本概念6 6、检验水准、检验水准 与与P P值值q 是预先确定的,是预先确定的,表示在拒绝表示在拒绝H H0 0时时可能犯错误的最大概可能犯错误的最大概率,属于第一类错误;率,属于第一类错误;qP P值是指由值是指由H H0 0规定的总体中进行随机抽样,所观察到的规定的总体中进行随机抽样,所观察到的等于及大于(或等于及小于)现有样本统计量(如等于及大于(或等于及小于)现有样本统计量(如u u值)值)的概率,也可表示为在拒绝的概率,也可表示为在拒绝H H0 0时可能犯错误的实际概时可能犯错误的实际概率大小;率大小;q 与与P P值间的关系:值间的关系:P P ,接受接受H H0 0,差异无统计学意义;差异无统计学意义;P P ,拒绝拒绝H H0 0,接受接受H H1 1,差异有统计学意义差异有统计学意义几个容易混淆的基本概念几个容易混淆的基本概念7 7、自由度确定、自由度确定能够自由选择其数值的变量个数;能够自由选择其数值的变量个数;总结各类统计方法的自由度计算;总结各类统计方法的自由度计算;8 8、单侧与双侧、单侧与双侧正常值范围估计中单双侧的选取;正常值范围估计中单双侧的选取;组间比较的假设检验中单双侧选取;组间比较的假设检验中单双侧选取;几个容易混淆的基本概念几个容易混淆的基本概念9 9、多组比较问题、多组比较问题卡方检验与秩和检验中有多组比较问题卡方检验与秩和检验中有多组比较问题检验思路是先作总的比较,再作两两组检验思路是先作总的比较,再作两两组间比较;注意间比较;注意H H1 1。几个容易混淆的基本概念几个容易混淆的基本概念11 11、线性相关与线性相关系数、线性相关与线性相关系数前提是散点图有线性趋势;前提是散点图有线性趋势;两变量线性关系密切程度和变化方向;两变量线性关系密切程度和变化方向;检验的意义与检验的意义与 r r值的意义;值的意义;1212、线性回归与线性回归系数、线性回归与线性回归系数前提是散点图有线性趋势;前提是散点图有线性趋势;配线求直线回归方程;配线求直线回归方程;线性回归系数线性回归系数b b意义;意义;几个容易混淆的基本概念几个容易混淆的基本概念13、率、构成比与相对比(相对数)率与比不能相混淆总率与平均率的概念率的标准化法14、方差分析中变异的分拆SS总=SS组间+SS组内 总=组间+组内SS总=SS处理+SS区组+SS误差 总=处理+区组+误差几个容易混淆的基本概念几个容易混淆的基本概念1515、完全随机设计与配对设计、完全随机设计与配对设计l完全随机设计是将研究对象随机分为两完全随机设计是将研究对象随机分为两组或多组;组或多组;l配对设计是将研究对象按一定条件配成配对设计是将研究对象按一定条件配成对子,再随机分到两组,随机区组设计对子,再随机分到两组,随机区组设计为多组;为多组;l组间均衡性与统计方法不同;组间均衡性与统计方法不同;l应用上不同;应用上不同;