2022年医学统计学_总结_重点_笔记_复习资料 .docx
精品_精品资料_第一章2 选 1总体 : 总体 population就是依据讨论目的确定的同质观看单位 讨论对象 的全体 , 实际上就是某一变量值的集合.可分为有限总体与无限总体.总体中的全部单位都能够标识者为有限总体 , 反之为无限总体.总体 population依据讨论目的而确定的同质观看单位的全体.样本 : 从总体中随机抽取部分观看单位, 其测量结果的集合称为样本sample .样本应具有代表性.所谓有代表性的样本, 就是指用随机抽样方法获得的样本.样本 sample从总体中随机抽得的部分观看单位, 其实测值的集合.3 选 1小概率大事 : 我们把概率很接近于0 即在大量重复试验中显现的频率特别低 的大事称为小概率大事.P 值:P值即概率 , 反映某一大事发生的可能性大小.统计学依据显著性检验方法所得到 的 P 值反应结果真实程度 , 一般以 P 0 、05 认为有统计学意义 , P 0、01 认为有高度统计学意义 , 其含义就是样本间的差异由抽样误差所致的概率等于或小于0、 05 或 0、01.P 值就是 :1) 一种概率 , 一种在原假设为真的前提下显现观看样本以及更极端情形的概率.2) 拒绝原假设的最小显著性水平.3) 观看到的 实例的 显著性水平.4) 表示对原假设的支持程度, 就是用于确定就是否应当拒绝原假设的另一种方法.小概率原理 : 一个大事假如发生的概率很小的话, 那么可认为它在一次实际试验中就是不会发生的 , 数学上称之小概率原理, 也称为小概率的实际不行能性原理.统计学中, 一般认为等于或小于 0、05 或 0、01 的概率为小概率.资料的类型 3 选 1( 1)计量资料 : 对每个观看单位用定量的方法测定某项指标量的大小, 所得的资料称为计量资料 measurement data.计量资料亦称定量资料、测量资料.、其变量值就是定量的 , 表现为数值大小, 一般有度量衡单位.如某一患者的身高cm 、体重 kg 、红细胞计数10 12/ L 、脉搏 次/ 分 、血压 KPa 等.计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观看单位某项指标的大小, 而获得的资料.( 2)计数资料 : 将观看单位按某种属性或类别分组, 所得的观看单位数称为计数资料countdata .计数资料亦称定性资料或分类资料.其观看值就是定性的, 表现为互不相容的类别或属性.如调查某的某时的男、女性人口数; 治疗一批患者 , 其治疗成效为有效、无效的人数 ; 调查一批少数民族居民的A、B、 AB、O 四种血型的人数等.计量资料 enumeration data定性资料 qualitative data无序分类变量资料 unorderedcategorical variable名义变量资料 nominal variable为将观看单位按某种属性或类别分组计数, 分组汇总各组观看单位数后而得到的资料.( 3)等级资料 : 将观看单位按测量结果的某种属性的不同程度分组, 所得各组的观看单位数 , 称为等级资料 ordinaldata .等级资料又称有序变量.如患者的治疗结果可分为治愈、好转、有效、无效或死亡, 各种结果既就是分类结果, 又有次序与等级差别 , 但这种差别却不能精确测量 ; 一批肾病患者尿蛋白含量的测定结果分为+ 、+、+等.可编辑资料 - - - 欢迎下载精品_精品资料_等级资料 ranked datacategorical variable半定量资料 semi-quantitative data资料有序分类变量 ordinal为将观看单位按某种属性的不同程度分成等级后分组计数, 分类汇总各组观看单位后而得到的资料.等级资料与计数资料不同: 属性分组有程度差别 , 各组按大小次序排列.等级资料与计量资料不同: 每个观看单位未准确定量, 故亦称为半计量资料.两种误差 2 选 1抽样误差 sampling error 由于抽样而引起的总体指标 参数 与样本指标 统计数 之间的差异.抽样误差就是由个体变异或其它随机因素造成的, 就是不行防止的 , 但误差分布有规律可循 , 可进行估量与分析.系统误差 systematicerror:由于测量仪器结构本身的问题、刻度不精确或测量环境转变等缘由 , 在多次测量时所产生的, 总就是偏大或总就是偏小的误差, 称为系统误差.它带有规律性 , 经过校正与处理 , 通常可以削减或排除.统计的步骤 考填空题 , 四个空 统计工作的步骤 . 设计 : 设计内容包括资料收集、整理与分析全过程总的设想与支配.设计就是整个讨论中最关键的一环 , 就是今后工作应遵循的依据. . 收集资料 : 应实行措施使能取得精确牢靠的原始数据. . 整理资料 : 简化数据 , 使其系统化、条理化 , 便于进一步分析运算. . 分析资料 : 运算有关指标 , 反映事物的综合特点 , 阐明事物的内在联系与规律.分析资料包括统计描述与统计推断.试验设计的基本原就 考填空题 , 三个空 随机化原就、对比的原就、重复的原就.2 选 1参数 : 参数 就是指总体的统计指标, 如总体均数、总体率等.总体参数就是固定的常数.多数情形下, 总体参数就是不易知道的, 但可通过随机抽样抽取有代表性的样本, 用算得的样本统计量估量未知的总体参数.统计量 : 统计量 就是指样本的统计指标, 如样本均数、样本率等.样本统计量可用来估量总体参数.总体参数就是固定的常数, 统计量就是在总体参数邻近波动的随机变量.其次章频数表的制作步骤以及频数分布表的用途 问答题 频数分布表的编制步骤:例: 某市 1982年50名7岁男童的身高 cm 资料如下 , 试编制频数表.114、4117、2122、7124、0114、 0110、8118、2116、7118、9118、16123、5113、2118、3120、0120、3116、2114、 7119、7114、8119、119、8116、8119、8122、5119、 7120、7114、3122、0117、0122、5可编辑资料 - - - 欢迎下载精品_精品资料_119、7124、9126、1120、0124、 6120、0121、5114、3124、1117、23120、2121、8120、8118、7126、6121、5126、 1117、7124、1128、1、找出观看值中的最大值largestvalue、最小值 smallestvalue,求极差 range.极差等于最大值减最小值.本例最大值=128、 3, 最小值 =110、8, 就极差 =128、3-110 、8=17、5cm 2、确定分组数与组距class interval.组数的多少就是依据例数的多少来确定的, 以能够反映出频数分布的特点为原就, 一般分10 15组.组距为相邻两组的间隔, 组距 =极差 / 组数.本例拟分 10组, 就组距 =17、5/10=1 、75 2, 为划记便利 , 可取稍大或稍小的数 当然本例组距也可取 1、5 .3、确定组段.第一组段包括要最小值, 取较最小值稍小且划分便利的数, 本例取“ 110”.最终组段包括最大值并写出其上限值.4、划记.将各观看值以划“正”字的方法, 一笔代表一例 , 划在相应组段中.例如第一个数l14 、4应在组段“ 114”处划 , 其次个数 117、2应在“ 116”处划 , 以此类推.5、统计各组段的频数.全部数据划记完后, 清点各组段的人数.依据编制出的频数表即可明白该数值变量资料的频数分布特点.频数分布表的用途1、描述资料的分布特点与分布类型.频数分布有两个重要特点 : 集中趋势与离散趋势.大部分观看值向某一数值集中的趋势称为集中趋势 , 常用平均数指标来表示 , 各观看值之间大小参差不齐.频数由中心位置向两侧逐步削减 , 称离散趋势 , 就是个体差异所致 , 可用一系列的变异指标来反映.2、便于进一步运算有关指标或进行统计分析.当数据较多且需手工运算时, 常先编制频数表, 再进行统计运算.3、发觉特大、特小的可疑值.假如频数表的一端或两端显现连续几个组段的频数为零后, 又显现少数几个特大值或特小值, 使人怀疑其就是否精确, 需进一步检查与核对并做相应处理.4、据此绘制频数分布图.描述数据分布集中趋势的指标与描述数据分布离散程度的指标 考选择或者填空 .描述数据分布集中趋势的指标算术均数、几何均数、中位数. .描述数据分布离散程度的指标极差、四分位数间距、方差、标准差、变异系数.正态分布的特点 考选择题 、对图形的影响听从正态分布的变量的频数分布由、 完全打算.(1) 就是正态分布的位置参数, 描述正态分布的集中趋势位置.正态分布以x = 为对称轴 , 左右完全对称.正态分布的均数、中位数、众数相同, 均等于 .(2) 描述正态分布资料数据分布的离散程度, 越大 , 数据分布越分散 , 越小 , 数据分布越集中.也称为就是正态分布的外形参数, 越大 , 曲线越扁平 , 反之, 越小 ,曲线越瘦高.可编辑资料 - - - 欢迎下载精品_精品资料_标准正态分布 填空 221. 标准正态分布就是一种特别的正态分布, 标准正态分布的0, 1 , 通常用u 或Z 表示听从标准正态分布的变量, 记为 N0,1 .正态分布的应用 简答 某些医学现象 , 犹如质群体的身高、红细胞数、血红蛋白量, 以及试验中的随机误差, 出现为正态或近似正态分布; 有些指标 变量 虽听从偏态分布 , 但经数据转换后的新变量可服从正态或近似正态分布, 可按正态分布规律处理.其中经对数转换后听从正态分布的指标,被称为听从对数正态分布.1、 估量频数分布一个听从正态分布的变量只要知道其均数与标准差就可依据公式即可估量任意取值范畴内频数比例.2、 制定参考值范畴(1) 正态分布法适用于听从正态 或近似正态 分布指标以及可以通过转换后听从正态分布的指标.(2) 百分位数法常用于偏态分布的指标.表3-1 中两种方法的单双侧界值都应娴熟掌握.3、 质量掌握 : 为了掌握试验中的测量 或试验 误差 , 常以 作为上、下戒备值, 以 作为上、下掌握值.这样做的依据就是: 正常情形下测量 或试验 误差听从正态分布.4、 正态分布就是很多统计方法的理论基础.检验、方差分析、相关与回来分析等多种统计方法均要求分析的指标听从正态分布.很多统计方法虽然不要求分析指标听从正态分布 , 但相应的统计量在大样本时近似正态分布, 因而大样本时这些统计推断方法也就是以正态分布为理论基础的.医学参考值范畴的制定 运算题 确定参考值范畴的单双侧: 一般生理物质指标多为双侧、毒物指标就多为单侧.确定百分位点 : 一般取 95%或 99%.例题某市 20岁男同学 160人的脉搏数 次/ 分钟 , 经正态性检验听从正态分布.求得= 76、10,S =9 、32.试估量脉搏数的95%、99%参考值范畴.可编辑资料 - - - 欢迎下载精品_精品资料_解: 脉搏数的 95%正常值范畴为 :± 1、96 S=76、10 ± 1 、969 、32=57 、83 94、37脉搏数的 99%正常值范畴为 :±2、58 S =76 、10 ± 2 、589 、32=52 、05 100、37第三章标准误的概念 , 运算公式.标准误: 抽样讨论中 , 样本统计量与总体参数间的差别称为抽样误差samplingerror.统计上用标准误 standard error,SE来衡量抽样误差的大小, 即样本均数的标准差, 就是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度.t 分布的图形特点及其与正态分布的区分 简答 t 分布的图形特点1. 以 0 为中心 , 左右对称的单峰分布 ;2.t分布就是一簇曲线 , 其外形变化与n 准确的说与自由度 大小有关.自由度越小,t分布曲线越低平 ; 自由度越大 ,t分布曲线越接近标准正态分布u 分布 曲线.可编辑资料 - - - 欢迎下载精品_精品资料_t 分布对应于每一个自由度, 就有一条 t 分布曲线 , 每条曲线都有其曲线下统计量t 的分布规律 , 运算较复杂.t分布与正态分布比较的区分t分布与标准正态分布相比有以下特点: 都就是单峰、对称分布; t分布峰值较低 , 而尾部较高 ; 随自由度增大 ,t分布趋近与标准正态分布; 当趋向 ,t分布的极限分布就是标准正态分布.置信区间与参数估量 名解 2 选 1置信区间 : 在统计学中 , 一个概率样本的置信区间Confidenceinterval就是对这个样本的某个总体参数的区间估量.置信区间呈现的就是这个参数的真实值有肯定概率落在测量结果的四周的程度.给出的就是被测量参数的测量值的可信程度.1、对于具有特定的发生概率的随机变量, 其特定的价值区间 -一个确定的数值范畴 “一个区间” .2、在肯定置信水平常, 以测量结果为中心, 包括总体均值在内的可信范畴.3、该区间包含了参数真值的可信程度.4、参数的置信区间可以通过点估量量构造, 也可以通过假设检验构造.参数估量 : 指用样本指标值 统计量 估量总体指标值 参数 .参数估量有两种方法: 点估量与区间估量.可信区间与参考值范畴的不同点 简答 应留意 : 可信区间与参考值范畴的意义、运算公式与用途均不同.1、从意义与用途来瞧95参考值范畴就是指同质总体内包括 95个体值的估量范畴 , 而总体均数 95可信区间就是指按 95可信度估量的总体均数的所在范畴. 可信区间用于估量总体参数 , 总体参数只有一个 .参考值范畴用于估量变量值的分布范畴 , 变量值可能很多甚至无限 .2、从运算公式瞧如指标听从正态分布 ,95 参考值范畴的公式就是:± 1、96s.总体均数 95可信区间的公式就是:.前者用标准差 , 后者用标准误.前者用1、96, 后者用为 0、05, 自由度为 v 的 t 界值.可编辑资料 - - - 欢迎下载精品_精品资料_t 检验的应用条件与类型 填空 t 检验的应用条件: 要求各样原来自相互独立的正态总体且各总体方差齐.t 检验的类型 : 单样本 t 检验, 独立 t 检验 , 配对 t 检验配对设计与完全随机设计 名解 2 选 1完全随机设计 completely random design:完全随机设计仅涉及一个处理因素 但可为多水平 , 故又称单因素 one-way 设计. 它就是将受试对象按随机化的方法安排到各个处理组中, 观看试验效应 , 临床试验中的随机对比试验也属于此类设计.配对设计 paireddesign:就是将受试对象按肯定条件匹配成对, 再随机安排每对中的两个受试对象到不同处理组.配对的因素就是影响试验效应的主要非处理凶素.假设检验的基本求解步骤或者留意事项. 简答 2 选 1假设检验的基本步骤1、建立假设 , 确定检验水准假设有零假设 H0 与备择假设 H1 两个 , 零假设又叫作无效假设或检验假设.H0与 H1 的关系就是相互对立的 , 假如拒绝 H0, 就要接受 H1、依据备择假设不同 , 假设检验有单、双侧检验两种.检验水准用表示 , 通常取 0、05 或 0、10、检验水准说明白该检验犯第一类错误的概率.2、依据讨论目的与设计类型选择适合的检验方法这里的检验方法 , 就是指参数检验方法 , 有 u 检验、 t 检验与方差分析三种, 对应于不同的检验公式.对双样本资料, 要留意区分成组设计与配对设计的资料类型.假如资料里有" 配成对子 " 字样 , 或者就是对同一对象用两种方法来处理, 一般就可以判定就是配对设计资料.3、确定 P 值并作出统计结论u 检验得到的就是u 统计量或称 u 值,t检验得到的就是 t 统计量或称 t 值.方差分析得到的就是 F 统计量或称 F 值.将求得的统计量肯定值与界值相比, 可以确定 P 值.当 0、05 时,u 值要与 u 界值 1、96 相比较 , 确定 P 值.假如 u1、 96, 就 P 0、05、反之, 如 u 1、96, 就 P 0、05、t 值 要与某自由度的 t 界值相比较 , 确定 P 值.假如 t 值 t 界值 , 故 P 0、05、反之 , 如 t t 界值 , 就 P 0、05、相同自由度的情形下, 单侧检验的 t 界值 要小于双侧检验的t 界值 , 因此有可能显现算得的t 值大于单侧 t 界值 , 而小于双侧 t 界值的情形 , 即单侧检验显著 , 双侧检验未必就显著, 反之 , 双侧检验显著 ,单侧检验必定会 显著.即单侧检验更简洁显现阳性结论.当 P 0、05 时, 接受零假设 , 认为差异无统计学意义, 或者说二者不存在质的区分.当 P 0、05 时, 拒绝零假设 , 接受备择假设 , 认为差异有统计学意义 , 也可以懂得为二者存在质的区别.但即使检验结果就是P 0、01 甚至 P 0、001, 都不说明差异相差很大, 只表示更有把握认为二者存在差异.假设检验时应留意的事项 一 要有严密的抽样讨论设计; 样本必需就是从同质总体中随机抽取的; 要保证组间的均衡性与资料的可比性. 二 依据现有的资料的性质、设计类型、样本含量大小正确选用检验方法. 三 对差别有无统计学意义的判定不能肯定化, 因检验水准只就是人为规定的界限, 就是相对的.差别有统计学意义时, 就是指无效假设 h0 被接受的可能性只有5%或不到 5%,甚至不可编辑资料 - - - 欢迎下载精品_精品资料_到 1%,依据小概率大事一次不行能拒h0, 但尚不能排除有 5%或 1%显现的可能 , 所以可能产生第一类错误 ; 同样, 如不拒绝 h0, 可能产生其次类错误. 四 统计学上差别显著与否, 与实际意义就是有区分的.如应用某药治疗高血压, 平均降低舒张压 0、5kpa, 并得出差别有高度统计学意义的结论.从统计学角度 , 说明该药有降压作用 , 但实际上 , 降低 0、5kpa 就是无临床意义.因此要结合专业作出恰如其分的结论.第一类错误与其次类错误 名解 2 选 1型错误又称第一类错误type error:拒绝了实际上成立的, 为“弃真”的错误, 其概率通常用表示.可取单尾也可取双尾 , 假设检验时讨论者可以依据需要确定值大小 , 一般规定 0、05或 0、01, 其意义为 : 假设检验中假如拒绝时, 发生型错误的概率为 5或 1 , 即100次拒绝的结论中 , 平均有 5次或 1次就是错误的.型错误又称其次类错误type error:不拒绝实际上不成立的, 为“存伪”的错误 , 其概率通常用表示.只取单尾 , 假设检验时值一般不知道 , 在肯定情形下可以测算出 , 如已知两总体的差值 如 、样本含量与检验水准.以下图说明两类错误 :第四章为什么等级资料不行用方差分析?资料不相互独立可编辑资料 - - - 欢迎下载精品_精品资料_方差分析的基本思想应用条件 简答方差分析 analysis of variance,ANOVA 的基本思想就就是依据资料的设计类型, 即变异的不同来源将全部观看值总的离均差平方与sum of squares of deviations frommean,SS 与自由度分解为两个或多个部分, 除随机误差外 , 其余每个部分的变异可由某个因素的作用 或某几个因素的交互作用 加以说明 , 如各组均数的变异 SS 组间可由处理因素的作用加以说明.通过各变异来源的均方与误差均方比值的大小, 借助 F 分布作出统计推断 , 判定各因素对各组均数有无影响.方差分析的应用条件(1) 各样本就是相互独立的随机样本, 且来自正态分布总体.(2) 各样本的总体方差相等, 即方差齐性 homoscedasticity.第五章分类资料的统计描述 几个常用相对数指标填空题 率 强度相对数 , 频率相对数 、构成比、相对比应用相对数时应留意的问题 简答题 六条 运算相对数的分母一般不宜过小. 分析时不能以构成比代替率. 不能用构成比的动态分析代替率的动态分析. 对观看单位数不等的几个率, 不能直接相加求其总率. 在比较相对数时应留意可比性. 对样本率 或构成比 的比较应随机抽样, 并做假设检验.率的标准化的基本思想, 应留意的问题 分析题 率的标准化的基本思想:要比较两个总率时 , 发觉两组资料的内部构成 如年龄、性别构成等 存在明显不同 , 而且影响到了总率的结果, 这时就不宜再直接比较总率, 而应考虑采纳标准化法.标准化法的基本思想, 就就是采纳统一的标准 统一的内部构成 运算出排除内部构成不同影响后的标准化率 调整率 , 然后再进行比较.二、直接标准化法的运算方法当已知所比较资料各组率Pi, 可选用直接法运算标化率.三、间接标准化死亡比的运算方法当所比较的资料已知各自某现象总发生数r 及各分组观看单位数时, 宜采纳间接法运算标化率.第六章二项分布 ,Piosson分布 在什么条件下接近正态分布 选择或填空 可编辑资料 - - - 欢迎下载精品_精品资料_公式选择给个例题把为讨论静脉曲张就是否与肥胖有关, 观看 122对同胞兄弟 , 每对同胞兄弟中有一个属, 另一个属正常体重 , 记录得静脉曲张发生情形见表8-2, 试分析之. 评析 这就是一个配对设计的资料, 因此用配对检验公式运算.第七章 考运算题 配对与完全随机设计下的四格表的运算列四格表肥胖可编辑资料 - - - 欢迎下载精品_精品资料_第八章参数统计与非参数统计 名解 2 选11. 参数统计样本所来自的总体分布具有某个已知的函数形式 , 而其中有的参数就是未知的 , 统计分析的目的就就是对这些未知的参数进行估量或检验.此类方法称为参数统计.2. 非参数统计样本所来自的总体分布难以用某种函数式来表达 , 仍有一些资料的总体分布的函数式就是未知的 , 只知道总体分布就是连续型的或离散型的 , 解决这类问题的一种不依靠总体分布的详细形式的统计方法.由于这类方法不受总体参数的限制 , 故称非参数统计法non-parametric statistics,或称为不拘分布distribution-free statistics的统计分析方法 , 又称为无分布型式假定assumption free statistics的统计分析方法.它检验的就是分布 , 而不就是参数.非参数统计不需对总体分布 总体参数 作出特别假设.非参数统计的特点与适用范畴 简答1. 特点(1) 样本所来自的总体的分布形式为任何形式, 甚至就是未知的 , 都能适用.(2) 收集资料便利 , 可用“等级”或“符号”来评定观看结果.(3) 多数非参数方法比较简便, 易于懂得与把握.(4) 缺点就是缺失信息量, 适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能.2. 适用范畴(1) 等级资料.(2) 偏态分布资料.当观看资料呈偏态或极度偏态分布而又未作变量变换, 或虽经变量变换仍未达到正态或近似正态分布时, 宜用非参数检验.(3) 各组离散程度相差悬殊, 即方差明显不齐 , 且不能变换达到齐性.(4) 个别数据偏离过大 , 或资料为单侧或双侧没有上限或下限值.(5) 分布类型不明.(6) 初步分析.有些医学资料由于统计工作量大, 可采纳非参数统计方法进行初步分析,选择其中有意义者再进一步分析 包括参数统计内容 .(7) 对于一些特别情形 , 如从几个总体所获得的数据, 往往难以对其原有总体分布作出估量 , 在这种情形下可用非参数统计方法.非参数检验的优缺点 : 简答非参数统计与传统的参数统计相比, 有以下优点 :1、非参数统计方法要求的假定条件比较少, 因而它的适用范畴比较广泛.2、多数非参数统计方法要求的运算比较简洁, 可以快速完成运算取得结果, 因而比较节省时间.可编辑资料 - - - 欢迎下载精品_精品资料_3、大多数非参数统计方法在直观上比较简洁懂得, 不需要太多的数学基础学问与统计学学问.4、大多数非参数统计方法可用来分析如象由等级构成的数据资料, 而对计量水准较低的数据资料 , 参数统计方法却不适用.5、当推论多达 3个以上时 , 非参数统计方法尤具优越性.但非参数统计方法也有以下缺点:1、由于方法简洁 , 用的计量水准较低 , 因此, 假如能与参数统计方法同时使用时, 就不如参数统计方法敏锐.如为追求简洁而使用非参数统计方法, 其检验功效就要差些.这就就是说, 在给定的显著性水平下进行检验时, 非参数统计方法与参数统计方法相比, 第类错误的概率要大些.2、对于大样本 , 如不采纳适当的近似 , 运算可能变得特别复杂.注 意:凡符合或经过变换后符合参数检验条件的资料, 最好用参数检验.当资料不具备参数检验的条件时 , 非参数检验就是一种有效的分析方法.配对设计的符号秩与检验方法 简答(1) 假设 :H0: 差值总体中位数 Md=0 H1:Md 0 =0 、 05(2) 求差值(3) 编秩次 : 依差值的肯定值从小到大编秩次.编秩次时遇差数等于0, 舍去不计 , 同时样本例数减 1; 遇肯定值相等差数, 符号相同顺次编秩次 , 符号相反取平均秩次 , 且符号相反.(4) 求秩与并确定检验统计量: 分别求出正负秩次之与, 正秩与以 T+ 表示 , 负秩与的肯定值以 T- 表示. T+及T- 之与应等于 nn+1/2,任取 T+ 或 T- 作检验统计量 T .5 确定 P 值与作出推断结论 : 当 n 50 时, 查 T界值表 , 得出 P值.如检验统计量T值在上、下界值范畴内, 其 P值大于表上方相应概率水平其 P 值小于表上方相应概率水平.; 如 T 值在上、下界值上如范畴外,第九章线性相关系数 名解 线性相关系数 : 表示两个变数线性相关方向及程度的统计数或参数.又叫直线相关系数,简称相关系数. ,|R|的极值为 1,|R|越大 接近 1, 就直线关系越好.线性相关系数取值范畴 填空 -1 r 1样本相关系数 r 的假设检验 填空题 1r界值表法 ;2t检验法.线性相关或回来应用应留意的问题 简答 作回来分析与相关分析时要有实际意义, 不能把毫无关联的两种现象作回来、相关分析, 必需对两种现象间的内在联系有所熟悉.在进行回来分析与相关分析之前, 应绘制散点图.但观看点的分布有直线趋势时, 才相宜作回来、相关分析.假如散点图呈明显曲线趋势, 应使之直线化再行分析.散点图仍能提示资料有无可疑反常点.直线回来方程的应用范畴一般以自变量的取值范畴为限.如无充分理由证明超过自变量取值范畴外仍就是直线, 应防止外延.可编辑资料 - - - 欢迎下载精品_精品资料_医学统计学 _总结_重点 _笔记 _复习资料双变量的小样本经t检验只能推断两变量间有无直线关系, 而不能推断相关的紧密程度 , 要推断相关的紧密程度, 样本含量必需很大.相关或回来关系不肯定就是因果关系, 也可能就是相伴关系 , 有相关或回来关系不能证明事物间确有内在联系.秩相关的应用适用范畴 简答 秩相关 , 又称等级相关 rankcorrelation,就是用双变量等级数据作直线相关分析, 适用于以下资料 :不听从双变量正态分布而不宜作积差相关分析;总体分布型未知 ;用等级表示的原始数据.相关与回来的区分与联系 简答 区分 :1、意义 : 相关反映两变量的相互关系, 即在两个变量中 , 任何一个的变化都会引起另一个的变化 , 就是一种双向变化的关系.回来就是反映两个变量的依存关系, 一个变量的转变会引起另一个变量的变化, 就是一种单向的关系.2、应用 : 讨论两个变量的相互关系用相关分析.讨论两个变量的依存关系用回来分析.3、讨论性质 : 相关就是对两个变量之间的关系进行描述, 瞧两个变量就是否有关, 关系就是否亲密 , 关系的性质就是什么 , 就是正相关仍就是负相关.回来就是对两个变量做定量描述 , 讨论两个变量的数量关系, 已知一个变量值可以猜测出另一个变量值, 可以得到定量结果.4、相关系数 r 与回来系数 b :r 与b的肯定值反映的意义不同. r 的肯定值越大 , 散点图中的点越趋向于一条直线 , 说明两变量的关系越亲密 , 相关程度越高. b的肯定值越大 , 回来直线越陡 , 说明当 X变化一个单位时 ,Y 的平均变化就越大.反之也就是一样.联系 :1、 r 与b值可相互换算 ;2、 r 与b正负号一样 ;3、 r 与b的假设检验等价 ;4、 回来可说明相关.相关系数的平方r2 又称打算系数 就是回来平方与与总的离均差平方与之比 , 故回来平方与就是引入相关变量后总平方与削减的部分.回来系数的估量原就 : 最小二乘 least squares原就 填空 应用直线回来时的留意事项 简答 应用直线回来时的留意事项:1、作回来分析要有实际意义, 不能把毫无关联的两种现象作回来分析, 必需对两种现象间的内在联系有所熟悉.2、在进行直线回来分析之前, 应绘制散点图 , 当观看点的分布有直线趋势时, 才相宜作直线回来分析 , 散点图仍能提示资料有无反常点.反常点的存在往往对方程中的系数a 、b的估量产生较大影响.因此, 需对反常点进行复查.3、建立直线回来方程后, 要对系数进行假设检验, 以确定回来方程有无意义.4、直线回来方程的适用范畴一般以自变量的取值范畴为限, 防止外延.获得自变量值的手段也应与建立方程时相同.否就会产生较大偏差.可编辑资料 - - - 欢迎下载