欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年统计学知识点整理贺佳.docx

    • 资源ID:57627956       资源大小:279.51KB        全文页数:14页
    • 资源格式: DOCX        下载积分:4.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要4.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年统计学知识点整理贺佳.docx

    精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思1、同质:医学讨论对象具有的某种共性称为同质;2、变异:对于同质的讨论对象,其变量之间的差异称为变异;3、个体:无论用何种方式收集资料,都要依据讨论的目的确定观看单位,又成个体,4、总体:依据讨论目的,全部同质的观看单位某项观看值得全体成为总体;5、样本:来自于总体的部分观看单位的观测值称为样本;6、样本含量:抽取的观看值的个数称为样本含量;7、参数:总体中全部观测值所得的特点值称为参数;8、统计量:由样本获得的统计指标称为统计量;9、抽样误差:统计学中,这种由抽样与变异引起的样本统计量与总体参数的差异,或者不同的样本的样本 统计量之间的差别,称为抽样误差;10、观看单位的讨论特点称为变量,变量的观看结果称为变量值,多个变量值汇成资料;11、随机变量:随机试验结果的全部取值称为随机变量或变量;12、频率:在相同的条件下,独立的重复n 次试验,随机试验的某一结果A 显现 f 次,就称 f/n 为结果 A显现的频率;13、概率:当n 逐步增大时,频率f/n 始终在一个常数左右微小摇摆,称该常数为A 显现的概率;14、频数:当汇总大量的原始数据时,把数据按类型分组(组段)数;15、正偏态:集中位置偏向小的一侧叫正偏态,又叫右偏态 16、负偏态:集中位置偏大的一侧叫负偏态,又叫左偏态,其中每个组的数据个数,称为该组的频17、医学参考值:医学参考值又称临床参考值,指绝大多数“正常人 ” 的各种生理、生化指标、组织代谢产 物及人体对各种试验的反应值等测量值的分布范畴;18、结构相对数,又称构成比:表示事物内部某一部分的观看单位数与该事物各组成部分的观看单位总数 之比,用以说明各构成部分在总体中所占的比重或分布;19、相对比简称比(ratio),是两个有关指标之比,说明两指标间的比例关系;20、强度相对数,又称为率:说明单位时间内某现象发生的频率或强度;21、定基比:报告期指标与基线期指标之比;22、环比:报告期指标与前一期指标之比;23、标准化法:要正确比较两种疗法的合计治愈率,必需先将两组治疗对象的病型构成依据统一标准进行校正,然后运算出校正后的标准化病死率再进行比较;这种用统一的内部构成,然后运算标准化率的方法,称为标准化法 24、辛普森悖论( Simpson paradox):在某种条件下,在分组比较中都占优势的一方,在总体评判中却并不 占优势;25、动态数列:是一系列按时间次序排列起来的统计指标(可以为肯定数,相对数或平均数),用以观看和 比较该事物在时间上的变化和进展趋势;26、平均进展速度,是各环比进展速度的几何平均数,说明某事物在一个较长时期中逐期(如逐年)平均 进展的程度;27、平均增长速度,是各环比增长速度的平均数,说明某事物在一个较长时期中逐期平均增长的程度;28、抽样误差:在总体中随机抽样,由于个体间存在差异,抽得的样本运算出的指标不太可能恰好等于总 体指标,因此通过样本推断总体总会有误差;这种由个体差异产生、随机抽样造成的样本统计量与总体参 数间的差异以及样本统计量间的差异,称为抽样误差;29、标准误:即样本均数的标准差,可用于衡量抽样误差的大小;30、均数的标准误:样本均数的标准差也称为均数的标准误 31、参数估量:是指由样本统计量估量总体参数,包括点估量和区间估量两种方法;32、置信区间,通常由两个数值即可信限构成;其中较小的值称可信下限,较大的值称可信上限,一般表名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思示为 L U;33、可信区间:依据样本均数,依据预先给定的概率 数值范畴,这个范畴称为总体均数的可信区间;1 称为置信度所确定的包含未知总体参数的一个34、P 的含义是指从H0 规定的总体随机抽样,抽得等于及大于 或/和等于及小于 现有样本获得的检验统计量如 t、 u 等值的概率;35、检验效能( power):1- ,当两总体确有差别,按检验水准 所能发觉这种差别的才能36、 I 型错误:当假设检验结论为拒绝 H0 时,有可能拒绝了事实上成立的 H0,此类错误称为 I 型错误37、II 型错误:当假设检验不拒绝 H0 时,有可能没有拒绝了事实上不成立的 H0,此类错误称为 II 型错误38、组间变异:各组的均数与总均数间的差异, 反映处理因素不同水平之间的作用,以及随机误差;39、组内变异:每组的各个原始数据与该组均数的差异 ,反映了观看值的随机误差;40、方差齐性:各样本的总体方差相等;41、参数检验:假定随机样原来自某已知分布 的方法;如正态分布 的总体 ,推断两个或两个以上总体参数是否相同42、单变量统计:用于比较某肯定量变量 平均值 在两组或多组之间的差别如:t 检验、方差分析43、双变量关系的统计:在医学科研中 ,人们常常要讨论两个变量之间的相互联系和相互依存关系;44、简洁回来:双变量直线回来是回来分析中最基本、最简洁的一种,故又称简洁回来45、相关系数又称 Pearson积差相关系数, 用来说明具有直线关系的两变量间相关的亲密程度与相关方向;46、残差 residual或剩余值,即实测值 Y 与假定回来线上的估量值 Y 的纵向距离;47、 I 型回来:一是其中一变量为选定变量,另一变量为随机变量,要求选定变量在取值范畴内取某值时,另一变量的取值是随机的,这类回来称为 I 型回来;48、 II 型回来:两个变量都是随机变量,要求两变量中任一变量在某一取值时,另一变量取值是随机的,并且成正态分布,称双随机变量正态分布,这类回来称为 II 型回来;49、b 为回来系数,即直线的斜率;*b 的统计学意义是:X 每增加 或削减 一个单位, Y 平均转变的单位数;50、打算系数:定义为回来平方和与总平方和之比46、试验讨论:是指讨论者依据讨论目的认为地对试验单位设置干预措施,依据对比、重复、随机化的基本原就,掌握非干预措施的影响,通过对试验结果的分析,评判干预措施的成效47、试验设计包括专业设计和统计设计两部分48、处理因素: 依据讨论的目的而确定欲施加或欲观看的,并能引起受试对象产生直接或间接效应的因素;49、试验效应:是处理因素作用于受试的反应,是讨论结果的最终表达,也是试验讨论的核心内容;50、标准对比:是对比组采纳现有标准方法或常规方法,或不特地设立对比组,而以标准值或正常值作为对比;51、相互对比:是不特地设立对比组,而是试验组之间互为对比;52、重复测量资料:是指不同处理条件下同一受试对象的同一观看指标在不同时间点上进行多次测量所得的资料;53、滞留效应:前面的处理效应有可能滞留到下一次的处理;54、潜隐效应:前面的处理效应有可能激活原本以前不活跃的效应;55、学习效应:由于逐步熟识试验,讨论对象的反应才能有可能逐步得到了提高;56、协方差:是用来度量两个变量之间“ 协同变异” 大小的总体参数,即两个变量相互影响大小的参数,协方差的肯定值越大,两个变量相互影响越大;57、修正均数:假定协变量取值固定在其总均数时的观看变量 Y 的均数;58、协方差分析:将回来分析与方差分析相结合的一种分析方法;59、多重线性回来: 用回来方程定量的刻画一个因变量Y 与多个自变量X1,X2,X3.Xn 间的线性依存关系,称为多重线性回来;名师归纳总结 - - - - - - -第 2 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思60、哑变量:就是把定性资料(如多分类变量和等级变量)数量化后转化为定量资料的一种方法;61、生存分析:是用来分析生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法;62、生存时间:是指临床随访讨论中,从某起点大事到某终点大事所经受的时间跨度,常用符号 t 表示;63、起点大事:也称起始大事,是反映生存时间起始特点的大事64、终点大事:也称失效大事 ,指讨论者所关怀的讨论对象的特定结局,65、完全数据:指在整个随访讨论期间能够观看到终点大事,即从起点至终点大事发生(如死于所讨论疾病)所经受的时间数据,它供应的时间信息是完整精确的;66、截尾数据:指在随访过程中,由于某种缘由未能观看到终点大事,即从起点至截尾点所经受的时间数据,是一种不完整数据;删失缘由主要包括:失访、退出、终止(观看期终止时病人仍未显现结局)等;67、生存概率:记作 p,表示某单位时段开头时存活的个体,到该时段终止时仍存活的可能性;68、生存率又称累积生存率,指观看对象经受 t 个时段后仍存活的概率,69、死亡概率:某单位时段期初的观看对象在该单位时段内死亡的可能性大小;70、死亡率:单位时间内讨论对象的死亡频率或强度;71、死亡函数:记作 Ft,指观看对象的生存时间 T 小于等于某时刻 t 的概率;72、死亡密度函数记作 ft ,指观看对象在某时刻 t 的瞬时死亡率;73、风险函数( hazard function):表示已生存到时刻 t 的观看对象在时刻 t 的瞬时死亡率;74、中位生存期又称半数生存期,表示恰好有 后越好;中位生存期越短,预后越差;50的个体尚存活的时间;中位生存期越长,表示疾病的预75、诊断试验:临床上为给病人作出诊断(即确定或排除疾病)所应用的各种试验或检查方法;76、灵敏度: 真阳性率, 是指患者中诊断为阳性的概率,77、特异度: 真阴性率, 指非患者中诊断为阴性的概率,反映真实情形为有病时诊断试验发觉疾病的才能;反映真实情形为无病时诊断试验排除疾病的才能;78、假阳性率:亦称误诊率,指非患者错判为阳性的概率;79、假阴性率:亦称漏诊率,指患者错判为阴性的概率;80、似然比:患者人群中试验结果的概率与无病人群中试验结果概率之比;81、阳性似然比:即真阳性率与假阳性率之比值;是说明病人中显现某种检测结果阳性的概率是非病人的多少倍82、阴性似然比: 假阴性率与真阴性率之比值;说明病人中显现某种检测结果为阴性的概率是非病人的多少倍;83、约登指数是反映诊断试验真实性的综合评判指标;YI=Se+Sp-1=1- 漏诊率 -误诊率 YI 越大说明诊断试验真实性越好, YI 小于或等于 0,表示诊断试验无任何临床应用价值;84、一样率又称符合率、真实度,是样本的诊断结果与实际情形相符合的概率;85、 Kappa 值表示两种试验结果的一样性的程度;86、猜测值是依据诊断试验的结果来估量个体患病和不患病的可能性大小;87、阳性猜测值:表示阳性结果中真正患病的概率;88、阴性猜测值:表示阴性结果中真正未患病的概率;89、平行(并联)试验:同时多个试验进行诊断,有一个结果为阳性就判为患者;可提高 Se,但 Sp 会下降,误判率增加;90、系列(串联)试验:同时多个试验进行诊断,全部结果为阳性者才能判为患者,可提高 Sp,但 Se 会下降,漏判率增加;一般先简洁后复杂;91、ROC 曲线:以假阳性率为横坐标,以真阳性率为纵坐标绘制而成的曲线,其曲线下面积的大小说明白诊断试验精确度的大小;简答:1、医学统计学的讨论步骤四个步骤:统计设计、收集资料、整理资料、分析资料;名师归纳总结 - - - - - - -第 3 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思2、频数分布表的用途 描述频数分布的类型、描述计量资料分布的集中趋势和离散趋势、便于发觉一些特大或特小的可疑值、便 于进一步做统计分析和处理3、正态分布的应用 制定医学参考值范畴、统计质量掌握、正态分布具有许多良好的性质4、标准差的主要意义和用途(1)描述资料的离散趋势(2)用于运算变异系数(3)用于运算标准误(4)结合均值与正态分布的规律估量参考值范畴5、应用相对数的留意事项 运算相对数应有足够数量即分母不宜太小、不能以构成比代替率、正确运算合计率、留意资料的可比性、对比不同时期资料应留意客观条件是否相同、样本率(或构成比)的比较应做样本率(或构成比)假设检 验;6、应用相对数的留意事项(1)运算相对数应有足够数量即分母不宜太小(2)不能以构成比代替率(3)正确运算合计率(4)留意资料的可比性( 5)对比不同时期资料应留意客观条件是否相同(率(或构成比)假设检验;7、标准化法的基本思想是:6)样本率(或构成比)的比较应做样本采纳某影响因素的统一标准构成以排除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性;8、统计表的结构(1)标题;概括表的主要内容 ,位于表的上方 ,通常需注明讨论的时间与地点;(2)标目;包括横标目和纵标目 ,分别相当于表格的主语和谓语 ,有单位时要标明;横标目位于表的左侧 ,说明每一行数字的特点 ;纵标目位于表的右侧 ,说明每一列数字的含义;编制正确的统计表 ,横标目和纵标目连起来通常是一句通顺的话;( 3)线条; 简洁的统计表通常采纳三条或四条线表示,即顶线、 底线、 纵标目下的横线 ,如有合计项就应在合计项上面加一横线;复杂的统计表可再增加横线把多重纵标目分隔开;( 4)数字;表中一律采纳阿拉伯数字表示;许多字用 “ -” 表示 ,数字缺失用 “ ” 表示 ,数字为 0 时肯定要填写为 “ 0” ,同一指标小数点位数要一样、位次要对齐; (5)备注在表内需说明处用“.” 号标记 ,并在表的下方用备注说明;9、编制统计表的留意事项(1) . 标题应概括表的主要内容 ,标题前面通常应加以编号 ,如表中的数值单位都一样时可把单位统一写在标题后面;(2) . 标目应文字简明 ,层次清晰;( 3). 线条不宜过多 ,特殊是不能有竖线和斜线;(4) . 表中不宜留空格; (5) . 备注不为表的必备内容;10、统计图的结构(1)标题 简明扼要地说明图的主要内容 ,置于图的正下方并加以编号 ,一般需注明时间、地点; ( 2)图域即制图空间 ,一般用直角坐标系第一象限的位置表示图域 圆图除外 ,纵横比例一般以 5 7 为宜;纵轴和横轴一般要有刻度 ,横轴尺度由左向右、纵轴尺度自下而上; ( 3)标目 包括纵标目和横标目 ,分别表示纵轴和横轴代表的指标 ,有度量衡单位时要标明; (4)图例 常置于图的右上角或图的正下方;11、绘制统计图的留意事项对图中不同颜色或图案代表的事物进行说明;图例通(1)第一应依据资料的性质和讨论目的,挑选合适的统计图; (2)比较不同事物时,要用不同的线条、图案或颜色表示 ,并用图例说明; ( 3)同一个统计图中 0 开头;( 5)绘制直方图时组距应相等;12、 t 分布的图形与特点 以 0 为中心,左右对称的单峰分布;,线条和图案不宜过多; (4)条图、直方图的纵轴坐标应从t 分布曲线是一簇曲线,其形状变化与自由度的大小有关;名师归纳总结 - - - - - - -第 4 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思自由度越小,就t 值越分散, t 分布曲线的峰部越矮而尾部翘得越高;说明尾部面积(概率P)就越大;与u 分布曲线相比, t 分布低平;自由度逐步增大时,t 分布逐步靠近u 分布 标准正态分布 ;当趋于时, t 分布即为 u 分布;13、15、假设检验与置信区间的关系(1)、置信区间可用于回答假设检验的问题(16、方差分析的基本思想和应用条件2)假设检验可供应置信区间不能供应的信息;依据资料的设计类型,即变异的不同来源,将全部观看值总的离均差平方和和自由度分解为两个或多个部分,除随机误差外, 其余每个部分的变异可由某个因素的作用加以说明,通过比较不同来源变异的均方( MS,方差),借助 F 分布做出统计推断,从而明白该因素对观看指标有无影响;应用条件:各样本是相互独立的随机样本;各样原来自正态分布;各样本方差相等,即方差齐;28、 R× C 表 2 检验的应用留意事项(1)行× 列表的 2 检验要求理论频数不宜太小,要求不宜有1/5 以上的格子的理论频数小于5,或有一个理论频数小于1;(2) .假如以上条件不能满意,可采纳:增加样本含量、删去某行或某列、合理地合并部分行或列、用精确概率法(3)多个率或构成比比较的 2 检验, 结论为拒绝 H0 时,仅表示几组有差别, 并非任 2 组之间都有差别;如要明白之,可进行 2 表的分割;(4)单向有序列联表,如效应有强弱的等级,如 +,+,+ ,最好采纳后面的秩和检验; 2 检验只能反映其构成比有无差异,不能比较效应的平均水平;(5)行列两种属性皆有序时,可考虑趋势检验或等级相关分析;29、 2 检验的用途(1)推断两个或多个总体率之间有无差别(2)推断两个或多个总体构成比之间有无差别(3)两个变量之间有无关联性( 4)频数分布的拟合优度检验31、参数检验的特点主要有 : 对总体参数 如 或 进行估量或检验是统计推断的主要目的 ; 要求总体分布已知;如连续性资料符合正态分布 ,计数资料符合二项分布或 Poisson 分布等 ; 统计量有明确的理论依据 如 t 分布、 u 分布 ; 有严格的使用条件;参数检验要求总体分布符合正态分布、总体方差齐和数据间相互独立;32、非参数检验的主要优点:名师归纳总结 - - - - - - -第 5 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思适用范畴广受限条件少具有稳健性方法简便 ,易于懂得和把握;33、秩和检验的应用范畴很广 ,主要用于 : 样本所代表的总体分布不易确定 ;分布呈非正态而又无适当的数据转换方法 ;观看指标不能或未加精确测量 ,如有序分类资料等样本的假设检验问题 ,均可用非参数统计方法;43、最小二乘法原就:即保证各实测点至直线的纵向距离的平方和最小;44、线性回来资料的要求(1)直线相关分析要求 X 与 Y 听从双变量正态分布;(2)直线回来要求至少对于每个 X 相应的 Y 要听从正态分布,X 可以是听从正态分布的随机变量,也可以是能精确测量和严格掌握的非随机变量;(3对于双变量正态分布资料,依据讨论目的可挑选由X 估量 Y 或者由Y 估量X ,一般情形下两个回来方程不相同) ;45、相关与回来的区分与联系区分: 在资料要求上 ,回来分析要求应变量 Y 变量 听从正态分布的随机变量 ,自变量 X 变量 可以是固定的非随机变量 ,一般称为型回来模型;当两个变量 X、 Y 为听从双变量正态分布的随机变量时 ,这种资料如要进行回来分析 ,一般称为型回来模型;联系 1. 对一组数据如同时运算 r 和 b,它们的正负号是一样的 ,r 为正 ,说明两变量间的相互关系是同向变化的; b 为正 ,说明 X 增加一个单位 ,Y 平均增加 b 个单位; 2.r 和 b 的假设检验是等价的 ,即对同一样本 ,二者的 t 值相等;由于 r 的假设检验既可直接查表 ,运算又比较便利 ,而 b 的假设检验运算较繁 ,故在实际应用中常以 r 的假设检验代替对 II 型回来模型中 b 的假设检验;45、试验设计的基本要素(1)处理因素( 2)受试对象( 3)试验效应46、试验对象分为四类: ( 1)动物试验( 2)临床试验( 3)现场试验( 4)社区试验47、试验效应指标挑选要求(1)客观性:主观指标和客观指标;(2)灵敏性和特异性: (3)精确性:48、试验设计的基本原就:对比原就;随机化原就;重复原就49、完全随机设计优点:( 1)设计简洁; (2)易于实施;( 3)显现缺失值时,仍可进行统计分析;缺点:( 1)受试对象随机化后,因个体变异的客 观存在,小样本完全随机分组后,可能会显现两组间不均衡;(2)试验检验效率不高(如与随机区组设计相比),且只能分析单因素;50、配对设计和完全随机设计相比优点:抽样误差较小,试验效率较高,所需样本量也较小;缺点:当配对条件未能严格掌握造成配对失败或配对欠佳时,反而会降低效率;51、常见的对比有:空白对比、试验对比、标准对比、自身对比、相互对比和历史对比等;52、随机化通常借助运算机产生的随机数字或用随机数字表实现;随机化包括:随机化抽样、随机分组和随机试验次序;53、重复是指在相同试验条件下对同一观测指标进行多次重复观测,以提高试验的牢靠性和科学性,重复的作用是估量试验误差和降低试验误差;54、影响样本量估量的因素有:(5)资料类型和单双侧检验;(1) I 型错误 ;( 2) II 型错误 ;(3)容许误差 ;(4)总体标准差 ;55、前后测量设计与配对设计的区分名师归纳总结 - - - - - - -第 6 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思56、重复测量资料方差分析的应用条件:(1)正态性:处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数听从正态分布;(2)方差齐性:相互比较的各处理水平的总体方差相等,即具有方差齐同;(3)“ 球对称” :各时间点组成的协方差阵 covariance matrix 具有球形性 sphericity 特点,即“ 球对称”57、重复测量设计的优缺点优点:每一个个体作为自身的对比,克服了个体间的变异;分析时可更好地集中于处理效应;因重复测量设计的每一个个体作为自身的对比,所以讨论所需的个体相对较少,因此更加经济;缺点:滞留效应 Carry-over effect:前面的处理效应有可能滞留到下一次的处理;潜隐效应 Latent effect:前面的处理效应有可能激活原本以前不活跃的效应;学习效应 对象的反应才能有可能逐步得到了提高;58、协方差分析的基本思想Learning effect:由于逐步熟识试验,讨论将那些对观看指标 Y (应变量)有影响的定量变量 X 作为协变量,建立应变量 Y 随协变量 X 变化的线性回来关系,并利用这种回来关系把 X 值化为相等后再进行各组 Y 的修正均数( adjusted mean)间比较的假设检验;59、应用协方差分析的条件一是与方差分析的应用条件相同: ( 1)各样本必需是相互独立的立即样本( 2)各样原来自正态分布总体 ( 3)各总体方差相等,即方差齐性;二是回来系数有统计学意义且回来系数相同;60、多重线性回来的应用(1)统计猜测与估量(2)统计掌握( 3)影响因素分析61、多重线性回来应用条件(1Y 与 X1,X2.Xm 之间具有线性关系; ( 2)各观测值 Yi ( i 1,2, 3.n之间相互独立; (3)残差服从均数为 0,方差为 2 的正态分布;62、 Logistic 回来模型的应用条件(1)满意独立性,即各观看单位间相互独立,因此不适用传染病、遗传性疾病或家簇集合性疾病等的发病因素讨论;( 2) Logit ( P)与自变量成线性关系,自变量是二分类变量时不需考虑,当自变量为连续性或等级变量时,需检验该条件是否成立,条件不成立需探讨自变量 入模型;(3)自变量之间不存在多重共线性;63、 Logistic 回来的意义:X 合适的量化形式,以便呈线性关系后纳多重线性回来是讨论一个正态随机应变量 Y 和多个自变量 X 的数量关系;应变量 Y 是连续性随机变量,要求应变量 Y 与 X 呈线性关系并满意相应条件;但在医学讨论中常讨论应变量或称反应变量 Y 为二分类变量(如患病与未患病、阴性与阳性等)或多分类变量(如治疗成效:痊愈、有效、无效等)布的条件,这时线性回来分析就显得无能为力,这是线性回来分析就显得无能为力,而 logistic 回来(logistic regression )分析就是处理该类资料的有效方法;64、生存资料的主要特点:名师归纳总结 - - - - - - -第 7 页,共 8 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思(1)疗效指标既有结局变量,又有时间变量;(2)随访讨论中,讨论对象可能会失访或死于其他疾病,或者中途退出试验; (3)由于讨论经费和时间限制,不行能等到全部观看对象都显现结局才终止讨论;这样势必有部分观看对象的信息是不完整的;65、生存率与生存概率的区分:生存概率是单个时段的结果;生存率实质上是累积条件生存概率,是多个时段的累积结果66、截尾的主要缘由:失访、退出、终止等67、 ROC 曲线的意义名师归纳总结 (1)ROC 曲线反映了灵敏度与特异度间的平稳增加灵敏度将降低特异度; 增加特异度将降低灵敏度;( 2)第 8 页,共 8 页在 ROC 曲线空间,假如曲线沿着左边线,然后沿着上边线越紧密,就试验精确度越高;( 3)在 ROC 曲线空间,假如曲线沿着机会线(45 度对角线)越紧密,就试验精确度越低;( 4)在诊断界值( cutpoint )处的正切线的斜率就是该试验值对应的阳性似然比(likelihood ratio ,LR ;在 ROC 曲线空间的左下角LR+最大,随着曲线从左下往右上方移动,LR+ 逐步减小;(5)ROC 曲线下面积是重要的试验精确度指标;- - - - - - -

    注意事项

    本文(2022年统计学知识点整理贺佳.docx)为本站会员(H****o)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开