欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年卫生统计学考试重点总结复习.docx

    • 资源ID:27295152       资源大小:99.89KB        全文页数:15页
    • 资源格式: DOCX        下载积分:4.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要4.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年卫生统计学考试重点总结复习.docx

    精选学习资料 - - - - - - - - - 一、绪论1.总体:依据讨论目的确定的同质观看单位的全体,准确的说是同质的全部观看单位某种变 量值的集合;2.样本:从总体中随机抽取部分观看单位所组成的集合;3.参数:用样本的指标来推算或估量出来的,用来说明总体情形的统计指标;4.统计量:依据观看值运算出来的量,是用来描述和分析样本的统计指标;5.变量的类型及其转换:定性变量: a.分类变量(计数资料)i.二分类变量 ii. 多项无序分类 b.有序变量(等级资料)定量变量: a.连续型变量 b.离散型变量 变量只能由“ 高级” 向“ 低级” 转化:定量有序 分类 二值;6.概率:是描述随机大事发生的可能性大些的数值;7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、说明和表达数据,目的是求得牢靠的结果;8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来讨论医学资料的搜 集、整理、分析与推断的一门学科;9.卫生统计学的讨论对象:有变异的事物;10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料;11.同质:指同一总体中个体的性质、影响条件、背景相同或特别相近;12.变异:同一总体内的个体间存在差异又是肯定的,这种现象称为变异;13.误差可分为:系统误差、随机测量误差、抽样误差;14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与 总体参数之间可能存在差异,这种差异称为抽样误差;二、定量资料的统计描述1.频率分布表的编制步骤:运算极差R、确定组段数与组距(一般为8-15 组)、确定各组段的上下限、列表;2.频率分布表的用途:揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式;便于进一步运算统计指标和进行统计分布处理;便于发觉某些特大和特小的可疑值;当样本含量比较大时,可用各组段的频率作为概率的估量值;3.中位数:指将原始观看值从小到大或从大到小排序后,位次居中的那个数;4.四分位数间距:表示百分位数P75 和百分位数P25 之差,定义为Q=P75-P25,恰好包括总体中 50%的个体观看值,用来描述偏态分布资料的离散趋势的指标;5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,就离 散度大,标准差小,就离散度小;6.变异系数: 变异的大小S 相对于其平均水平X 的百分比, 主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较;三、定性资料的统计描述1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示;=某一组成部分的观看单位数/同一事物内部各组成部分的观看单位总数×100%2.相对数的类型:名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - 频率型指标:近似的反映某一大事显现的机会大小,如发病率、死亡率;=某大事发生的个体数/可能发生某大事的个体数×K 强度型指标:反映单位时间段内某现象发生的频率,多用于大人群长时间随访的资料,如人时发病率、人时感染率;=某大事发生的个体数 /(可能发生某大事的个体数×时间) ×K 相对比型指标:是 AB 两个有联系的指标之比,对比的两个指标可以性质相同,也可以 不同;=A 指标 /B 指标(常见男女性别比)3.应用相对数时的留意事项:防制概念混淆;运算相对数时,分母应有足够的数量;正确的合并估量频率型指标;相对数的对比应留意可比性;对样本相对数的统计推断,应进行参数估量和假设检验;留意率和构成比之间的差别;4.标准化法的基本思想:标准化法是指当比较两个或多个总率时,如比较的两组或多组内部构成明显不同,需按统一指标进行调整,使之具有可比性的方法;基本思想: 采纳统一标准构成以排除某因素的内部构成不同对总率的影响,使通过标准化 后的标准化率具有可比性;四、统计表和统计图1.统计表的种类:简洁表、复合表;2.统计图的分类:条图:用等宽直条的长度来表示参加比较的指标的大小,分为单式和复式两种;表示指 标数值的坐标尺度必需从 0 点开头;百分条图:用于表示事物中各部分的比重或构成;圆图:同上;线图:用线段的升降来表示统计指标的变化趋势,或某现象随另一现象的变迁情形,适 用于连续型变量资料;纵横的尺度可以不从 0 开头,一般纵横比例 5:7;对半数线图:用于表示事物的进展速度(相对比);散点图:用点的密集程度、趋势表示两变量间的相对关系,直方图:常用于表示连续型变量资料的频数或频率分布;纵轴的刻度必需从 0 点开头;统计地图:主要用于表示某种现象在地域空间上的分布,依据不同地方某种现象的数值大小, 采纳不同密度的线条或不同颜色绘在地图上,有助于分析该现象的地理分布特点,为进一步讨论供应线索;箱式图: 用于描述连续型变量资料的分布特点,它表现连续型变量资料的5 个百分位数,即 P2.5、P25、P50、P75、P97.5;3.统计表的构成:标题、标目、线条、数字和备注;五、常用的概率分布:1.二项分布的图形特点:高峰在 =n 处或邻近; 为 0.5 时,图形是对称的; 离 0.5 愈远,对称性愈差; 对同一 ,随着 n 的增大,分布趋于对称;当n时,只要 不太靠近0 或者 1,二项分布趋于对称;名师归纳总结 - - - - - - -第 2 页,共 8 页精选学习资料 - - - - - - - - - 2.Poisson 分布的特性:Poisson 分布的总体均数与总体方差相等,均为 ;Poisson 分布的观看结果有可加性;3.正态分布的图形特点:关于 x= 对称;在 x= 处取得该概率密度函数的最大值,在 x= ± 处有拐点;曲线下面积为 1; 打算曲线在横轴上的位置, 增大,曲线沿横轴向右移;反之, 越小,曲线沿横轴 向左移; 打算曲线的外形,当 均衡定时, 越大,数据越分散,曲线越“ 矮胖”; 越小,数据越集中,曲线越“ 瘦高”;4.正态分布的应用:概率估量确定医学参考值范畴试验误差的质量掌握统计处理方法的理论基础5.95%医学参考值范畴:指特定的“ 正常” 人群的解剖、生理、生化指标及组织代谢产物含 量等数据中 95%个体的取值所在的范畴;6.二项分布的应用:概率估量、累积概率运算;7.Poisson 的应用:概率估量、累积概率运算;8.二项分布、 Poisson 分布、正态分布的区分与联系:二项分布、 Poisson 分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连 续型概率分布,用密度函数和分布函数描述其分布状况;Poisson 分布可以视为 n 很大而 n 很大而 和 1- 都不是很小的时候二项分布渐近正态分布,但 很小的二项分布;当 20 的时候 Poisson 分布渐近正态分布;六、参数估量基础1.抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本 统计量与相应的总体参数往往是不同的,这种差异称为抽样误差;2.标准误:用于表示均数抽样误差的指标叫样本均数的标准差,也称样本均数的标准误;3.参数估量:统计学中通过抽样来估量总体参数,称为参数估量;4.样本均数的标准误与原变量的标准差的区分:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小;样本均数的标准误 与原变量的标准差的区分在于:前者是表示均数变异的指标,后者是表示观看值变异的指标;两者的联系是,当样本量 n 肯定时,标准误随标准差的大小而变化;5.t 分布是总体均数的区间估量和假设检验的基础;6.t 分布图形的特点:单峰分布,以 0 为中心,左右对称; 越小, t 值越分散,曲线的峰部越矮,尾部越高;随着 逐步增大, t 分布逐步接近标准正态分布;线;t 分布不是一条曲线,而是一簇曲线,当 n 确定时, t 分布为一条曲7.置信区间:按预先给定的概率 1-,估量总体参数的可能范畴,该范畴就称为总体参数的 1- 置信区间;8.区间估量:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的 范畴,该范畴称为总体参数的置信区间;9.CI 的两个要素:精确度:反映置信度1- 的大小,即区间包含总体均数的概率大小;精度: 反映区间的长度,在置信区间确定的情形下,提高样本例数可以提高精度;名师归纳总结 - - - - - - -第 3 页,共 8 页精选学习资料 - - - - - - - - - 七、假设检验基础1.假设检验:由样本信息对相应总体进行推断时,对所估量的总体第一提出假设,然后通过样本数据去推断是否拒绝这一假设,与样本指标之间有无差别;2.假设检验的原理:称为假设检验, 即检验样本指标与总体指标或样本指标反证法思想: 第一提出假设, 用适当的统计方法确定假设成立的可能性大小,假如可能 性小,就认为假设不成立,拒绝它,假如可能性大,仍不能认为它不成立;小概率原理:是指小概率大事在一次随机试验中基本不会发生;3.假设检验的步骤:建立检验假设,确定检验水准 挑选检验方法,运算统计量 确定 P 值 做出推断 4.假设检验应留意的问题:要有严密的讨论设计;应用检验方法必需符合其适用条件;适当挑选检验水准 ;正确懂得 P 值的意义;做结论不能肯定化;统计结论与专业结论相结合;5.类错误:假如实际情形与H;一样,仅仅由于抽样的缘由,使得统计量的观看值落到拒绝域,拒绝了原本正确的 H;,导致推断结论错误,这样的错误称为类错误;6. 类错误:假如实际情形与 接受域,接受了原本错误的 7.t 检验的应用条件:来自正态分布总体;两独立样本;H;不一样,仅仅由于抽样的缘由,使得统计量的观看值落到 H;,导致推断结论错误,这类错误称为类错误;均数比较时要求两总体方差相等;定量资料;8.配对设计的种类:异体配对、自身配对;9.小概率大事:在一次观看或试验中某大事发生的可能性很小,可以看作很可能不发生,通常取 P0.05 ;10.P 值:在零假设成立的条件下,显现统计量目前值及更不利于零假设数值的概率;11.假设检验功效: 1- 称为假设检验的功效,其意义是, 当所讨论的总体与 H;确有差别时,按检验水平 能够发觉它(拒绝 H;)的概率;12.检验水准的确定:需要依据讨论设计的类型、讨论目的、变量类型及变异水平、样本大小等诸多因素;八、方差分析1.方差分析的基本思想:依据资料的设计类型及讨论目的,即按变异的不同来源将全部观看值间的总变异分为两部分或多个部分, 其自由度也分解为相应的部分,除随机误差外, 其余每个部分的变异也可由某个因素的作用加以说明,通过比较可能由某因素所致变异的均方与随机误差的均方,借助F 分布作出统计推断,从而明白该因素对观测指标有无影响;2.方差分析的应用条件:名师归纳总结 - - - - - - -第 4 页,共 8 页精选学习资料 - - - - - - - - - 各样本是相互独立的随机样本;各样原来自正态总体;个处理组总体方差相等;3.方差分析是用于讨论定量变量数据的统计方法;九、卡方检验1.卡方检验的主要应用:常用于分类变量资料的统计推断;推断两个或对个样本率及构成比之间有无差别,检验分类变量配对设计下的卡方检验,以及频数分布的拟合优度;2.卡方检验的留意事项:拟合优度: a.一般要求分组时每组中的理论频数不小于 够时须经连续性校正;5;b.需要有足够的样本含量,不2×2 列联表: a.校正公式仅用于 =1 的四格表资料,对于 2 时的多组样本分布,一般不作校正; b. 当 n<40 或 T<1 时,校正公式也不适用,可以用 Fisher 准确检验; R ×C 列联表: a.一般不宜有 1/5 以上的格子的理论频数小于 5,或不宜有一个理论频数小于 1;解决方法:增加样本含量;结合专业学问合并该格所在行或列;改用 Fisher 确切概率法;3.卡方检验理论频数太小的解决方法:增大样本例数删除理论数太小的行或列将理论数太小的行或列进行合理的合并直接用 Fisher 准确概率法运算十、基于秩次的非参数检验1.参数检验:以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验,也叫参数统计;2.非参数检验:不依靠于总体的分布类型,也不对总体参数进行推断时的假设检验;3.参数检验和非参数检验的区分及优缺点:参数检验分布对象优点缺点总体分布已知总体参数精确性高, 检验效对资料要求高,运算非参数检验总体分布类型未知,总体分布能高繁琐,懂得困难适用范畴广, 资料易犯类错误,检验难以用某种详细的函收集,分析简便效能低,易缺失信息数形式表达4.非参数检验的适用范畴:分布类型未知;能以严峻程度优劣等级成效大小和名次先后等表示的等级资料;分布极度偏态;个别变量值偏离过大远离本组其他变量值(极大值、微小值)或开口资料;方差不齐时;挑选或只需获得初步结果时;5.配对设计资料编秩次的步骤:依差值的肯定值由小到大编秩,并按差值的正负标上正负号,遇差值为 0,舍去不计, n随之削减,遇肯定值相等差值,取平均秩次;6.秩和检验的优缺点:名师归纳总结 - - - - - - -第 5 页,共 8 页精选学习资料 - - - - - - - - - 优点:适用范畴广;方法简便、易于懂得和把握;缺点:缺失信息量,适用于参数检验条件的非参数检验,检验效能降低;十一、两变量关联性分析1.线性相关:假如两个随机变量中,一个变量由小到大变化时,另一个变量也相应地由小到 大(或由大到小)地变化,并且直线趋势,就称这两个变量存在直线相关关系;2.线性(积距)相关系数及其特点:定量描述两个变量间线性关系亲密程度和相关方向的统 一指标; 0 两变量线性相关, =0 两变量不相关;3.线性相关应留意的问题:样本的相关系数接受零时并不意味着两变量间肯定无相关性;一变量的数值人为选定时莫作相关;显现反常点时慎用相关;相关未必真有内在联系;分层资料盲目合并易显现假象;4.秩相关的条件:不听从双变量正态分布不宜作积差相关;总体分布类型未知;用等级表示的原始资料;5.秩相关和线性相关有何异同:联系: 两者都可用于两变量间线性相关的方向与亲密程度,计学意义说明也相同;两者都要求个体间满意独立性;Spearman 秩相关系数的运算可采纳对秩次的其取值范畴与数值大小的统Pearon 积距相关系数的运算来实现;相关系数的含义、单位、取值范畴一样,且运算公式相同,不同一个直接用原始的定量 数据,另一个就要用等级数据;区分: Pearon 积距相关要求数据听从二元正态分布,属于参数统计量;而 Spearman 秩 相关不要求正态分布,属于非参数统计量;两者总体参数的假设检验方法不完全相同(主要是 6.线性相关和线性回来的区分与联系: 和 s 的分布不同) ;区分:资料要求:线性相关要求 X 、Y 听从双变量正态分布,对这种资料进行回来分析称为型回来, 即可以把 X 当自变量,也可以当因变量,反之亦然;线性回来要求 Y在给定X值时听从正态分布 ,X 可以是精确测量和严格掌握的变量,这时的回来称为型回来,即不可以把 X 当因变量, Y当自变量进行回来分析;应用:线性相关用来表达两个变量间的互依关系,两个变量的讨论位置是相等的,谁做 X,谁做 Y 都可以;线性回来用来表达两个变量间的依存关系,即一个变量如何依存于另一个变量而变化,两个变量的讨论位置是不相等的;意义: 相关系数 r 说明具有线性关系的两个变量之间的亲密程度和相关方向;回归系数 b 表示 X 每变化一个单位所导致 Y 的变化量;取值范畴: -1r 1,- <b<+;名师归纳总结 联系:符号:对于既可做相关又可作回来的同一组资料,运算出的r 和 b 正负号相同;第 6 页,共 8 页假设检验:对于同一组资料,相关系数和回来系数的假设检验等价;即tr=tb ;相互换算:对于同一组资料,相关系数和回来系数可通过下式换算:b=rSy ,S x式中的 Sx、Sy 分别为 X、 Y 数据的标准差;- - - - - - -精选学习资料 - - - - - - - - - 用回来说明相关:有打算系数R2 =SS 可知,当总平方和固定时,回来平方和 SS 总的大小打算了相关的亲密程度,回来平方和越接近总平方和,就R2 越接近 1,相关的成效越好;说明回来成效越好,相关的亲密程度也越高;十二、简洁回来分析1.回来系数: b 为回来直线的斜率,也是通过X 推算 Y 的回来系数,表示当X 变动一个单位时, Y 平均变动 b 个单位;2.直线相关与回来的区分与联系:区分:资料:回来:Y 为正态随机变量,X 为选定变量 X、Y 听从双变量正态分布相关: X、Y 听从双变量正态分布 应用:回来:由一个变量值推算另一个变量值 相关:只反应两变量间互依关系 回来系数与原变量单位有关,而相关系数无关 联系:方向一样,r 与 b 的正负号一样 假设检验等价 tr=tb r=b Lxx / Lyy相关回来可以相互说明 3.线性回来模型的适用条件:线性;正态性;方差相等;独立;4.最小二乘原就:但 ab 取不同值猎取不同获选直线时,使全部实测值到这条直线的纵向距 离平方和最小时的 ab 值即为最小二乘估量;. 之差 5.残差:是 P 点与回来直线的纵向距离,即实测值 Y 与其估量值6.打算系数: 回来平方和总离均差平方和之比称为打算系数;取值在 0 到 1 之间, 且无单位,它反映了回来奉献的相对程度,即在因变量 Y 的总变异中回来关系所能说明的比例;线性回来的应用:讨论因素间的依存关系估量与猜测统计掌握 十三、试验设计1.试验设计的三要素:受试对象、处理因素、试验效应;受试对象时处理因素作用的客体,受试对象挑选的合适与否,也是一项试验是否胜利的关键,因此应保证受试对象的同质性和代表性;处理因素是讨论者依据讨论目的而施加的特定措施,又称受试因素, 试验过程中同一处 理因素应始终保持不变,即处理因素应当标准化,同时掌握和减弱非处理因素的影响;试验效应是处理因素作用于受试对象产生的反应或结局;其通过观看指标表达出来,在指标的挑选上,考虑客观性、精确性、灵敏性和特异性;2.试验设计的基本原就:对比原就;随机化原就;重复原就;对比原就:劝慰剂对比、空白对比、试验对比(标准对比和自身对比)随机化原就:表达在三个方面:随机抽样、分组的随机、试验次序随机 重复原就:作用:估量试验误差、减小试验误差 3.随机化:是采纳随机的方式,使每个受试对象都有同等的机会被抽取或安排到试验组和对 照组;是对资料进行统计推断的前提,各种统计分析方法都是建立在随机化的基础上;4.样本含量估量的四要素:容许误差 名师归纳总结 有关总体变异性(总体标准差 与总体概率 )第 7 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 第类错误概率 的大小第类错误概率 或检验功效1- 的大小5.常用的试验设计方案:完全随机设计: 是最为常见的一种考察单因素两水平或多水平效应的试验设计方法;它是采纳完全随机分组的方法将同质的受试对象安排到各处理组,观看其试验效应;交叉设计: 是一种特别的自身对比设计,它按事先设计好的试验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异;配对设计: 将受试对象按肯定条件配成对子,再将每对中的两个受试对象随机安排到不同处理组;(主要有以下情形:a.将两个条件相同或相近的受试对象配成对子,通过随机化,是对子内个体分别接受两种不同的处理;b.同一受试对象的两个部安排成对子,分别随机地接受两种不同的处理;c.自身前后配对,即同一受试对象,接受某种处理之前和接受该处理之后视为配对) ;随机区组设计: 是配对设计的扩展, 通常是将受试对象按性质相同或相近分为 b 个区组,再将每个区组中的 k 个受试对象随机安排到 k 个处理组; 设计时应遵循 “ 区组间差别越大越好,区组内差别越小越好” 的原就;6.双盲法:受试对象和试验执行者均不知道受试对象分在哪一组;十四、调查设计1.常用的抽样方法及其优缺点:非概率抽样:立意抽样、偶遇抽样、雪球抽样;概率抽样:单纯随机抽样、系统抽样、整群抽样、分层抽样;优点单纯随机抽样系统抽样整群抽样分层抽样简洁直观,是其他易懂得,简便易便 于 组 织 调削减抽样误差;缺点抽样方法的基础;行;可得到按比查;节约经费,可对不同层采纳均数及其标准误计例安排的样本;简洁掌握调查不 同 的 抽 样 方算简便样 本 在 总 体 分质量法;可对不同层布较匀称进行独立分析例数较多时,编号样本例数肯定观 察 单 位 按 顺如分层变量挑选麻烦,实际工作中序 有 周 期 趋 势时,抽样误差不当,层内变异难以办到,当总体或递增(减)时大于单纯随机较大,层间变异变异大时,代表性易产生偏差抽样小,分层抽样就不如分层抽样,难失去意义以组织调查适用范畴2.调查表的构成:标题、说明、被访者基本情形、主要内容、编码、作业证明的记载;名师归纳总结 - - - - - - -第 8 页,共 8 页

    注意事项

    本文(2022年卫生统计学考试重点总结复习.docx)为本站会员(Che****ry)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开