2022年医学统计学_总结_重点_笔记_复习资料 .docx
《2022年医学统计学_总结_重点_笔记_复习资料 .docx》由会员分享,可在线阅读,更多相关《2022年医学统计学_总结_重点_笔记_复习资料 .docx(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品_精品资料_第一章2 选 1总体 : 总体 population就是依据讨论目的确定的同质观看单位 讨论对象 的全体 , 实际上就是某一变量值的集合.可分为有限总体与无限总体.总体中的全部单位都能够标识者为有限总体 , 反之为无限总体.总体 population依据讨论目的而确定的同质观看单位的全体.样本 : 从总体中随机抽取部分观看单位, 其测量结果的集合称为样本sample .样本应具有代表性.所谓有代表性的样本, 就是指用随机抽样方法获得的样本.样本 sample从总体中随机抽得的部分观看单位, 其实测值的集合.3 选 1小概率大事 : 我们把概率很接近于0 即在大量重复试验中显现的
2、频率特别低 的大事称为小概率大事.P 值:P值即概率 , 反映某一大事发生的可能性大小.统计学依据显著性检验方法所得到 的 P 值反应结果真实程度 , 一般以 P 0 、05 认为有统计学意义 , P 0、01 认为有高度统计学意义 , 其含义就是样本间的差异由抽样误差所致的概率等于或小于0、 05 或 0、01.P 值就是 :1) 一种概率 , 一种在原假设为真的前提下显现观看样本以及更极端情形的概率.2) 拒绝原假设的最小显著性水平.3) 观看到的 实例的 显著性水平.4) 表示对原假设的支持程度, 就是用于确定就是否应当拒绝原假设的另一种方法.小概率原理 : 一个大事假如发生的概率很小的
3、话, 那么可认为它在一次实际试验中就是不会发生的 , 数学上称之小概率原理, 也称为小概率的实际不行能性原理.统计学中, 一般认为等于或小于 0、05 或 0、01 的概率为小概率.资料的类型 3 选 1( 1)计量资料 : 对每个观看单位用定量的方法测定某项指标量的大小, 所得的资料称为计量资料 measurement data.计量资料亦称定量资料、测量资料.、其变量值就是定量的 , 表现为数值大小, 一般有度量衡单位.如某一患者的身高cm 、体重 kg 、红细胞计数10 12/ L 、脉搏 次/ 分 、血压 KPa 等.计量资料measurement data定量资料quantitati
4、ve data数值变量资料numerical variable为观测每个观看单位某项指标的大小, 而获得的资料.( 2)计数资料 : 将观看单位按某种属性或类别分组, 所得的观看单位数称为计数资料countdata .计数资料亦称定性资料或分类资料.其观看值就是定性的, 表现为互不相容的类别或属性.如调查某的某时的男、女性人口数; 治疗一批患者 , 其治疗成效为有效、无效的人数 ; 调查一批少数民族居民的A、B、 AB、O 四种血型的人数等.计量资料 enumeration data定性资料 qualitative data无序分类变量资料 unorderedcategorical varia
5、ble名义变量资料 nominal variable为将观看单位按某种属性或类别分组计数, 分组汇总各组观看单位数后而得到的资料.( 3)等级资料 : 将观看单位按测量结果的某种属性的不同程度分组, 所得各组的观看单位数 , 称为等级资料 ordinaldata .等级资料又称有序变量.如患者的治疗结果可分为治愈、好转、有效、无效或死亡, 各种结果既就是分类结果, 又有次序与等级差别 , 但这种差别却不能精确测量 ; 一批肾病患者尿蛋白含量的测定结果分为+ 、+、+等.可编辑资料 - - - 欢迎下载精品_精品资料_等级资料 ranked datacategorical variable半定量
6、资料 semi-quantitative data资料有序分类变量 ordinal为将观看单位按某种属性的不同程度分成等级后分组计数, 分类汇总各组观看单位后而得到的资料.等级资料与计数资料不同: 属性分组有程度差别 , 各组按大小次序排列.等级资料与计量资料不同: 每个观看单位未准确定量, 故亦称为半计量资料.两种误差 2 选 1抽样误差 sampling error 由于抽样而引起的总体指标 参数 与样本指标 统计数 之间的差异.抽样误差就是由个体变异或其它随机因素造成的, 就是不行防止的 , 但误差分布有规律可循 , 可进行估量与分析.系统误差 systematicerror:由于测量仪
7、器结构本身的问题、刻度不精确或测量环境转变等缘由 , 在多次测量时所产生的, 总就是偏大或总就是偏小的误差, 称为系统误差.它带有规律性 , 经过校正与处理 , 通常可以削减或排除.统计的步骤 考填空题 , 四个空 统计工作的步骤 . 设计 : 设计内容包括资料收集、整理与分析全过程总的设想与支配.设计就是整个讨论中最关键的一环 , 就是今后工作应遵循的依据. . 收集资料 : 应实行措施使能取得精确牢靠的原始数据. . 整理资料 : 简化数据 , 使其系统化、条理化 , 便于进一步分析运算. . 分析资料 : 运算有关指标 , 反映事物的综合特点 , 阐明事物的内在联系与规律.分析资料包括统
8、计描述与统计推断.试验设计的基本原就 考填空题 , 三个空 随机化原就、对比的原就、重复的原就.2 选 1参数 : 参数 就是指总体的统计指标, 如总体均数、总体率等.总体参数就是固定的常数.多数情形下, 总体参数就是不易知道的, 但可通过随机抽样抽取有代表性的样本, 用算得的样本统计量估量未知的总体参数.统计量 : 统计量 就是指样本的统计指标, 如样本均数、样本率等.样本统计量可用来估量总体参数.总体参数就是固定的常数, 统计量就是在总体参数邻近波动的随机变量.其次章频数表的制作步骤以及频数分布表的用途 问答题 频数分布表的编制步骤:例: 某市 1982年50名7岁男童的身高 cm 资料如
9、下 , 试编制频数表.114、4117、2122、7124、0114、 0110、8118、2116、7118、9118、16123、5113、2118、3120、0120、3116、2114、 7119、7114、8119、119、8116、8119、8122、5119、 7120、7114、3122、0117、0122、5可编辑资料 - - - 欢迎下载精品_精品资料_119、7124、9126、1120、0124、 6120、0121、5114、3124、1117、23120、2121、8120、8118、7126、6121、5126、 1117、7124、1128、1、找出观看值中的最
10、大值largestvalue、最小值 smallestvalue,求极差 range.极差等于最大值减最小值.本例最大值=128、 3, 最小值 =110、8, 就极差 =128、3-110 、8=17、5cm 2、确定分组数与组距class interval.组数的多少就是依据例数的多少来确定的, 以能够反映出频数分布的特点为原就, 一般分10 15组.组距为相邻两组的间隔, 组距 =极差 / 组数.本例拟分 10组, 就组距 =17、5/10=1 、75 2, 为划记便利 , 可取稍大或稍小的数 当然本例组距也可取 1、5 .3、确定组段.第一组段包括要最小值, 取较最小值稍小且划分便利的
11、数, 本例取“ 110”.最终组段包括最大值并写出其上限值.4、划记.将各观看值以划“正”字的方法, 一笔代表一例 , 划在相应组段中.例如第一个数l14 、4应在组段“ 114”处划 , 其次个数 117、2应在“ 116”处划 , 以此类推.5、统计各组段的频数.全部数据划记完后, 清点各组段的人数.依据编制出的频数表即可明白该数值变量资料的频数分布特点.频数分布表的用途1、描述资料的分布特点与分布类型.频数分布有两个重要特点 : 集中趋势与离散趋势.大部分观看值向某一数值集中的趋势称为集中趋势 , 常用平均数指标来表示 , 各观看值之间大小参差不齐.频数由中心位置向两侧逐步削减 , 称离
12、散趋势 , 就是个体差异所致 , 可用一系列的变异指标来反映.2、便于进一步运算有关指标或进行统计分析.当数据较多且需手工运算时, 常先编制频数表, 再进行统计运算.3、发觉特大、特小的可疑值.假如频数表的一端或两端显现连续几个组段的频数为零后, 又显现少数几个特大值或特小值, 使人怀疑其就是否精确, 需进一步检查与核对并做相应处理.4、据此绘制频数分布图.描述数据分布集中趋势的指标与描述数据分布离散程度的指标 考选择或者填空 .描述数据分布集中趋势的指标算术均数、几何均数、中位数. .描述数据分布离散程度的指标极差、四分位数间距、方差、标准差、变异系数.正态分布的特点 考选择题 、对图形的影
13、响听从正态分布的变量的频数分布由、 完全打算.(1) 就是正态分布的位置参数, 描述正态分布的集中趋势位置.正态分布以x = 为对称轴 , 左右完全对称.正态分布的均数、中位数、众数相同, 均等于 .(2) 描述正态分布资料数据分布的离散程度, 越大 , 数据分布越分散 , 越小 , 数据分布越集中.也称为就是正态分布的外形参数, 越大 , 曲线越扁平 , 反之, 越小 ,曲线越瘦高.可编辑资料 - - - 欢迎下载精品_精品资料_标准正态分布 填空 221. 标准正态分布就是一种特别的正态分布, 标准正态分布的0, 1 , 通常用u 或Z 表示听从标准正态分布的变量, 记为 N0,1 .正态
14、分布的应用 简答 某些医学现象 , 犹如质群体的身高、红细胞数、血红蛋白量, 以及试验中的随机误差, 出现为正态或近似正态分布; 有些指标 变量 虽听从偏态分布 , 但经数据转换后的新变量可服从正态或近似正态分布, 可按正态分布规律处理.其中经对数转换后听从正态分布的指标,被称为听从对数正态分布.1、 估量频数分布一个听从正态分布的变量只要知道其均数与标准差就可依据公式即可估量任意取值范畴内频数比例.2、 制定参考值范畴(1) 正态分布法适用于听从正态 或近似正态 分布指标以及可以通过转换后听从正态分布的指标.(2) 百分位数法常用于偏态分布的指标.表3-1 中两种方法的单双侧界值都应娴熟掌握
15、.3、 质量掌握 : 为了掌握试验中的测量 或试验 误差 , 常以 作为上、下戒备值, 以 作为上、下掌握值.这样做的依据就是: 正常情形下测量 或试验 误差听从正态分布.4、 正态分布就是很多统计方法的理论基础.检验、方差分析、相关与回来分析等多种统计方法均要求分析的指标听从正态分布.很多统计方法虽然不要求分析指标听从正态分布 , 但相应的统计量在大样本时近似正态分布, 因而大样本时这些统计推断方法也就是以正态分布为理论基础的.医学参考值范畴的制定 运算题 确定参考值范畴的单双侧: 一般生理物质指标多为双侧、毒物指标就多为单侧.确定百分位点 : 一般取 95%或 99%.例题某市 20岁男同
16、学 160人的脉搏数 次/ 分钟 , 经正态性检验听从正态分布.求得= 76、10,S =9 、32.试估量脉搏数的95%、99%参考值范畴.可编辑资料 - - - 欢迎下载精品_精品资料_解: 脉搏数的 95%正常值范畴为 : 1、96 S=76、10 1 、969 、32=57 、83 94、37脉搏数的 99%正常值范畴为 :2、58 S =76 、10 2 、589 、32=52 、05 100、37第三章标准误的概念 , 运算公式.标准误: 抽样讨论中 , 样本统计量与总体参数间的差别称为抽样误差samplingerror.统计上用标准误 standard error,SE来衡量抽样
17、误差的大小, 即样本均数的标准差, 就是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度.t 分布的图形特点及其与正态分布的区分 简答 t 分布的图形特点1. 以 0 为中心 , 左右对称的单峰分布 ;2.t分布就是一簇曲线 , 其外形变化与n 准确的说与自由度 大小有关.自由度越小,t分布曲线越低平 ; 自由度越大 ,t分布曲线越接近标准正态分布u 分布 曲线.可编辑资料 - - - 欢迎下载精品_精品资料_t 分布对应于每一个自由度, 就有一条 t 分布曲线 , 每条曲线都有其曲线下统计量t 的分布规律 , 运算较复杂.t分布与正态分布比较的区分t分布与标准正态分布相比有以下特点:
18、都就是单峰、对称分布; t分布峰值较低 , 而尾部较高 ; 随自由度增大 ,t分布趋近与标准正态分布; 当趋向 ,t分布的极限分布就是标准正态分布.置信区间与参数估量 名解 2 选 1置信区间 : 在统计学中 , 一个概率样本的置信区间Confidenceinterval就是对这个样本的某个总体参数的区间估量.置信区间呈现的就是这个参数的真实值有肯定概率落在测量结果的四周的程度.给出的就是被测量参数的测量值的可信程度.1、对于具有特定的发生概率的随机变量, 其特定的价值区间 -一个确定的数值范畴 “一个区间” .2、在肯定置信水平常, 以测量结果为中心, 包括总体均值在内的可信范畴.3、该区间
19、包含了参数真值的可信程度.4、参数的置信区间可以通过点估量量构造, 也可以通过假设检验构造.参数估量 : 指用样本指标值 统计量 估量总体指标值 参数 .参数估量有两种方法: 点估量与区间估量.可信区间与参考值范畴的不同点 简答 应留意 : 可信区间与参考值范畴的意义、运算公式与用途均不同.1、从意义与用途来瞧95参考值范畴就是指同质总体内包括 95个体值的估量范畴 , 而总体均数 95可信区间就是指按 95可信度估量的总体均数的所在范畴. 可信区间用于估量总体参数 , 总体参数只有一个 .参考值范畴用于估量变量值的分布范畴 , 变量值可能很多甚至无限 .2、从运算公式瞧如指标听从正态分布 ,
20、95 参考值范畴的公式就是: 1、96s.总体均数 95可信区间的公式就是:.前者用标准差 , 后者用标准误.前者用1、96, 后者用为 0、05, 自由度为 v 的 t 界值.可编辑资料 - - - 欢迎下载精品_精品资料_t 检验的应用条件与类型 填空 t 检验的应用条件: 要求各样原来自相互独立的正态总体且各总体方差齐.t 检验的类型 : 单样本 t 检验, 独立 t 检验 , 配对 t 检验配对设计与完全随机设计 名解 2 选 1完全随机设计 completely random design:完全随机设计仅涉及一个处理因素 但可为多水平 , 故又称单因素 one-way 设计. 它就是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年医学统计学_总结_重点_笔记_复习资料 2022 医学 统计学 总结 重点 笔记 复习资料
限制150内