《本科医学统计学复习题.docx》由会员分享,可在线阅读,更多相关《本科医学统计学复习题.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、名词解释:L定量数据:也称计量资料,变量的观测值是定量的,其特点是能够用数值大小衡量其水平 的高低。定性资料:也称计数资料,变量的观测值是定性的,变现为互不相容的类别或属 性。2. sampling error:抽样误差,由于抽样而引起的样本统计量与总体参数间的差异。3.standard deviation:标准差,是将方差取平方根。4,非参数检验:不以特定的总体分布为前提,也不针对总体参数做统计推断的方法。5 . normal distribution:正态分布一种非常重要的分布类型,其特征是中间组段的频数最多, 两侧的频数分布对称,并按一定的规律下降。6 .相关系数:是说明具有直线相关关系
2、的两个数值变量间相关的密切程度和相关方向的统计 量。7 .方差分析:又称F检验,其基本思想是将全部观测值的总变异按影响因素分解为相应的 假设干局部变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差异的推 断,.率的标准化:采用统一的标准对内部构成不同的各组频率进行调整和比照的方法7.假设 检验:也称显著性检验,是统计推断的另一重要内容,其目的是比拟总体参数之间有无差异 8.构成比:表示某事物内容各组成局部在整体中所占的比重。8 .正态分布. standard normal distribution:任何正态分布的X值通过u值转换后,称为标准化的正态 分布13 .医学参考值范围.
3、发病率14 .参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计和区间 估计。15 .完全随机设计.随机区组设计16 .决定系数19总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目确实 定的、同质的全部研究单位的观测值。20 .同质(homogeneity):研究对象具有的相同的状况或属性等共性。21 .变异(variation):对于同质的各观察单位,其某变量值之间的差异.概率(probability):在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接 近一个常数p,这个常数p就称为事件A出现的概率
4、(probability),记作P(A)或P。22 .误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要 有以下二种:系统误差和随机误差。23 .假设检验:又称显著性检验,是利用小概率反证法思想,从问题的对立面(H0)出发间 接判断要解决的问题(H1)是否成立,然后在H0成立的条件下计算检验统计量,最后获得 P.百分位数(percentile):是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为 两个局部,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px。24 .变异系数(coefficient of variance, CV):亦称
5、离散系数(coefficient of dispersion),为标准差 与均数之比,常用百分数表示。CV=s/X?100%,变异系数没有度量衡单位,常用于比拟度量 单位不同或均数相差悬殊的两组或多组资料的离散程度。25 .标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量 抽样误差的大小。据此,样本均数的标准差。称为标准误。26 .相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程 度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-mo
6、ment correlation),总体相关系数用希腊字母P表示,而样本相关系数用r表示,取值范围均为-1, lo ?= a+bX的系数b称为回归系数,25.回归系数(regression coefficient):直线回归方程Y 也就是回归直线的斜率(slope),表示X每增加一个单位,Y平均改变b个单位。27 .回归系数(regression coefficient):直线回归方程Y也就是回归直线的斜率(slope),表示X 每增加一个单位,Y平均改变b个单位。28 .构成比(proportion):又称构成指标,它说明一种事物内部各组成局部所占的比重或分布, 常以百分数表示。3LP值:结
7、果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观 察结果认为有效即具有总体代表性的犯错概率。一般结果W0.05被认为是有统计学意义. I类错误(type I error):统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误 称为I型错误或第一类错误,I型错误的概率用a表示。32 .检验效能(power of a test):又称把握度,即两总体确有差异,按a水准能发现它们有差异 的能力。33 .样本(sample):来自总体的局部个体,更确切的说,应该是局部个体的观察值。样本 应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。简答题:1、简述t分
8、布的特征以及t检验的基本思想、t检验的考前须知,方差分析基本思想 答:t分布比标准正态分布的峰值低,且尾部翘得更高。随自由度的增大,t分布逐渐趋近 标准正态分布。以t=0为中心左右对称的单峰分布;t分布曲线形态变化与自由度v大小有 关,自由度越小,t分布曲线峰部越低,尾部越高;自由度越大,t分布曲线越接近标准正 态分布曲线。t检验的基本思想:t的分布是有规律的,在一个正态总体中随机抽样要得到 111 =t0. 05, v 的概率 P=t0. 01, v 的概率 P=x20.5,v或 概率P=0.05有通用公式、专用公式和校正公式。考前须知:理论频数不应小于1,并且 1小于等于T小于5的格子数不
9、宜超过格子总数的五分之一。多个样本率比拟,假设统计推 断结果拒绝H0,接受H1时,只说明各总体率之间总的来说有差异,不能说明任两个总体 率之间均有差异,与分类结果的排序无关。4、如何确定医学正常值范围的界限答:1确定同质的参照总体2选择足够例数的参照样本3控制检测误差4选择单、双侧界 值5选择适当的百分数范围6选择计算参考值范围的方法5 .相对数使用应注意的事项是什么答1不要把构成比与率想混淆2使用相对数时分母不宜过小3注意资料的可比性4样本 率或构成比存在抽样误差.简述描述资料离散程度的指标有哪些,正态分布的主要特征是什么答 极差、四分位数间距、方差、标准差、变异系数。主要特征:单峰分布,以
10、X=u为 中心,左右完全对称正态曲线在X=H处有最大值正态分布有两个参数,即均数和标准 差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,那么曲线沿横 轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭4. 正态曲线下面积的分布有一定规律。6 .简述变异系数的用途和正态分布曲线下面积分布规律答:均数相差较大或单位不同的几组观察值的变异程度进行比拟。曲线下的面积即为概率 曲线下的总面积为1或100% ,以u为中心左右两侧面积各占50%,越靠近U处曲线下 面积越大,两边逐渐减少所有正态曲线,在u左右的任意个标准范围内面积相同 8、误差的分类及其各自特点答
11、系统误差、随机测量误差和抽样误差。P49、频数分布表的用途答:1.作为陈述资料的形式,可以代替原始资料。2便于观察数据的分布类型。3便于发现 资料中某些远离群体的特大或特小值。4当样本含量比拟大时,可用各组段的频率作为概率 的估计值。10、率的标准化标准如何选取答1选取有代表性的、较稳定的、数量较大的人群构成为标准构成。2选择用于比拟的各组 例数合计作为标准构成。3从比拟的各组中任选其一作为标准构成。11、非参数检验的适用范围答1总体分布类型未知或非正态分布数据2有序或半定量资料或等级资料3数据两端无确定 的数值4各组离散程度相差悬殊,即各总体方差不齐。12、线性相关分析和线性回归分析考前须知
12、,直线相关与回归的区别与联系答 P11113、多元逐步回归分析自变量选择方法,多元线性回归SPSS软件结果如何查找?多元回归 分析考前须知答向前选择法、向后选择法和逐步选择法。考前须知:1应用条件2样本含量3定性数据的数量化4多重共线性5关于变量筛选。14、统计表的结构如何答从外形看,统计表可由标题、标目(包括横标目、纵标目)、线条、数字和备注5局部够成。P36计算分析题:1、某医院147例大肠肝菌标本接种在A、B两种培养基上,然后进行检验, 资料如下表,是分析两种培养基的检验结果是否有显著性。大肠肝菌标本A、B两种培养基的培养结果此题是一个配对设计的二分类资料,采用配对四个表资料的检验。A培
13、养基B培养基+ +59361537合计7473(1)建立检验假设并确定检验水准HO: B=C,即两种培养基的阳性培养率相等Hl: BWC,即两种培养基的阳性培养率不相等a =0. 05(2)计算检验统计量22 x x本例b+c=36+15=5140 ,用配对四个表检验公式,计算检验统计量值 (b-c)2(36-15) x=8. 65b+c=36+15, v =1223.确定P值,作出推断结论2x查界值表得P 40,且有一 2X个格子的理论频数小于5,须采用四个表检验的校正公式进行计算。(1)建立检验假设并确定检验水准HO: nl=n2,即新药组与钙片组儿童佝偻病患病概率相同H1:兀12冗2,即新药组与钙片组儿童佝偻病患病概率不同a =0. 05(2)用四个表x检验的校正公式,计算检验统计量x值:256?10-32?6-?56 2(|ad-bc|-n/2)n2? x c2=l.050(a+b) (c+d)(a+c)(b+d)40?16?14?52 = v =13.确定P值,作出推断结论2222 x=1.32 x x x 0. 25(1)0 以 v 查附表 7 的界值表得,0. 05o 按 a =0. 05水准,不拒绝HO,无统计学意义,还不能认为新药组与钙片组儿童佝偻病 患病概率不同
限制150内