《卫生统计学简答题终审稿).pdf》由会员分享,可在线阅读,更多相关《卫生统计学简答题终审稿).pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 卫生统计学简答题 文稿归稿存档编号:KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-卫生统计学简答题 方差分析的基本思想和应用条件是什么 答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助 F 分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,各样本是相互独
2、立的随机样本,均服从正态分布;各样本的总体方差相等,即方差齐性。多组定量资料比较时,统计处理的基本流程是什么 答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选 Kruskal-Wallis 秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如 Bonferonni、LSD 法等)进行两两比较。简述秩和检验的优缺点 秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端
3、无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。试述假设检验与置信区间的联系与区别。答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。试述两类错误的意义及其关系。答:类错误(typeerror):如果检验假设 0H 实际是正确的,由样本数据计算获得的检验统计量得出拒绝 0H 的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为类错误。类错误(type error):假设检验的另
4、一类错误称为类错误(type error),即检验假设 0H 原本不正确(1H 正确),由样本数据计算获得的检验统计量得出不拒绝 0H(纳伪)的结论,此时就犯了类错误。类错误的概率用 表示。在假设检验时,应兼顾犯类错误的概率()和犯类错误的概率()。犯类错误的概率()和犯类错误的概率()成反比。如果把类错误的概率定得很小,势必增加犯类错误的概率,从而降低检验效能;反之,如果把类错误的概率定得很小,势必增加犯类错误的概率,从而降低了置信度。为了同时减小和,只有通过增加样本含量,减少抽样误差大小来实现。什么资料适合用秩和检验进行检验?简述秩和检验步骤。答:提示:进行有序资料的比较时宜采用秩和检验。
5、(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。秩和检验步骤为:建立假设 H0 和 H1,并确定检验水准;根据不同的设计类型对资料进行编秩并计算秩和;根据计算的秩和直接查表或计算相应的统计量再查表,确定 P 值下结论。进行有序资料的比较时宜采用秩和检验。服从二项分布及 Poisson 分布的条件分别是什么?答:二项分布成立的条件:每次试验只能是互斥的两个结果之一;每次试验的条件不变;各次试验独立。Poisson 分布成立的条件:除二项分布成立的三个条件外,还要求试验次数 n 很大,而所关心的事件发生的概率很小。2.
6、二项分布、Poisson 分布分别在何种条件下近似正态分布?简答:二项分布的正态近似:当 n 较大,不接近 0 也不接近 1 时,二项分布 B(n,)近似正态分布 N(n,)1(?n)。Poisson 分布的正态近似:Poisson 分布)(,当相当大时(20),其分布近似于正态分布 简述简单线性回归分析的基本步骤。答:绘制散点图,考察是否有线性趋势及可疑的异常点;估计回归系数;对总体回归系数或回归方程进行假设检验;列出回归方程,绘制回归直线;统计应用。简述线性回归分析与线性相关的区别与联系。答:区别:(1)资料要求上,进行直线回归分析的两变量,若 X 为可精确测量和严格控制的变量,则对应于每
7、个 X 的 Y 值要求服从正态分布;若 X、Y 都是随机变量,则要求 X、Y 服从双变量正态分布。直线相关分析只适用于双变量正态分布资料。(2)应用上,说明两变量线性依存的数量关系用回归(定量分析),说明两变量的相关关系用相关(定性分析)。(3)两个系数的意义不同。r 说明具有直线关系的两变量间相互关系的方向与密切程度,b 表示 X 每变化一个单位所导致 Y 的平均变化量。(4)两个系数的取值范围不同:-1r1,b。(5)两个系数的单位不同:r 没有单位,b 有单位。联系:(1)对同一双变量资料,回归系数 b 与相关系数 r 的正负号一致。b0 时,r0,均表示两变量 X、Y 同向变化;b0
8、时,r0,均表示两变量 X、Y 反向变化。(2)回归系数 b 与相关系数 r 的假设检验等价,即对同一双变量资料,rbtt=。由于相关系数 r 的假设检验较回归系数 b 的假设检验简单,故在实际应用中常以 r 的假设检验代替 b 的假设检验。(3)用回归解释相关:由于决定系数 2R=SS 回/SS 总 ,当总平方和固定时,回归平方和的大小决定了相关的密切程度。回归平方和越接近总平方和,则 2R 越接近 1,说 明引入相关的效果越好。例如当 r=0.20,n=100 时,可按检验水准 0.05 拒绝 H0,接受H1,认为两变量有相关关系。但 2R=(0.20)2=0.04,表示回归平方和在总平方
9、和中仅占4,说明两变量间的相关关系实际意义不大 直线相关与回归有何联系与区别 联系:(1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同。(2)回归系数与相关系数的假设检验是等价的,对同一样本的资料,回归系数的 t 检验与相关系数的 t 检验其数值相等,即 tr=tb。(3)可以用回归解释相关。r 的平方称为决定系数(coefficient of determination)。区别:回归要求因变量 Y 是正态分布的随机变量;X 可以是精确测量或严格控制的变量,也可以是呈正态分布的随机变量,当 X 是精确测量或严格控制的变量时,此时的回归称型回归。当 X 是呈正态分布的随机变量时,此
10、时的回归称为型回归。相关要求变量 X、Y都是呈正态分布的随机变量。当说明两变量间依存变化的数量关系时用回归,当说明两变量间的相关关系时用相关 简述多重线性回归分析中,自变量筛选的标准与原则 1、残差平方和(SSE)缩小或决定系数增大 2、残差平方(MSE)缩小与调整确定系数(R2a)增大 3、Cp 统计量 准则:较小的 Cp 值,Cp=p 作为最优的准则,如 p 个自变量的模型是合适的,则 标准差与标准误有何区别和联系 标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;用途不同;标准差与均数结合估
11、计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。它们与样本含量的关系不同:当样本含量 n 足够)2(2pNSSECpp 大时,标准差趋向稳定;而标准误随 n 的增大而减小,甚至趋于 0。联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。(联系:1、二者都是表示变异度大小的统计指标 2、标准误与标准差大小成正比,与抽样例数 n 的平方根成反比)何谓假设检验其一般步骤是什么 所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作
12、出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤:建立假设:包括:H0,称无效假设;H1:称备择假设;确定检验水准:检验水准用表示,一般取0.05;计算检验统计量:根据不同的检验方法,使用特定的公式计算;确定 P 值:通过统计量及相应的界值表来确定 P 值;推断结论:如 P,则接受 H0,差别无统计学意义;如 P,则拒绝 H0,差别有统计学意义。常用统计图的适用范围是什么?常用的统计图及适用条件是:条图,适用于相互独立的资料,以表示其指标大小;百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;普通线图:适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况
13、。半对数线图,适用于连续性资料,反映事物发展速度(相对比)。直方图:适用于连续性变量资料,反映连续变量的频数分布。散点图:适用于成对数据,反映散点分布的趋势。简述率的标准化法的基本思想 当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生 率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重
14、、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。简述 2 检验的的基本思想 2 检验是检验理论频数与实际频数的吻合程度,从基本公式(TTA22)(=)可以看出,在检验假设成立的情况下,T(理论频数)与 A(实际频数)之差一般不会很大,此时 2 值也较小;反之,2 值较大。当 2 值较大,且大于一定的界值时,就拒绝 H0,接受 H1,认为两样本率有统计学差异。当 2 值较小,且小于特定的界值时,就不拒绝 H0,认为两样本率差异无统计学意义 简述当不满足行列的 2检验的条件时的处理办法。当不满足行列的 2检验的条
15、件(RC 表中不宜有 1/5 的格子数小于 5,或有一个格子的理论频数小于 1 时,可采用下述方法处理:(1)增大样本例数,(2)删除理论数较小的行和列,(3)将理论数较小的行或列与性质相近的行或列合并,但在合并时应注意合并的合理性。(2)和(3)两种处理方法会丢失部分信息。请简述正态分布的特征 1、曲线在横轴上方均数处最高;2、以均数为中心,左右对称;3、正态分布有两个参数:(1):位置参数,确定曲线位置 当 一定时,越大,曲线越向右移动;越小,曲线越向左移动。(2):离散度参数,决定曲线的形态:当一定时,越大,表示数据越分散,曲线越“胖”;越小,表示数据越集中,曲线越“瘦”。4、正态分布曲线下的面积有一定的分布规律 简述直线相关与秩相关的区别 Pearson 积差相关 Spearman 秩相关 双变量正态分布 r 为参数统计量 原始数据 偏峰分布、分布未知、等级资料 rs 为非参数统计量 秩次 都用于刻画两变量间线性相关的方向与密切程度 都要求各个体间满足独立性
限制150内