2022年卫生统计学简答题汇总.docx
精选学习资料 - - - - - - - - - 统计学简答汇总第一章:绪论(无)其次章:定量变量的统计描述 1均数几何均数和中位数的适用范畴有何异同?答 : 相同点 , 均表示计量资料集中趋势的指标;不同点 : 表 2-5. 表 2-5 均数 , 几何均数和中位数的相异点平 均 数意义应用场合均数平均数量水平应用甚广 , 最适用于对称分布, 特殊是正态分布几何均数平均增减倍数等比资料;对数正态分布资料中位数位次居中的观偏态资料;分布不明资料;分布一端或两察值水平端显现不确定值2中位数与百分位数在意义上运算和应用上有何区分与联系?答: 1) 意义: 中位数是百分位中的第50 分位数, 常用于描述偏态分布资料的集中位置,反映位次居中的观看值水平;百分位数是用于描述样本或总体观看值序列在某百分位置的水平,最常用的百分位是 述总体或样本的分布特点;P50即中位数;多个百分位数结合使用,可更全面地描(2)运算:中位数和百分位数均可用同一公式运算,即 Px=L+(i/fx)( n·x%- f L)可依据争论目的选择不同的百分位数代入公式进行运算分析;(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考 值范畴的确定;中位数常和其它分位数结合起来描述分布的特点,在实际工作中 更为常用;百分位数仍可以用来描述变量值的离散趋势(四分位数间距);3同一资料的标准差是否肯定小于均数?答:不肯定;同一资料的标准差的大小与均数无关,主要与本资料的变异度有关;变异大,标准差就大,有时比均数大;变异小,标准差小;4测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越 稳固 ;(2)分组的多少(3)分布外形的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)争论总体中观看值之间变异程度大小 5. 标准差与变异系数的异同点有哪些?答:标准差: 是以算数平均数为中心, 反映各观测值离散程度的一个肯定指标. 当需要对同一总体不同时期或对不同总体进行对比时, 缺乏可比性 . 当总体平均水平不同或计量单位不同时 , 用标准差是无法实现两组数据离散程度大小对比的 . 变异系数:标准差与平均数的比值称为变异系数, 记为 C· V. 变异系数可以排除单位和(或)平均数不同对两个或多个资料变异程度比较的影响;6. 如何表达一批计量数据的基本特点?答:从集中趋势和离散趋势两方面回答;7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情形?答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变名师归纳总结 - - - - - - -第 1 页,共 23 页精选学习资料 - - - - - - - - - 异系数;极差适合:数据分布非对称的情形;四分位数差距适合:数据分布非对称的情形;方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息;变异系数适用: 当比较两资料的变异程度大小时,假如变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较;8. 标准差有何用途?答:描述正态分布的变异程度;正态分布时,均数与标准差同时写出:X +S;运算变异系数;用标准差估量变量值的频数分布;用标准差运算标准误;9. 统计描述的基本方法有哪些,各自有何特点?答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息;表:具体、精确;图:直观;指标:综合性好;10简述变异系数的有用时机;答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系 数比较;11. 怎样正确描述一组计量资料?答: 1.依据分布类型选择指标;2. 正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距;12. 原始数据单位变换后,对均数和方差有何影响?答:均数和方差均转变;用实例说明;13. 列表的原就和基本要求是什么?答:( 1)列表的原就:重点突出,简洁明白;主谓分明,层次清晰;(2)列表的基本要求: 应有简明扼要说明统计表内容的标题;既不能过与简略,也不呢能过于繁琐或不 准确; 标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清晰; 线条不宜过多;除顶线、底线、纵标目下与合计行上面的线条外,其他线条一般 均应省去;表的左上角不宜有斜线;位次应对齐, 不宜留空格; 暂缺或未记录用 “ ” 表内数字小数位数保留应一样,表示,许多字用“ ” 表示,数字是“0” 就应填写“0” ; 备注一般不列入表内,应用“ ” 号引出,写在表的下面;14. 常用的统计图有哪几种?他们的适用条件是什么?答:常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图和 统计地图等;(1)直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等;(2)百分条图、圆图:用长条各段的面积、圆的扇形面积来表示事物内部各构成部分的分 布情形,即各构成比重的大小,如构成比;(3)一般线图:用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及变化 趋势;(4)半对数线图:用线段的升降来表示连续性资料随时间的变迁和某事物现象进展变化的 速度;(5)直方图:用直方面积的大小表示数值变量资料频数分布的情形;(6)散点图:用点的密集程度和趋势表示两变量间的相关关系;名师归纳总结 - - - - - - -第 2 页,共 23 页精选学习资料 - - - - - - - - - (7)统计地图:用不同的纹线或颜色说明指标高低,描述某事物现象在行政区域上的分布情形;15. 半对数线图的图形如何做分析?答:用于表示事物的进展速度(相对比);其横轴为算数尺度,纵轴为对数尺度,在比较几组数据的变化速度(相对比) 时,特殊是两组数据相差悬殊时,宜用半对数线图;第三章:定性变量的描述1.为什么不能以构成比代率?答:二者说明的问题不同;构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度;2.简述相对数标准化的基本思想;答 :基本思想 : 采纳统一的标准人口年龄构成,以排除不同人口构成对两地死亡率的影响,使得到的 标准化死亡率具有可比性;3.说明在何种情形下应选用率的直接标化法,何种情形选用间接标化法?答 : 率的直接标化法:已知各组的年龄别死亡率pi;间接标化法 :已知各组的死亡总数和各年龄组人口数 .4.率的直接标化法,与间接标化法有何不同?答 : 1适用条件不同 见第上题 ;2“ 标准” 不同:前者选定一个“ 标准人口” 或“ 标准人口构成”; 后者选定一套“ 标准年龄别死亡率”;5.应用相对数时应留意哪些问题?答:应用相对数指标的时候要留意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较 时应做假设检验;6.常用相对数指标有哪些 . 它们的意义上有何不同 . 答:常用相对数指标:率、构成比、比;率又称频率指标或强度相对数;说明某现象发生的频率或 强度;常用来表示某一事物进展的趋势或水平及特点;构成比又称构成指标或结构相对数; 部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布;常用来表示疾病或死亡的顺位、位次或所占比重;现象间的对比关系,常用倍数或百分数表示;比(又称相对比) 表示同类的或有联系的两个7.统计学上资料是否“ 具有可比性” 指的是什么 . 你能举出一些不行比的例子吗 .答:除争论因素外, 其余重要影响因素应相同或相近;一般观看单位同质,争论方法相同,观看时 间相等,以及地区、民族等客观条件一样;例如内科和外科的治愈率就无可比性;8.何谓人口老龄化?请简述其影响因素;答 1:人口老龄化是指老年人口(65 岁及以上)在人口中所占的比重上升的现象;在没有迁移的 情形下, 人口老龄化的进程主要受生育率和死亡率两种因素的影响;生育率下降,使低年龄人口的比重降低,高年龄人口的比重相应增加;死亡率 (主要是中老年人口的死亡率)降低,使寿命延长,老年人口比重增加;一般来说,人口老龄化的速度和程度主要取决于生育率的下降速度;当生育率水平下降达到很低的水平且很难再有较大程度的降低时,中老年人口死亡率的降低对人口老龄化的影响才比较明显;9.发病率、时点患病率、时期患病率的区分;答:( 1)发病率是指观看期内,可能发生某病的人群中新发病例的频率,其观看期多为年、月、日等,急性常见病多运算发病率;(2)时点患病率反映在检查或调查时点肯定人群中某病的现患情形(包括该病的新旧病例数);观 察时点在理论上是无长度的,但实际上观看时间不宜过长,一般不超过个月;名师归纳总结 - - - - - - -第 3 页,共 23 页精选学习资料 - - - - - - - - - (3)时期患病率反映在观看期间肯定人群中存在或流行某病的频度,包括观看期间的新发病例和现 患病例数,为慢性病的统计指标;10.疾病统计的观看单位“ 病人” 和“ 病例” 的区分;答:(1)一个人每次患病都可作为一个病例;以病例为单位的疾病统计,可争论居民各种疾病的频度、疾病的种类及疾病的变动,以获得居民患病的基本规律;(2)病人是指一个有病的人;在观看期间内,观看对象患有疾病即算作一个病人,不管其患病的种 类及患病次数的多少;以病人为单位的疾病统计,在肯定程度上反映居民的患病频度,可找出具体 的患病人群,便于开展对病人个人的防治工作;11.病死率和死亡率的区分;答:(1)某病病死率表示在规定的观看期内,某病患者中因该病而死亡的频率;它是反映疾病的严峻程度的指标;在用病死率进行比较时应留意病情轻重等内部构成不同的影响;运算公式为:观看期内因某病死亡的人数 某病病死率 = 同期该病患者数× 1000(2)某病死亡率表示在规定的观看期内,人群中因某病而死亡的频率;它可以反映不同地区或岁月 某种疾病的死亡水平;运算公式为:观看期内因某病死亡的人数 某病死亡率 = 同期平均人口数× 100012.简述婴儿死亡率指标的实际意义;答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值;婴儿死亡率 = 某年不满周岁婴儿死亡数 婴儿死亡率的高低对平均寿命有重要的影响,× 1000 /同期活产数 它是反映社会卫生状况和婴儿保健工作的重要指 标,也是死亡统计指标中较为敏锐的指标;婴儿死亡率不受年龄的影响,不同国家或地 区之间可以相互比较;13.请说明频率型指标与强度型指标的主要区分?答:主要区分:指标的说明不同,频率型指标是表示事物内部某个组成部分所占的比重 或分布,或指某现象发生的频率;强度型指标是指单位时间内某现象发生的频率;14. 标准化法的基本思想?答:采纳统一标准构成以排除某因素的内部构成不同对总率的影响,使通过标准化后的 标准化率具有可比性;15. 请比较发病率和患病率的不同;答:发病率表示肯定时期内,在可能发生某病的肯定人群活过的总人年中,新发生的某 病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受 检人数中先患某种病的人数,通常用于描述病程较长或发病时间不易明确的疾病的患病 情形,其分子包括新旧病例数,分母是受检总人数;在肯定的人群和时间内,发病率和患病率有亲密关系,两者与病程(16. 请比较死亡率与病死率的不同;D)的关系是: PR=IR× D;答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率;17. 应用相对数应留意的事项;答: 1. 懂得相对数的含义不行望文生义;2. 频率型指标的说明要紧扣总体和属性;3.运算相对数时分母应有足够数量;4. 正确地合并频率(强度)型指标;5. 相对数间的比较要具备可比性;6. 对相对数的统计推断;18. 应用标准化的留意事项;答: 1. 标准化的应用范畴很广,适用于“ 某大事的发生率” 可以是治愈率,也可以是患病率,仍可以是发病率、病死率等;当某个分类变量在两组中分布不同时,这个分类变名师归纳总结 - - - - - - -第 4 页,共 23 页精选学习资料 - - - - - - - - - 量就成为两组频率比较的混杂因素,标准化法的目的就是排除这个混杂因素的影响;19. 疾病统计有几类指标,各有什么意义?答:发病率、时点患病率、期间患病率、治愈率、生存率、残疾患病率;前 3 种详见上 述简答题;治愈率:表示受治病人中治愈的频率;有效率表示受治病人中治疗有效的频率;两个率主要用于对急性病危害或防治成效的评判;但治愈和有效的标准要有明确而具体的规 病人能活到某一时点的概率;常用 定,只有在标准相同的情形下才可以相互比较;生存率:于对慢性病及心血管病等的治疗成效评判和预后评估;20. 反映疾病的预防成效和治疗成效的指标有哪些?各有什么特点?答: 发病率:疾病防治成效; 患病率:慢性病预防成效; 治愈率:急性病防治成效; 生存率:慢性病的治疗成效;各指标含义详见上述简答题;21. 测量生育水平有几个指标?各指标有什么不同?答: 粗生育率; 总生育率; 年龄别生育率; 总和生育率;各指标含义详见教 材 P41;22. 测量人口再生育水平有几个指标?各指标有什么不同?答: 自然增长率; 粗再生育率; 净再生育率;各指标含义详见教材 P42;23. 人口统计应包括哪几个方面?答:医学人口统计是从卫生保健的角度争论和描述人口数量、分布、结构、变动及其规律,争论人口与卫生事业进展的相互关系,是卫生统计学的重要组成部分;包括描述人口学特点的指标,生育和人口死亡的指标;详见书本P40-44;24. 人口金字塔有几种典型的外形?各说明什么?答:人口金字塔直观地表示了人口的年龄、性别结构;每一层代表一个年龄组的人口,上部代表老年人,下部代表少年儿童,左半部代表男性,右半部代表女性,水平方向的长度 表示男性和女性人口的数量各在总人口中所占的百分比;人口金字塔一共分 3 种类型: 呈真正的金字塔形,说明少年儿童人口占总人口的比重大,预示着将来 年轻型:下宽上窄,人口的进展趋势是增长的;其人口增长模式一般为“ 高 - 低- 高” 模式,主要存在有进展中国家; 成年型:底部与中部的宽窄基本相近,诞生率、死亡率差不多,预示着将来人口的进展趋势是稳固的;其人口增长模式一般为“ 低- 低- 低” 模式; 老年型:上宽下窄,表明少年儿童人口的比重缩小,老年人口比重增大,是诞生率长期下降的结果;这种类型的人口问题主要是育龄人口比重低,假如生育水平不变, 预示着将来人口的进展趋势是负增长的;其人口增长模式一般为“ 低- 低-低” 模式,一般存在于发达国家;第四章:常用概率分布1. 正态分布标准正态分布与对数正态分布在概念上和应用上有何异同?答:概念上: 相同点: 正态分布、 标准正态分布与对数正态分布都是变量的连续型分布;其特点是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐步减小,向外延长,不与横轴相交;相异点:表示方法不同,正态分布用N( ,2)表示,标准正态分布用N(0, 1)表示,对数正态分布N(lgX ,2 lgX )表示;( 1)应用上:相同点:正态分布、对数正态分布都可以转换为标准正态分布;相异点:标准正态分布是标准正态变量u 的分布,标准正态曲线下的面积唯独的由u 打算,给应用带来极大便利;对医学资料呈偏态分布的数据,有的经对数变换后服 从正态分布;正态分布、对数正态分布可描述变量值的分布特点,可用于正常值范畴 估量和质量掌握等;正态分布是许多统计方法的理论基础;2. 医学中参考值范畴的含义是什么?确定的原就和方法是什么?名师归纳总结 - - - - - - -第 5 页,共 23 页精选学习资料 - - - - - - - - - 含义:参考值范畴亦称正常值范畴,它是指特定健康状况人群(排除了有关疾病和因素对所争论指标有影响的所谓“ 正常人” 不同于“ 健康人” 概念)的解剖、生理、生化等数据绝大多数人的波动范畴;( 2)原就: 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越牢靠;一般认为样本含量最好在 的样本为原就;100 例以上,以能得到一个分布较为稳固 对选定的正常人进行精确而统一的测定,保证测定数据牢靠是确定正常值范围的前提; 判定是否要分组(如男女、年龄、地区等)确定正常值范畴; 打算取双侧范畴值仍是单侧范畴值; 选择适当的百分范畴 确定可疑范畴 估量界值(3)方法: 百分位数法: Px=L+(i/fx)( n·x%- fL) 正态分布法(对数正态分布):双侧XuS(或分布不明) 资料; 正态分布法用于听从或近似正lg1XlgXuSlgX百分位数法用于各种分布型态分布(听从对数正态分布)的资料;3. 对称分布资料在“ 均数±1.96 倍标准差” 的范畴内,也包括 95%的观看值吗?答:不肯定;均数±1.96 倍标准差是正态分布的分布规律,对称分布不肯定是正态分 布;4.正态分布的主要特点有哪些?答:( 1)正态曲线在横轴上方均数处最高;(2)正态分布以均数为中心,左右对称;(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数);(4)正态曲线下的面积分布有肯定规律;5.参考值范畴是指什么?答:参考值范畴又称正常值范畴,即大多数正常人某指标值的范畴;“ 正常人” 是指排除 了影响争论指标的疾病和有关因素的同质人群;6.简述估量参考值范畴的步骤与要点;n100;单侧或双侧;指标分布类型;答:设计:样本:“ 正常人”,大样本运算: 如直方图看来像正态分布,位数法;7.简述正态分布的用途;用正态分布法;如直方图看来不像正态分布,用百分答:( 1)估量频数分布;(2)制定参考值范畴;(3)质量掌握;( 4)统计检验的理论基础;8.简述可信区间在假设检验问题中的作用;名师归纳总结 答: 可信区间不仅能回答差别有无统计学意义,而且仍能提示差别有无实际意义;可信区第 6 页,共 23 页间只能在预先规定的概率即检验水准的前提下进行运算,而假设检验能够获得一个较为准确- - - - - - -精选学习资料 - - - - - - - - - 的概率 P 值;故将二者结合起来,才是对假设检验问题的完整分析;9. 二项分布、 Poisson 分布各有哪些特点?答:二项分布和 Poisson 分布都是离散型分布;二项分布的外形取决于 与 n 的大小:=0.5 时,不论 n 大小,分布对称; 0.5 时,图形呈偏态,随 n 的增大,逐步对称;当 n 足够大,或 1-不太小,二项分布 Bn, 近似于正态分布 N n , n 1- ;Poisson 分布:值愈小分布愈偏,愈大分布趋于对称,当 足够大时,分布接近正态分布 N , ;10.简述二项分布、Poisson 分布、正态分布的关系;答:当 n 足够大,或 1-不太小时,二项分布近似于正态分布;当 n 足够大,或1-很小时,二项分布近似于 Poisson 分布;较大时, Poisson 分布近似于正态分布;11.二项分布的应用条件是什么?答:每次试验有且仅有两个相互排斥的结果(A 或非A);每次试验中,发生A 的概率相同,均为 ;各次试验独立,即n 次观看结果相互独立;12. 医学参考值范畴确定的方法是什么?答:百分位数法和正态分布法;13. 简述二项分布、Poisson 分布、正态分布的区分与联系;答:区分:二项分布、Poisson 分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况;联系:Poisson分布可以视为 n 很大而 很小的二项分布;当 n 很大而 和 1 都不是很小的时候二项分布渐近正态分布,当 14. 掌握图的基本原理;=20 的时候 Poisson 分布渐近正态分布;答:当影响某一数值指标的随机因素许多,而每个因素所起的作用均不太大时,这个指 标的随机波动属于随机误差,就往往听从正态分布;相反,假如除随机误差外,仍存在某些影响较大的因素导致的误差,15. 二项分布的特点?称为系统误差, 这时指标的波动就不再听从正态分布;答:二项分布图的高峰在 =n 处或邻近; 为 0.5 时,图形是对称的;当 不等于0.5 时,分布不对称,且对同一 n, 离 0.5 愈远,对称性愈差;对同一 ,随着 n 的增大,分布趋于对称;当 n时,只要 不太靠近 0 或 1,二项分布趋于对称;16.Poisson 分布的特点?答:( 1) Poisson 分布的总体均数与总体方差相等,均为 ;(2)当 较小时,图形呈偏态分布;当 较大时,图形呈正态分布;(3)Poisson 分布的观看结果具有可加性;17. 正态分布曲线的位置与外形的特点?答:( 1)关于= 对称;( 2)在= 处取得该概率密度函数最大值,在= ± 处有拐点;( 3)曲线下面积为1;( 4) 打算曲线在横轴上的位置, 增大,曲线沿横轴向右移;反之, 减小,曲线沿横轴向左移;(5) 打算曲线的外形,当 恒定时, 越大,数据越分散,曲线越“ 矮胖” ;18. 什么叫标准正态分布? 越小,数据越集中,曲线越“ 瘦高” ;答:标准正态分布又称为u 分布, 是以 0 为均数、 以 1 为标准差的正态分布,记为 N( 0,1);标准正态分布曲线下面积分布规律是:在-1.96 +1.96 范畴内曲线下的面积等于0.9500 ,在-2.58 +2.58 范畴内曲线下面积为0.9900 ;统计学家仍制定了一张统计用表(自由度为时),借助该表就可以估量出某些特殊u1 和 u2 值范畴内的曲线下面积;名师归纳总结 - - - - - - -第 7 页,共 23 页精选学习资料 - - - - - - - - - 19. 确定医学参考值范畴的方法及特点?答: 百分位数法:双侧95%医学参考值范畴是(P2.5,P97.5 ),单侧范畴是P95以下(人体有害物质如血铅、发汞等),或P5 以上(如肺活量);该法适用于任何分布类型的资料; 正态分布法:如 X 听从正态分布,医学参考值范畴仍可以依正态分布的规律运算;20. 二项分布的定义是什么?二项分布有哪些基本性质?答:定义: 二项分布是 n 个独立的是 / 非试验中胜利次数的离散概率分布,其中每次试验胜利的概率均为 p;基本性质: 图形特点:具体见 15 题简答题; 二项分布的均数和标准差:详见教材 P66 页公式;21. 二项分布原理可进行哪些统计分析?答:资料需第一满意以下条件: 每次试验只能发生两种对立的可能结果之一,分别发生两种结果的概率之和恒等于 1; 每次试验产生某种结果的概率 固定不变; 重复实验是相互独立的, 任何一次试验结果的显现不会影响其他试验结果显现的概率;可做统计分析包括: 总体率的区间估量:n50 时,用查表法;n50 时,用正态近似法,(p-Z Sp,p+Z Sp; 样本率与总体率的比较:n 50 时,直接概率法;n50 时,用正态近似法; 两样本率的比较;22. 二项分布的拟合优度检验有什么实际意义?答:拟合优度检验,即依据总体分布状况,运算出分类变量中各类别的期望频数,与分布的观看频数进行对比,判定期望频数与观看频数是否有显著差异,从而达到从分类变量进行分析的目的;实际意义在于可以判定某些疾病是否具有家族集合性等;23.Poisson分布的定义?列举几个Poisson 分布变量分布的实例?答: Poisson 分布属于离散型分布,用以描述单位时间、空间、面积等的罕见大事发生次数的概率分布;例如:每毫升水中的大肠杆菌数、每个立升空气中的粉尘计数等;24.Poisson 分布理论可进行哪些统计分析?答:资料第一满意以下条件: 大事发生的概率 固定不变; 每个大事的发生相互独立;可做统计分析包括: 区间估量; 单样本资料 Z 检验; 两独立样本资料 Z 检验;25. 对数正态分布数据如何制定正常值范畴?答: log-1 Yba-1.96Sy log-1 Yba+1.96Sy ;其中: Y=logX;第五章:参数估量基础1标准差和标准误有何区分和联系?表 3-6 标准差与标准误的区分名师归纳总结 意义上标准差( 或s)标准误(a 或s x)第 8 页,共 23 页描述一组变量值之间的离散趋势描述样本均数间的离散趋势应用上 s 越小,表示变量值环绕s 越小,表示样本均数与- - - - - - -精选学习资料 - - - - - - - - - 均值分布越密集,说明均数 总体均数越接近,说明样本的代表性越好;均数推断总体均数牢靠性越大; 可用 X u a s 估量变量值分 可用 X t a , v s x 估量总体布范畴 均数可信区间与 n 的关系 n 越大, s 越趋于稳固 n 越大,s x 越小(2)联系 二者均是表示变异度大小的统计指标; 标准误x/n与标准差大小成正比, 与抽样例数 n 的平方根成反比; 当 n 肯定时,同一份资料,标准差越大,标准误也越大; 2 可信区间和参考值范畴有何不同?参考值范畴是指同质总体中个体变量值的分布范畴,如 X± 1.96s 说明有 95%的变量值分布在此范畴内,它与标准差的大小有关,如个体变异越大,该范畴越宽,分布也就越散;而可信区间是指在可信度为(1- )时,估量总体参数可能存在的范畴;即从同一总体中随机抽样,当 n 肯定时, 每抽一次即可得一个样本均值,以 X t a, v s x 运算可信区间,如 95%可信区间,类似的随机抽样进行一百次, 平均有 95 次,即有 95 个可信区间包括了总体均数,有 5 次没有包括括总体均数,5%是小概率大事, 实际发生的可能性很小,因此实际应用中就认为总体均数在求得的可信区间;这种估量方法犯错误的可能性最大不超过 5%;可信区间与标准误大小有关,标准误越大,可信区间就越大;3.t 分布图形的特点?答:( 1)单峰分布,以 0 为中心,左右对称;(2) 越小, t 值越分散,曲线的峰部越矮,尾部越高;(3)随着 逐步增大,t 分布逐步接近标准正态分布;(4)当 趋向时, t 分布趋近标准正态分布;4. 总体分布的外形和样本含量对样本均数的抽样分布会产生何种影响?答:无论原始数据的总体分布外形如何,即对于任意分布而言,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,样本均数的标准误有公式(6-1 )运算;5. 样本均数的标准误的意义是什么?与原变量的标准差有何区分与联系?答:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小;标准误与标准差的区分:(1)前者表示均数变异的指标,后者是表示观看值变异的指标;(2)用途不同,标准差与均数结合估量参考值范畴,运算变异系数,和标准误等;标准误用于估量参数的可信区间,进行假设检验等;3 它们与样本含量 n 的关系不同,当样本含量 n 足够大时,标准差趋向稳固,而标准误随的增大而减小;联系:当样本量 n 肯定时,标准误随标准差的大小而变化;6. 用同一个样本统计量分别估量总体参数的95%置信区间和99%置信区间, 哪一个估量的精度更好?为什么?答: 95%置信区间的精度要好于99%置信区间;由于置信度或置信水平有95%提高到 99%时,置信区间由窄变宽,估量的精度下降;7. 满意什么条件时可以实行正态近似法估量总体概率的置信区间?名师归纳总结 答:当 n 足够大,且样本频率p 和 1 p 均不太小时,如np 与 n1 p 均大于 5 时,可第 9 页,共 23 页- - - - - - -精选学习资料 - - - - - - - - - 用正态近似法求总体概率的置信区间;8. 什么是抽样误差?如何削减抽样误差?答: 抽样误差: 从某一总体中随机抽取一个或多个样本,所得的样本统计量与相应的总体参数之间的差异, 或者各个样本统计量之间的差异称为抽样误差;可通过增加样本量来削减抽样误差;9. 总体分布的外形和样本含量对样本均数的抽样误差分布会产生何种影响?答:在听从正态分布的总体中进行随机抽样,样本均数呈近似正态分布;在非正态分布的总体中随机抽样, 当样本量较小时, 样本均数的分布呈非正态分布;当样本量足够大时 (如n30),样本均数的分布近似听从正态分布;10. 样本均数的分布有哪些基本特点?答: 样本均数恰好等于总体均数是极其罕见的; 样本均数之间存在差异; 样本均数环绕总体均数,中间多,两边少,左右基本对称,呈近似正态分布; 样本均数之间的变异明显小于原始变量之间的变异;11. 总体均数的可信区间中的可信度和区间的宽度各说明什么问题?答:可信度:反映了估量精确度;区间宽度的一半:反映了估量的精度;12. 抽样误差的大小受哪些因素的影响?答:抽样单位的数目;在其他条件不变的情形下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大; 这是由于随着样本数目的增多,样本结构越接近总体;抽样调查也就越接近全面调查;当样本扩大到总体时,就为全面调查,也就不存在抽样误差了; 总体被争论标志的变异程度;在其他条件不变的情形下,总体标志的变异程度越小,抽样误差越小;总体标志的变异程度越大,抽样误差越大;抽样误差和总体标志的变异程度成正比变化; 这是由于总体的变异程度小,表示吝惜体各单位标志值之间的差异小;就样本指标与总体指标之间的差异也可能小;假如总体各单位标志值相等,就标志变动度为零,样本指标等于总体指标,此时不存在抽样误差;抽样方法的选择;重复抽样和不重复抽样的抽样误差的大小不同;采纳不重复抽样比采纳重复抽样的抽样误差小;抽样组织方式不同;采纳不同的组织方式,会有不同的抽样误差,这是由于不同的抽样组织所抽中的样本,对于总体的代表性也不同;通常, 我们不常利用不同的抽样误差,做出判定各种抽样组织方式的比较标准;13. 可信区间的含义是什么?可信区间的精确度和精密度指的是什么?答:可信区间:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范畴,该范畴称为总体参数的置信区间;精确度:即为置信度;精确度:置信区间宽度的一半;第六章:假设检验基础1. 假设检验和区间估量有何联系?假设检验和区间估量都属于统计推断的内容;假设检验用以推断总体参数间是否有质的区分,并可获得样本统计量,以得到相对精确的概率值;而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验供应更多的信息;但这并不意味着用可信区间代替假设检验,由于假设检验可得到 P 值,比较精确地说明结论的概率保证,而可信区间只能告知我们在某 水准上有无统计意义,却不能像P 那样供应精确的概率;因此,只有将二者有机地结合起来,相互补充,才是完整的分析;名师归纳总结 2. 假设检验时,一般当P <0.05 时, 就拒绝 H 0, 理论依据是什么. 第 10 页,共 23 页假设检验时,当P0.05 ,就拒绝 Ho,其理论依据是在Ho成立的条件下,- - - - - - -精选学习资料 - - - - - - - - - 显现大于等于现有检验统计量的概率P0.05 ,它是小概率大事,即在一次抽样中得到这么小概率是大事是不大可能发生的,因而拒绝它;由此可见,3.t假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05 ;检验和方差分析的应用条件有何异同?(1)相同点:在均