抽样误差与假设检验、t检验ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样误差与假设检验、t检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《抽样误差与假设检验、t检验ppt课件.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 抽样误差与假设检验抽样误差与假设检验第四章第四章 抽样误差与假设检验抽样误差与假设检验 几个概念:几个概念: 计量资料:计量资料:测定每个观察单位某项指标量的大测定每个观察单位某项指标量的大小得到的数据(资料)。小得到的数据(资料)。 总体:总体:研究对象(某项变量值)的全体。研究对象(某项变量值)的全体。 样本:样本:总体中随机抽取的一部分研究对象的某总体中随机抽取的一部分研究对象的某项变量值。项变量值。 统计量:统计量:从样本计算出来的统计指标。从样本计算出来的统计指标。 参数:参数:总体的统计指标叫总体参数。总体的统计指标叫总体参数。第四章第四章 抽样误差与假设检验抽样误差
2、与假设检验 统计推断:统计推断:用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。 包括:包括: 参数估计参数估计: 运用统计学原理,用从样本计算出运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。来的统计指标量,对总体统计指标量进行估计。 假设检验:假设检验:又称显著性检验,是指由样本间存又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差在的差别对样本所代表的总体间是否存在着差别做出判断。别做出判断。 方法:方法:均数的参数估计、均数均数的参数估计、均数t 检验检验第四章第四章 抽样误差与假设检验抽样误差与假设检验一、抽样误差与标准误一、抽
3、样误差与标准误(一)概念(一)概念 1、抽样误差抽样误差:是伴随抽样所产生的样本统是伴随抽样所产生的样本统计量与参数之间的差别。计量与参数之间的差别。 2、标准误标准误 :符号符号 ,表示抽,表示抽样误差大小的指标;也称为样本均数的标准样误差大小的指标;也称为样本均数的标准差;差;反映了用样本均数代替总体均数的可靠反映了用样本均数代替总体均数的可靠性程度的大小性程度的大小,增加样本容量可以降低抽样,增加样本容量可以降低抽样误差。误差。 )xxs、(抽样误差与抽样分布抽样误差与抽样分布第四章第四章 抽样误差与假设检验抽样误差与假设检验(二)、表达式与计算(二)、表达式与计算nsxnxs 样本均数
4、的标准差样本均数的标准差,也称为,也称为标准标准误误,反映了样本均数间的离散程,反映了样本均数间的离散程度,也反映了样本均数与总体均度,也反映了样本均数与总体均数的差异。数的差异。例例4.1 某市随机抽查某市随机抽查12岁男孩岁男孩100人,得身高均数人,得身高均数139.6cm,标标准差准差6.85cm,计算标准误。计算标准误。)(685. 010085. 6cmnsxs标准差与标准误联系与区别标准差与标准误联系与区别标准差标准差标准误标准误含含义义测量值的离散程度测量值的离散程度样本均数的离散程度样本均数的离散程度(统计量对参数的散度)(统计量对参数的散度)计计算算大大小小大大小小用用途途
5、描述测量值离散程度、计描述测量值离散程度、计算算cv、计算正常值范围、计算正常值范围、计算标准误计算标准误参数可信区间的估计参数可信区间的估计假设检验,表达误差的内涵假设检验,表达误差的内涵联联系系都是离散程度的指标都是离散程度的指标,标准误是通过标准差来计算标准误是通过标准差来计算1)()(22nxxnxsnsnxsx第四章第四章 抽样误差与假设检验抽样误差与假设检验二、抽样分布、抽样分布从正态总体中抽样,样本均数(从正态总体中抽样,样本均数( )的抽样分布:)的抽样分布:1. n较大时(较大时(n50), 服从正态分布服从正态分布,经过标准化转换经过标准化转换 服从标准正态分布即服从标准正
6、态分布即 u分布分布2. n较小时(较小时(n50),), 是非正态的单峰对称分布是非正态的单峰对称分布 就有小样本统计量就有小样本统计量( )的转换值服从的转换值服从t分布分布(是一组曲线)。(是一组曲线)。 xxxuxxxsxt第四章第四章 抽样误差与假设检验抽样误差与假设检验抽样分布抽样分布第四章第四章 抽样误差与假设检验抽样误差与假设检验 英国统计学家:哥塞德在英国统计学家:哥塞德在1908年以笔名年以笔名“student”提出了著名的提出了著名的t分布分布,故也称为,故也称为student t分布。分布。 t分布是描述分布是描述小样本均值转换度小样本均值转换度的分布。的分布。1、从正
7、态总体中抽样,大样本均数的转换值服从、从正态总体中抽样,大样本均数的转换值服从标准正太分布标准正太分布2、小样本均数的转换值服从、小样本均数的转换值服从t分布分布第四章第四章 抽样误差与假设检验抽样误差与假设检验(1)tu (n)(2)和)和N(0, 1)一样都是单峰分布,以一样都是单峰分布,以0为中心对为中心对称称(3) 越小,则越小,则 越大,越大,t值越分散,和值越分散,和N(0, 1)相比,集中在这部分的比例越少,尾部相比,集中在这部分的比例越少,尾部翘得越高。翘得越高。sx 2、t分布的特征分布的特征第四章第四章 抽样误差与假设检验抽样误差与假设检验第四章第四章 抽样误差与假设检验抽
8、样误差与假设检验t 分布(与分布(与u 分布分布 比较的特点)比较的特点)第四章第四章 抽样误差与假设检验抽样误差与假设检验 横坐标为自由度横坐标为自由度 ,纵坐标为概率,纵坐标为概率p,表中数字表示自由度为表中数字表示自由度为 、p为为 、t的界值,的界值,记记 如单侧如单侧 =0.05, =20可查得可查得 =1.725 表示表示p(t1.725)=0.05 由由t分布的对称性分布的对称性p(t-1.725)=0.05 t,以外尾部面积的百分数是以外尾部面积的百分数是 3、t界值表界值表1 n)(t)(/2,t第四章第四章 抽样误差与假设检验抽样误差与假设检验 的界值的界值)(2/05.
9、0t第四章第四章 抽样误差与假设检验抽样误差与假设检验与u分布比较 U的临界值小于的临界值小于t曲线相应的临界值的绝对曲线相应的临界值的绝对值值当当n时,临界值相近。时,临界值相近。 自由度越小,自由度越小,t的临界点越偏离的临界点越偏离u的临界点。的临界点。第四章第四章 抽样误差与假设检验抽样误差与假设检验总体均数的参数估计总体均数的参数估计 参数估计参数估计:是指由样本指标值(统计:是指由样本指标值(统计量)估计总体指标值(参数)量)估计总体指标值(参数),即用即用样本均数样本均数估计估计总体均数总体均数,有两种估计,有两种估计方法:方法: (1)、点估计、点估计(近似值)(近似值) (2
10、)、区间估计、区间估计(近似范围)(近似范围)第四章第四章 抽样误差与假设检验抽样误差与假设检验一、点估计一、点估计 点估计点估计: 用样本均数直接作为总体均数的估计用样本均数直接作为总体均数的估计值值,未考虑抽样误差。未考虑抽样误差。 如用如用 估计相应的估计相应的 当当 时时,样本均值趋近于总体均样本均值趋近于总体均值值. 如果如果 ,则则 更可靠更可靠.x)(n21xxss 2xs第四章第四章 抽样误差与假设检验抽样误差与假设检验二、区间估计二、区间估计 1、概念、概念 可信区间:可信区间:也称为置信区间(也称为置信区间(confidence interval,CI),是按预先给定的概率
11、估计未知总体是按预先给定的概率估计未知总体均数的可能范围均数的可能范围. 事先给定的概率事先给定的概率1-称为可信度,常取称为可信度,常取95%或或99% 总体均数的总体均数的95%(或(或99%)可信区间:)可信区间:表示该表示该区间包括总体均数区间包括总体均数的概率为的概率为95%(或(或99%).第四章第四章 抽样误差与假设检验抽样误差与假设检验 根据总体标准差根据总体标准差是否已知,以及是否已知,以及样本含量样本含量n的大小而异。的大小而异。 (1)t分布法(n50) 2、计算方法、计算方法第四章第四章 抽样误差与假设检验抽样误差与假设检验(1)t分布法(分布法(未知,未知,n50)
12、总体均数的可信区间总体均数的可信区间. 已知已知: 未知但未知但n足够大足够大:),(2/2/nuxnux),(2/2/nsuxnsux第四章第四章 抽样误差与假设检验抽样误差与假设检验 u可以查表可以查表 某地某地12岁男孩身高均数的岁男孩身高均数的95%的可信区间的可信区间. 本例中本例中:n=100, =139.6,s=6.85,u0.05=1.96 该地该地12岁男孩身高均数的岁男孩身高均数的95%可信区间为可信区间为: 138.3(cm)141.0(cm) x),即(0 .1413 .138)10085. 696. 16 .139,10085. 696. 16 .139(第四章第四章
13、 抽样误差与假设检验抽样误差与假设检验注意 (1)统计意义:)统计意义:从总体中作大数次随机抽从总体中作大数次随机抽样,有样,有95%求得的可信区间包含总体均数。求得的可信区间包含总体均数。并不是做一次抽样求得可信区间包括并不是做一次抽样求得可信区间包括的概的概率是率是0.95,对一次抽样而言只有两种可能,对一次抽样而言只有两种可能,要么可信区间包含要么可信区间包含,要么不包含,要么不包含。 (2)与医学正常值范围不同与医学正常值范围不同第四章第四章 抽样误差与假设检验抽样误差与假设检验正常值范围估计与可信区间估计正常值范围估计与可信区间估计正常值范围正常值范围概念概念:绝大多数正常人的某指绝
14、大多数正常人的某指标范围。(标范围。(95%,99%, 指绝大指绝大多数正常人)多数正常人)计算公式:计算公式:用途:用途:判断观察对象的某判断观察对象的某项指标是否正常项指标是否正常.可信区间可信区间概念:概念:总体均数所在的数值总体均数所在的数值范围(范围( 95%,99% 指可信度)指可信度)计算公式:计算公式:用途:用途:估计总体均数估计总体均数第四章第四章 抽样误差与假设检验抽样误差与假设检验 假设检验(假设检验(hypothesis test)也称显著性检验)也称显著性检验(significance test)。二十世纪二、三十年代。二十世纪二、三十年代Neyman和和Pearso
15、n建立了统计假设检验问题的建立了统计假设检验问题的数学模型。数学模型。 假设检验假设检验: 建立在统计抽样分布建立在统计抽样分布,小概率事件原理小概率事件原理基础上的对差别性质进行风险推断的一种逻辑思基础上的对差别性质进行风险推断的一种逻辑思维方法维方法.第四章第四章 抽样误差与假设检验抽样误差与假设检验假设检验:假设检验:1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果第四章第四章 抽样误差与假设检验抽样误差与假设检验1、假设检验的原因、假设检验的原因 由于个体差异的存在,即使从同一总体中由于个体差异的存在,即使从同一总体中严格的随机抽样,严格的随机抽样,X1、X2、X3、X4
16、、,、,不同。不同。 因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性造成了样本均数的差别。差别无显著性 。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。第四章第四章 抽样误差与假设检验抽样误差与假设检验 根据大量调查,已知健康成年男子脉搏的根据大量调查,已知健康成年男子脉搏的均数为均数为72次次/分分,某医生在一山区随机调查,某医生在一山区随机调查了了30名健康成年男子,求得脉搏均数为名健康成年
17、男子,求得脉搏均数为74.2次次/分分, 标准差为标准差为6.5次次/分,能否据此认分,能否据此认为该山区成年男子的脉搏均数高于一般人为该山区成年男子的脉搏均数高于一般人?第四章第四章 抽样误差与假设检验抽样误差与假设检验 我们当然不能强求脉搏均数恰为我们当然不能强求脉搏均数恰为72次次/分时,分时,才认为山区成年男子的脉搏均数和一般人一才认为山区成年男子的脉搏均数和一般人一样,因为即使一样由于抽样误差的存在,样样,因为即使一样由于抽样误差的存在,样本均数未必等于本均数未必等于72,造成山区健康成年男子,造成山区健康成年男子的脉搏样本均数与一般人不同的原因有的脉搏样本均数与一般人不同的原因有:
18、 抽样误差抽样误差 环境因素的影响环境因素的影响要回答这一问题就是假设检验问题要回答这一问题就是假设检验问题第四章第四章 抽样误差与假设检验抽样误差与假设检验2、假设检验的目的、假设检验的目的l判断是由于何种原因造成的不同,以做判断是由于何种原因造成的不同,以做出决策。出决策。(推断参数是否相等推断参数是否相等)0100:H:H无效假设无效假设备择假设备择假设第四章第四章 抽样误差与假设检验抽样误差与假设检验 反证法:反证法:当一件事情的发生只有两种可能当一件事情的发生只有两种可能A和和B,为了肯定其中的一种情况为了肯定其中的一种情况A,但又不能直接证实,但又不能直接证实A,这时否定另一种可能
19、这时否定另一种可能B,则间接的肯定了,则间接的肯定了A。 小概率事件原理小概率事件原理: 小概率事件在一次抽样中不可小概率事件在一次抽样中不可能发生能发生. 概率论:概率论:事件的发生不是绝对的,只是可能性大事件的发生不是绝对的,只是可能性大小而已。即小而已。即,带有风险性的推断带有风险性的推断.第四章第四章 抽样误差与假设检验抽样误差与假设检验 建立一对假设建立一对假设(注意注意单双侧单双侧)确定显著性水准(确定显著性水准( ): 无效假设无效假设(H0):两个总体均数相等;:两个总体均数相等; 备择假设备择假设(H1):与与 H0 相反相反; 预先给定的概率值预先给定的概率值(0.05或或
20、0.01),区分大小概率事件的标准区分大小概率事件的标准. 如上例,如上例,H0:1=72 H1:172 =0.05 计算统计量:计算统计量:(选择不同的统计方法:选择不同的统计方法:u检验检验, t检验检验,F检验等检验等) 确定概率值确定概率值p和做出统计推断结论和做出统计推断结论:(p值实际得到犯一类错误的可能性值实际得到犯一类错误的可能性,p,则统计推断为按则统计推断为按检验水准检验水准,不拒不拒绝绝H0。)第四章第四章 抽样误差与假设检验抽样误差与假设检验5、假设检验的结果、假设检验的结果 不拒绝无效假设不拒绝无效假设 拒绝拒绝无效假设无效假设 正确理解结论的概率性(都隐含着犯错误的
21、可能正确理解结论的概率性(都隐含着犯错误的可能性)。性)。第四章第四章 抽样误差与假设检验抽样误差与假设检验六、均数的假设检验 t检验(t test)也称student t检验,是计量资料中最常用的假设检验方法,它以t分布为基础. 本章将要介绍 单个样本的单个样本的t检验检验 ( (样本均值与总体均值的比较样本均值与总体均值的比较) ) 配对样本配对样本t检验检验 两独立样本的两独立样本的t检验检验 ( (两样本均值的比较两样本均值的比较, ,方差方差一致一致) )第四章第四章 抽样误差与假设检验抽样误差与假设检验单个样本单个样本t检验检验 单个样本单个样本t检验检验:是样本均数是样本均数 代
22、表的总体均代表的总体均数数 和已知总体均数和已知总体均数 的比较的比较. 适用条件:适用条件: (1) 已知一个总体均数;已知一个总体均数; (2) 可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误; (3) 样本量样本量小于小于50; (4) 样本来自正态或近似正态总体。样本来自正态或近似正态总体。x0第四章第四章 抽样误差与假设检验抽样误差与假设检验 例例: 根据大量调查根据大量调查,已知健康成年男子的脉已知健康成年男子的脉搏均数为搏均数为72次次/分分.某医生在某山区随机调查某医生在某山区随机调查30名健康男子名健康男子,求得脉搏均数为求得脉搏均数为74.2次次/分分,
23、标准差为标准差为6.5次次/分分.能否认为该山区的成年能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏男子的脉搏均数高于一般成年男子的脉搏均数均数?第四章第四章 抽样误差与假设检验抽样误差与假设检验因本例已知因本例已知 =72次次/分分, =74.2次次/分分, s=6.5次次/分分,n=30, 由于已知由于已知 ,故选用单样本故选用单样本t检验检验0 x0 1 1、建立检验假设,确定概率水准、建立检验假设,确定概率水准 山区成年男子平均脉搏数与一般成年男子相同。山区成年男子平均脉搏数与一般成年男子相同。 山区成年男子平均脉搏数与一般成年男子不同。山区成年男子平均脉搏数与一般成年男子不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 假设检验 检验 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内