差异显著性检验讲稿.ppt
《差异显著性检验讲稿.ppt》由会员分享,可在线阅读,更多相关《差异显著性检验讲稿.ppt(136页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于差异显著性检验第一页,讲稿共一百三十六页哦 统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验第五章第五章 差异显著性检验差异显著性检验第二页,讲稿共一百三十六页哦一、统计推断的意义和内容一、统计推断的意义和内容统计推断(统计推断(statistical inference):就是根据统计量的分布和):就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。概率理论,由样本统计量来推断总体的参数。统计推断统计推断假设检验(假设检验(hypothesis test)参数估计(参数估计(parametric estimate)第三页,讲稿共一百三十六页哦统计
2、假设检验又称统计假设检验又称显著性检验显著性检验(significance test),它是根据某),它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。统计假设检验的假出在一定概率意义下应当接受哪种假设的方法。统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种,即与要比较的设是对总体提出的,由于最后检验的结论只有两种,即与要比较的总体参数间存在显著差异和
3、不存在显著差异两种。总体参数间存在显著差异和不存在显著差异两种。第四页,讲稿共一百三十六页哦参数估计包括两个方面:参数估计包括两个方面:一是参数的点估计(一是参数的点估计(point estimation)直接用样本的统计量数值估计相应总体的参数;直接用样本的统计量数值估计相应总体的参数;二是参数的区间估计(二是参数的区间估计(interval estimation)在一定的概率保证下(一般为在一定的概率保证下(一般为95%或或99%),由样本统),由样本统计量的分布,计算出总体参数可能出现的数值范围或区间,计量的分布,计算出总体参数可能出现的数值范围或区间,用该区间来估计总体参数所在位置。用
4、该区间来估计总体参数所在位置。第五页,讲稿共一百三十六页哦学学 习习 目目 标标了解假设检验的基本思想了解假设检验的基本思想 掌握假设检验的步骤掌握假设检验的步骤能对实际问题作假设检验能对实际问题作假设检验利用置信区间进行假设检验利用置信区间进行假设检验利用利用P-值进行假设检验值进行假设检验第六页,讲稿共一百三十六页哦第一节第一节 假设检验的一般问题假设检验的一般问题假设检验的概念假设检验的概念假设检验的步骤假设检验的步骤假设检验中的小概率原理假设检验中的小概率原理假设检验中的两类错误假设检验中的两类错误双侧检验和单侧检验双侧检验和单侧检验第七页,讲稿共一百三十六页哦什么是假设?对总体参数的
5、一种看法 总体参数包括总体均值总体均值、比例比例、方差方差等 分析之前之前必需叙述第八页,讲稿共一百三十六页哦概念概念事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立然后利用样本信息来判断原假设是否成立类型类型参数假设检验参数假设检验非非参数假设检验参数假设检验特点特点采用逻辑上的反证法采用逻辑上的反证法依据统计上的小概率原理依据统计上的小概率原理第九页,讲稿共一百三十六页哦假设检验的基本思想假设检验的基本思想m m=50第十页,讲稿共一百三十六页哦假设检验的过程假设检验的过程(提出假设(提出假设抽取样本抽取样本作出决策)作出决策)我
6、认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设!别无选择别无选择.第十一页,讲稿共一百三十六页哦问题的提出问题的提出 例例:某猪场称该场的猪在体重为:某猪场称该场的猪在体重为100kg时的平均背膘厚度为时的平均背膘厚度为9mm。问题:此说法是否正确?有问题:此说法是否正确?有4种可能性(假设)种可能性(假设)1)正确:)正确:m m 9 2)不正确:)不正确:m m 9(|m m 9|0)3)不正确:不正确:m m 9三对假设:三对假设:m m 9 vs m m 9,m m 9 vs m m 9第十二页,讲稿共一百三十六页哦假设检验的基本原理假设检验的基本原理 如何回
7、答如何回答 随机抽取一个样本随机抽取一个样本 计算该样本的平均数计算该样本的平均数 比较样本平均数与比较样本平均数与9mm 难题难题 存在抽样误差存在抽样误差 当样本平均数与当样本平均数与9mm之差达到多大时可否定之差达到多大时可否定m m 9第十三页,讲稿共一百三十六页哦假设检验的基本原理假设检验的基本原理解决的思路解决的思路 针对要回答的问题提出一对对立的假设,并对其中的一个针对要回答的问题提出一对对立的假设,并对其中的一个进行检验进行检验 找到一个样本统计量,它与提出的假设有关,其抽样分布已知找到一个样本统计量,它与提出的假设有关,其抽样分布已知 根据这个统计量观察值出现的概率,利用小概
8、率事件原理对假设是根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断否成立做出推断这个过程称为假设检验这个过程称为假设检验(hypothesis testing)第十四页,讲稿共一百三十六页哦提出无效假设和备择假设提出无效假设和备择假设 什么是无效假设?什么是无效假设?(Null Hypothesis)1.待检验的假设,又称待检验的假设,又称“0假设假设”2.如果错误地作出决策会导致一系列后果如果错误地作出决策会导致一系列后果 3.总是有等号总是有等号,或 4.表示为表示为 H0H0:m 某一数值某一数值 指定为指定为=号,即号,即 或 例如例如,H0:m 3190(克)
9、第十五页,讲稿共一百三十六页哦 什么是备择假设?什么是备择假设?(Alternative Hypothesis)1.与原假设对立的假设 2.总是有不等号:,或 3.表示为 H1H1:m 某一数值,或m 某一数值例如,H1:m 3910(克),或m 3910(克)第十六页,讲稿共一百三十六页哦 什么检验统计量?什么检验统计量?1.用于假设检验问题的统计量用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑选择统计量的方法与参数估计相同,需考虑是大样本还是小样本是大样本还是小样本总体方差已知还是未知总体方差已知还是未知检验统计量的基本形式为检验统计量的基本形式为nxzm0第十七页,讲
10、稿共一百三十六页哦规定显著性水平规定显著性水平 什么显著性水平?什么显著性水平?1.是一个概率值是一个概率值 2.无效假设为真时,拒绝无效假设的概率无效假设为真时,拒绝无效假设的概率 被称为抽样分布的拒绝域被称为抽样分布的拒绝域 3.表示为表示为 (alpha)常用的常用的 值有值有0.01,0.05,0.10 4.由研究者事先确定由研究者事先确定第十八页,讲稿共一百三十六页哦作出统计决策作出统计决策计算检验的统计量计算检验的统计量根据给定的显著性水平根据给定的显著性水平,查表得出相应,查表得出相应的临界值的临界值t 或或t/2/2将检验统计量的值与将检验统计量的值与 水平的临界值进水平的临界
11、值进行比较行比较得出接受或拒绝原假设的结论得出接受或拒绝原假设的结论第十九页,讲稿共一百三十六页哦假设检验中的小概率原理假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生在一次试验中,一个几乎不可能发生的事件发生的概率的事件发生的概率 2.在一次试验中小概率事件一旦发生,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设我们就有理由拒绝原假设 3.小概率由研究者事先确定小概率由研究者事先确定第二十页,讲稿共一百三十六页哦某猪场某猪场10头长白猪和头长白猪和10头大白猪经产母猪的产仔数头大白猪经产母猪的产仔数 平均数平均数1x=11头,标准差头,标准差S1=
12、1.76头头 长白猪长白猪10头经产母猪产仔头经产母猪产仔 长白111191213101313810大白11891012898710平均数平均数1x=9.2头,标准差头,标准差S1=1.55头头 大白猪大白猪10头经产母猪产仔头经产母猪产仔 1x2x能否仅凭这两个平均数的差值能否仅凭这两个平均数的差值 -=1.8头,立即得出长白与大白头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?两品种经产母猪产仔数不同的结论呢?例例第二十一页,讲稿共一百三十六页哦造成这种差异可能有两种原因,一是品种造成的差异,即是长白造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪猪与大白猪本质不
13、同本质不同所致,另一可能是所致,另一可能是试验误差(或抽样误差试验误差(或抽样误差)。)。对两个样本进行比较时,必须判断样本间差异是抽对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。验要解决的问题。第二十二页,讲稿共一百三十六页哦两个总体间的差异如何比较?两个总体间的差异如何比较?一种方法是一种方法是研究整个总体研究整个总体,即由总体中的所有个体数据计算出总体,即由总体中的所有个体数据计算出总
14、体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。体。另一种方法,即另一种方法,即研究样本研究样本,通过样本研究其所代表的总体。,通过样本研究其所代表的总体。设长白猪经产母猪产仔数的总体平均数为设长白猪经产母猪产仔数的总体平均数为 大白猪经产母猪产仔数的总体平均数为大白猪经产母猪产仔数的总体平均数为 试验研究的目的,就是要给试验研究的目的,就是要给 、是否相同做出推断是否相同做出推断。以样本平均数以样
15、本平均数 、作为检验对象,更确切地说,是以作为检验对象,更确切地说,是以(-)作为检验对象)作为检验对象 1m1m2m2m1x2x1x2x第二十三页,讲稿共一百三十六页哦 由于抽样的原因,两样本平均数之差(由于抽样的原因,两样本平均数之差(),即表),即表面效应,或实得差异中一定包含有抽样误差造成的部分,面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的同时也可能包含有由于处理不同造成的总体平均数不等的部分。部分。21xx 无偏估计:如果一个统计量的抽样分布的均值等于相应的总体参数,此时这个统计量就是此参数的无偏估计:如果一个统计量的抽样分布的
16、均值等于相应的总体参数,此时这个统计量就是此参数的无无偏估计值偏估计值;否则,就是;否则,就是有偏估计值有偏估计值如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的有效估计量有效估计量第二十四页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理 通过试验测定得到的每个观测值通过试验测定得到的每个观测值 每个观测值决定于:每个观测值决定于:被测个体所属总体的特征被测个体所属总体的特征个体差异和诸多无法控制的随机因素。个体差异和诸多无法控制的随机因素。所以观测值所以观测值 可
17、以看作由两部分组成,即可以看作由两部分组成,即 ixixiixm 为总体平均数,反映了总体特征为总体平均数,反映了总体特征表示误差表示误差第二十五页,讲稿共一百三十六页哦 若样本含量为若样本含量为n,则可得到,则可得到 n 个观测,个观测,样本平均数样本平均数nx1x2xmmnnxxii/)(说明样本平均数并非等于总体平均数,它还包说明样本平均数并非等于总体平均数,它还包含试验误差的成分含试验误差的成分第二节第二节 显著性检验的基本原理显著性检验的基本原理第二十六页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理上例中两个品种猪的产子数的样本均值分别可表示为:上例中
18、两个品种猪的产子数的样本均值分别可表示为:()()()()212121221121mmmmxxxx111mx长白猪样本均值长白猪样本均值222mx大白猪样本均值大白猪样本均值第二十七页,讲稿共一百三十六页哦对对 显著性检验:就是分析试验的表面效应显著性检验:就是分析试验的表面效应主要由处理效应主要由处理效应 引起的引起的,还是主要由试验,还是主要由试验误差误差 所造成。所造成。第二节第二节 显著性检验的基本原理显著性检验的基本原理()()212121mm xx()21xx()21mm显著性检验的意义显著性检验的意义上式表明:试验的表面效应包括处理效应与误差效应。上式表明:试验的表面效应包括处理
19、效应与误差效应。因此,仅凭样本均值间的因此,仅凭样本均值间的表面差异表面差异就对总体平均数间的差异就对总体平均数间的差异作出判断作出判断(有差异或者没有差异有差异或者没有差异)是不可靠的。只有通过显著性是不可靠的。只有通过显著性检验,才能从作出科学的结论检验,才能从作出科学的结论()21xx()21第二十八页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理 虽然处理效应虽然处理效应 未知,但试验的表面效应未知,但试验的表面效应 是可以计算的,借助数理统计方法可以对试是可以计算的,借助数理统计方法可以对试验误差验误差 作出估计。所以,可从试验的表作出估计。所以,可从试
20、验的表面效应与试验误差的权衡比较中间接地推断处面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思理效应是否存在,这就是显著性检验的基本思想。想。()21xx()21mm()21第二十九页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理二、显著性检验的基本步骤二、显著性检验的基本步骤(一一)首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设(二二)在无效假设成立的前提下,构造并计算合适的统计量在无效假设成立的前提下,构造并计算合适的统计量(三三)给定小概率值给定小概率值(风险水分、显著平准风险水分、显著平准),根据自由度查,根据
21、自由度查 表获取理论临界值表获取理论临界值(四四)依据样本计算得到的统计量与理论临界值的比较,依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。对相关检验作出判断。第三十页,讲稿共一百三十六页哦 这里假设这里假设 或或 ,即假设长白猪和大白猪两品种,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:头是试验误差,处理无效,这种假设称为头是试验误差,处理无效,这种假设称为无效假设无效假设,简记作简记作 :或或 第二节第二节 显著性检验的基本原理显著性检验的基本原理()21mm()021mm()8.
22、121 xx(一一)首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设()21mm()021mm0H第三十一页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理(一一)首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设无效假设是被检验的假设,通过检验可能被无效假设是被检验的假设,通过检验可能被接受接受,也可能被,也可能被否定否定提出无效假设的同时,相应地提出一对应相反假设提出无效假设的同时,相应地提出一对应相反假设,称为备择假设,简记,称为备择假设,简记 备择假设是在无效假设被否定时准备接受的假设备择假设是在无效假设被否定时准备接受的假设AH第三十
23、二页,讲稿共一百三十六页哦上面例子的备择假设是上面例子的备择假设是:即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等或两个均值之差不等于零,亦即存在处理效应,其意不相等或两个均值之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。应在内。第二节第二节 显著性检验的基本原理显著性检验的基本原理(一一)首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设:AH()21mm()021mm或或第三十三页,讲稿共一百三十六页哦第二节第二节
24、显著性检验的基本原理显著性检验的基本原理(二二)在无效假设成立的前提下,构造并计算合适的统计量在无效假设成立的前提下,构造并计算合适的统计量计算得到一个计算得到一个 t 统计量:统计量:2121xxSxxt)11()1()1()()(212112221211-2121nnnnxxxxSniiniixx其中:其中:均数差异标准误均数差异标准误两样本的含量两样本的含量第三十四页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理(二二)在无效假设成立的前提下,构造并计算合适的统计量在无效假设成立的前提下,构造并计算合适的统计量所得的统计量所得的统计量 t 服从自由度服从自由
25、度 df=(n1-1)+(n2-1)的的 t 分布。分布。根据两个样本的数据,计算得:根据两个样本的数据,计算得:)11()1()1()()(212122221121nnnnxxxxSxx742.0)101101()110()110(6.2128426.2742.02.9112121xxSxxt第三十五页,讲稿共一百三十六页哦第二节第二节 显著性检验的基本原理显著性检验的基本原理(三三)给定小概率值给定小概率值(风险水分、显著平准风险水分、显著平准),根据自由度查,根据自由度查 表获取理论临界值表获取理论临界值设定风险水平设定风险水平(显著水平显著水平),其值通常取为,其值通常取为0.01与与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 差异 显著 检验 讲稿
限制150内