《统计学总体均数的估计与检验假设.pptx》由会员分享,可在线阅读,更多相关《统计学总体均数的估计与检验假设.pptx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1统计学总体均数的估计与检验假设统计学总体均数的估计与检验假设总体总体总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断统计推断统计推断统计推断统计推断 statistical inferencestatistical inferencestatistical inferencestatistical inference如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率内容:内容:1.参数估计参数估计(estimation of parameters)
2、包括:点估计与包括:点估计与区间估计区间估计2.假设检验假设检验(test of hypothesis)第1页/共28页总体总体总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断第一节第一节样本均数的标准误样本均数的标准误如:如:样本均数样本均数 样本标准差样本标准差S 样本率样本率 P如:如:总体均数总体均数 总体标准差总体标准差 总体率总体率 抽样误差抽样误差 (sampling sampling error)error):由:由于个体差异导于个体差异导致的致的样本样本统计统计量与量与总体总体参数参数间的差别。间的差别。第2页/
3、共28页一、抽样试验一、抽样试验 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次随机抽)中,每次随机抽取样本含量取样本含量n n5 5,并计算其均数与标准差;重复抽取,并计算其均数与标准差;重复抽取10001000次,获得次,获得10001000份样本;计算份样本;计算10001000份样本的均数与份样本的均数与标准差,并对标准差,并对10001000份样本的均数作直方图。份样本的均数作直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。第3页/共28页
4、抽样试验(抽样试验(n n=5=5)第4页/共28页抽样试验(抽样试验(n n=10=10)第5页/共28页抽样试验(抽样试验(n n=30=30)第6页/共28页10001000份样本抽样计算结果份样本抽样计算结果总体的总体的总体的总体的均数均数均数均数总体标总体标总体标总体标准差准差准差准差s s s s均数的均数的均数的均数的均数均数均数均数均数标准差均数标准差均数标准差均数标准差n n n n=5=5=5=55.005.005.005.000.500.500.500.504.994.994.994.990.22120.22120.22120.22120.22360.22360.2236
5、0.2236n n n n=10=10=10=105.005.005.005.000.500.500.500.505.005.005.005.000.15800.15800.15800.15800.15810.15810.15810.1581n n n n=30=30=30=305.005.005.005.000.500.500.500.505.005.005.005.000.09200.09200.09200.09200.09130.09130.09130.0913第7页/共28页 由于随机抽样而造成的来自同一总体的由于随机抽样而造成的来自同一总体的由于随机抽样而造成的来自同一总体的由于随机
6、抽样而造成的来自同一总体的样本均数之间及样本均数与相应的总体均样本均数之间及样本均数与相应的总体均样本均数之间及样本均数与相应的总体均样本均数之间及样本均数与相应的总体均数之间的差异,称之为均数的抽样误差。数之间的差异,称之为均数的抽样误差。数之间的差异,称之为均数的抽样误差。数之间的差异,称之为均数的抽样误差。抽样误差第8页/共28页 由于样本均数与相应的总体均数之间存在着由于样本均数与相应的总体均数之间存在着由于样本均数与相应的总体均数之间存在着由于样本均数与相应的总体均数之间存在着差异,由数理统计推理可知:从正态总体中随差异,由数理统计推理可知:从正态总体中随差异,由数理统计推理可知:从
7、正态总体中随差异,由数理统计推理可知:从正态总体中随机抽取样本含量为机抽取样本含量为机抽取样本含量为机抽取样本含量为n n的样本,每抽取一个样本的样本,每抽取一个样本的样本,每抽取一个样本的样本,每抽取一个样本可计算一个样本均数,重复可计算一个样本均数,重复可计算一个样本均数,重复可计算一个样本均数,重复100100次抽样可得到次抽样可得到次抽样可得到次抽样可得到100100个样本均数。个样本均数。个样本均数。个样本均数。第9页/共28页这些样本均数服从均数为这些样本均数服从均数为这些样本均数服从均数为这些样本均数服从均数为 ,方差为,方差为,方差为,方差为 的正态分布的正态分布的正态分布的正
8、态分布.样本均数的总体标准差,计样本均数的总体标准差,计样本均数的总体标准差,计样本均数的总体标准差,计算公式为:算公式为:算公式为:算公式为:为了与反映个体差异的标准差(或)相为了与反映个体差异的标准差(或)相为了与反映个体差异的标准差(或)相为了与反映个体差异的标准差(或)相区别,样本均数的标准差用区别,样本均数的标准差用区别,样本均数的标准差用区别,样本均数的标准差用 SESE 表示。表示。表示。表示。第10页/共28页 统计上通常将统计量(如样本均数、样本率统计上通常将统计量(如样本均数、样本率统计上通常将统计量(如样本均数、样本率统计上通常将统计量(如样本均数、样本率p p等)等)等
9、)等)的标准差称为的标准差称为的标准差称为的标准差称为标准误标准误标准误标准误(standard errorstandard error,SESE)。所以,)。所以,)。所以,)。所以,样本均数的标准差样本均数的标准差样本均数的标准差样本均数的标准差 又称为样本均数的标准误,是又称为样本均数的标准误,是又称为样本均数的标准误,是又称为样本均数的标准误,是反映样本均数抽样误差大小的指标。反映样本均数抽样误差大小的指标。反映样本均数抽样误差大小的指标。反映样本均数抽样误差大小的指标。第11页/共28页特点:特点:特点:特点:总体标准误的大小与总体标准差成正比,与样本总体标准误的大小与总体标准差成正
10、比,与样本总体标准误的大小与总体标准差成正比,与样本总体标准误的大小与总体标准差成正比,与样本含量的平方根成反比。含量的平方根成反比。含量的平方根成反比。含量的平方根成反比。即当样本含量即当样本含量即当样本含量即当样本含量n n一定时,标准差越大,一定时,标准差越大,一定时,标准差越大,一定时,标准差越大,即样本的个体差异越大,标准误就越大,样本均数的抽样误差即样本的个体差异越大,标准误就越大,样本均数的抽样误差即样本的个体差异越大,标准误就越大,样本均数的抽样误差即样本的个体差异越大,标准误就越大,样本均数的抽样误差就越大;标准差越小,标准误就越小,即样本均数抽样误差就就越大;标准差越小,标
11、准误就越小,即样本均数抽样误差就就越大;标准差越小,标准误就越小,即样本均数抽样误差就就越大;标准差越小,标准误就越小,即样本均数抽样误差就越小。越小。越小。越小。当标准差一定时,当标准差一定时,当标准差一定时,当标准差一定时,n n越大,越大,越大,越大,SESE就越小;就越小;就越小;就越小;n n越小,越小,越小,越小,SESE就就就就越大。越大。越大。越大。故影响抽样误差大小的主要因素是样本含量。故影响抽样误差大小的主要因素是样本含量。故影响抽样误差大小的主要因素是样本含量。故影响抽样误差大小的主要因素是样本含量。作为总体作为总体作为总体作为总体参数(常数)通常是未知的,因而,在实际工
12、作中常用样本标参数(常数)通常是未知的,因而,在实际工作中常用样本标参数(常数)通常是未知的,因而,在实际工作中常用样本标参数(常数)通常是未知的,因而,在实际工作中常用样本标准差准差准差准差SDSD来估计。来估计。来估计。来估计。第12页/共28页抽样实验小结抽样实验小结 均数的均数围绕总体均数上下波动。均数的均数围绕总体均数上下波动。均数的标准差即标准误均数的标准差即标准误 与总体标准差与总体标准差 相差一个常数的倍数,即相差一个常数的倍数,即 样本均数的标准误(样本均数的标准误(Standard Error)Standard Error)SE=SE=样本标准差样本标准差/第13页/共28
13、页二、二、总体均数的估计总体均数的估计 (一)(一)总体均数的点估计(总体均数的点估计(point estimationpoint estimation)与区间估计)与区间估计参数的估计参数的估计点估计点估计:由样本统计量:由样本统计量 直接估计直接估计 总体参数总体参数区间估计区间估计:在一定:在一定可信度可信度(Confidence level)下,下,同时考虑抽样误差同时考虑抽样误差第14页/共28页 统计学中的统计推断包括两个重要的方面:统计学中的统计推断包括两个重要的方面:1 1 利用样本统计量的信息对相应总体参数值做出推利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计
14、总体均数,用样本标准差断,如用样本均数估计总体均数,用样本标准差S S估计总体标准差等,称之为点估计。估计总体标准差等,称之为点估计。2 2 利用样本统计量来推断我们是否接受一个事先的利用样本统计量来推断我们是否接受一个事先的假设,称之为假设,称之为假设检验假设检验。本章只讨论。本章只讨论参数估计参数估计。参数估计又分为参数估计又分为点估计点估计与与区间估计区间估计。第15页/共28页1.1.点估计点估计点估计点估计 总体均数的点估计总体均数的点估计总体均数的点估计总体均数的点估计(point estimation)(point estimation)就是用样本均数来直接地估计总体就是用样本均
15、数来直接地估计总体就是用样本均数来直接地估计总体就是用样本均数来直接地估计总体均数,这种方法比较简单,由于没均数,这种方法比较简单,由于没均数,这种方法比较简单,由于没均数,这种方法比较简单,由于没有考虑到抽样误差,只适合大样本有考虑到抽样误差,只适合大样本有考虑到抽样误差,只适合大样本有考虑到抽样误差,只适合大样本资料的统计推断。资料的统计推断。资料的统计推断。资料的统计推断。第16页/共28页2.2.区间估计区间估计区间估计区间估计 总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计(interval estimation)(interval estimation)是
16、利用样本信息给出一个区间,并同时给是利用样本信息给出一个区间,并同时给是利用样本信息给出一个区间,并同时给是利用样本信息给出一个区间,并同时给出重复试验时该区间包含总体均数的概率。出重复试验时该区间包含总体均数的概率。出重复试验时该区间包含总体均数的概率。出重复试验时该区间包含总体均数的概率。第17页/共28页1 1)可信区间可信区间可信区间可信区间的涵义的涵义的涵义的涵义 从总体中作随机抽样,对于含量为从总体中作随机抽样,对于含量为从总体中作随机抽样,对于含量为从总体中作随机抽样,对于含量为n n的每个样本而言,都可的每个样本而言,都可的每个样本而言,都可的每个样本而言,都可以算得一个区间。
17、以以算得一个区间。以以算得一个区间。以以算得一个区间。以95%95%的可信区间为例,意味着在同一总的可信区间为例,意味着在同一总的可信区间为例,意味着在同一总的可信区间为例,意味着在同一总体中作体中作体中作体中作100100次重复抽样,可得次重复抽样,可得次重复抽样,可得次重复抽样,可得100100个可信区间,平均有个可信区间,平均有个可信区间,平均有个可信区间,平均有9595个可个可个可个可信区间包含总体均数(估计正确),只有信区间包含总体均数(估计正确),只有信区间包含总体均数(估计正确),只有信区间包含总体均数(估计正确),只有5 5个可信区间不包含个可信区间不包含个可信区间不包含个可信
18、区间不包含总体均数(估计不正确),或对于某一个区间而言,它包含总体均数(估计不正确),或对于某一个区间而言,它包含总体均数(估计不正确),或对于某一个区间而言,它包含总体均数(估计不正确),或对于某一个区间而言,它包含总体均数的可能性为总体均数的可能性为总体均数的可能性为总体均数的可能性为95%95%,而不包含总体均数的可能性仅为,而不包含总体均数的可能性仅为,而不包含总体均数的可能性仅为,而不包含总体均数的可能性仅为5%5%。因此以这种方法估计总体均数犯错误的概率仅为。因此以这种方法估计总体均数犯错误的概率仅为。因此以这种方法估计总体均数犯错误的概率仅为。因此以这种方法估计总体均数犯错误的概
19、率仅为5%5%。第18页/共28页2 2)可信区间具有两个要素)可信区间具有两个要素)可信区间具有两个要素)可信区间具有两个要素(1)(1)准确度(准确度(准确度(准确度(accuracyaccuracy),即可信区间包含的概率的),即可信区间包含的概率的),即可信区间包含的概率的),即可信区间包含的概率的大小,一般而言概率越大越好。大小,一般而言概率越大越好。大小,一般而言概率越大越好。大小,一般而言概率越大越好。(2)(2)精密度(精密度(精密度(精密度(precisionprecision),反映区间的长度,区间),反映区间的长度,区间),反映区间的长度,区间),反映区间的长度,区间的长
20、度越窄,估计的精密度越好,反之越差。的长度越窄,估计的精密度越好,反之越差。的长度越窄,估计的精密度越好,反之越差。的长度越窄,估计的精密度越好,反之越差。第19页/共28页 (1)(1)总体标准差总体标准差总体标准差总体标准差 未知时未知时未知时未知时 :用样本标准差用样本标准差用样本标准差用样本标准差S S 作为的估计值计算标作为的估计值计算标作为的估计值计算标作为的估计值计算标 准误,按准误,按准误,按准误,按t t分布原理。分布原理。分布原理。分布原理。3)可信区间的计算第20页/共28页第21页/共28页 (2)(2)总体标准差总体标准差 已知或总体标已知或总体标准差准差 未知但未知
21、但n n足够大足够大:按正态分布原理;当足够大按正态分布原理;当足够大(n n大于大于6060)时用作为估计值。)时用作为估计值。第22页/共28页第23页/共28页第24页/共28页 第二节第二节 率的标准误率的标准误一、率的抽样误差与标准误一、率的抽样误差与标准误 由于抽样造成的样本率之间及样本率与总体由于抽样造成的样本率之间及样本率与总体率之间的差别称为率的抽样误差。率的抽率之间的差别称为率的抽样误差。率的抽样误差大小可由率的标准误来衡量。样误差大小可由率的标准误来衡量。第25页/共28页 如果总体率如果总体率未知,用未知,用样本率样本率p估计估计第26页/共28页三、总体率的估计三、总体率的估计三、总体率的估计三、总体率的估计 (一)点估计(一)点估计(一)点估计(一)点估计 直接用样本率去估计总体率。即:直接用样本率去估计总体率。即:直接用样本率去估计总体率。即:直接用样本率去估计总体率。即:(二)区间估计(二)区间估计(二)区间估计(二)区间估计 当当当当n n足够大,且足够大,且足够大,且足够大,且npnp与与与与n(1-p)n(1-p)均大于均大于均大于均大于5 5时,时,时,时,p p的抽样的抽样的抽样的抽样分布近似正态分布分布近似正态分布分布近似正态分布分布近似正态分布第27页/共28页
限制150内