数理统计统计量及其分布.pptx
5.3.1 统计量及其分布定义统计量:设x1,x2,xn为取自某总体的样本,若样本函数T=T(x1,x2,xn)中不含有任何未知参数,则称T为统计量.抽样分布:统计量的分布成为抽样分布.第1页/共52页第2页/共52页注:统计量不依赖于未知参数,但是它的分布一般是依赖与未知参数的.第3页/共52页5.3.2 样本均值及其抽样分布定义定义5.3.2 设设x1,x2,xn为取自某总体的样本为取自某总体的样本,其算术其算术平均值称为平均值称为样本均值样本均值,一般用,一般用 表示表示,即即在分组样本场合在分组样本场合,样本均值的近似公式为样本均值的近似公式为其中其中k为组数为组数,xi为第为第i组的组中值组的组中值,fi为第组的频数为第组的频数.第4页/共52页例5.3.1 某单位收集到20名青年人的某月的娱乐支出费用数据:79 84 84 88 92 93 94 97 98 99 100 101 101 102 102 108 110 113 118 125则该月这20名青年的平均娱乐支出为第5页/共52页将这20个数据分组可以得到如下频数频率分布:组序分组区间组中值频数频率第6页/共52页 定理5.3.1 若把样本中的数据与样本均值之差称为偏差,则样本所有偏差之和为0,即定理5.3.2 数据观察值与均值的偏差平方和最小,即在形如的函数中,最小,其中为任意给定常数.第7页/共52页定理5.3.2 数据观察值与均值的偏差平方和最小,即在形如的函数中,最小,其中c为任意给定常数.第8页/共52页证明:为任意给定常数c第9页/共52页定理5.3.3 设x1,x2,xn是来自某个总体的样本,为样本均值1)若总体分布为 ,则2)若总体分布未知或者不是正态分布,但则n较大时第10页/共52页证明:1)证明见p210,习题13.(提示:用特征函数的性质证)2)由中心极限定理,第11页/共52页例5.3.3 求样本容量为30,总体分布如下的样本均值的渐进分布:1)总体分布为均匀分布U(1,5);2)总体分布密度函数为(倒三角分布)3)总体分布为指数分布Exp(1);第12页/共52页解:1)均匀分布U(1,5)的均值和方差分别为3和4/3,所以样本均值的渐进分布为2)容易算出该分布均值和方差分别为3和2,所以样本均值的渐进分布为3)指数分布Exp(1)的均值和方差都为1,所以样本均值的渐进分布为第13页/共52页5.3.3 样本方差和样本方差和 样本标准差样本标准差第14页/共52页称为样本方差.称为样本标准差.也称为样本方差(也称无偏方差)也称为样本标准差.不大时常用在定义5.3.3 设x1,x2,xn是来自某个总体的样本,则它的平均偏差平方和:关于样本均值第15页/共52页说明:称为偏差平方和 的自由度自由度的含义是:个偏差中只有个数据可以自由变动,而第个则不能自由取值,因为第16页/共52页分组样本场合,样本方差的近似计算公式分组样本场合,样本方差的近似计算公式为为练习:例第17页/共52页定理5.3.4 设总体X具有二阶矩,即x1,x2,xn为从总体得到的样本,则:证明:第18页/共52页第19页/共52页5.3.4 样本矩及其函数样本矩及其函数第20页/共52页定义5.3.4 设x1,x2,xn是样本,则统计量称为样本阶原点矩称为样本 阶中心矩,是样本矩吗?请回答:定义5.3.5 设x1,x2,xn是样本,则统计量称为样本偏度.第21页/共52页说明:反映了总体分布密度曲线的对称性信息.1、是个相对数,刻画了数据分布的偏斜方向和程度.2、说明数据是对称的.称为样本偏度.第22页/共52页说明数据中有几个较大的数,反映总体分布是正偏的或右偏的.说明数据中有几个较小的数,反映总体分布是负偏的或左偏的.第23页/共52页定义5.3.6 设x1,x2,xn是样本,则统计量称为样本峰度.第24页/共52页第25页/共52页第26页/共52页第27页/共52页5.3.5 次序统计量次序统计量及其分布及其分布第28页/共52页一、次序统计量的定义及性质 第29页/共52页例 设总体X的分布为仅取0,1.2的离散均匀分布,分布列为x012p1/31/31/3现从中抽取容量为3的样本,其一切可能取值有将它们列在下表左侧,其右侧是相应的次序统计量观测值。第30页/共52页000000120012001001210012010001022022100001202022002002220022020002112112200002121112011011211112101011122122110011212122012012221122021012111111102012222222201012第31页/共52页第32页/共52页二、次序统计量的抽样分布 第33页/共52页练习:请写出最小次序统计量和最大次序统计量的密度函数.(p157)第34页/共52页 例中抽得一个容量为5的样本,试计算现从该总体设总体密度函数为解:由总体密度函数求出总体分布函数为:第35页/共52页例这正是的分布.设总体分布为第36页/共52页例设总体分布为极差第37页/共52页5.3.6 样本中位数与 样本分位数第38页/共52页第39页/共52页第40页/共52页第41页/共52页5.3.7 五数概括与箱线图所谓五数概括就是用这五个数来大致描述一批数据的轮廓第42页/共52页5.3.7 五数概括与箱线图一、单批数据箱线图二、多批数据箱线图第43页/共52页用箱线图初步考察测验成绩的分布 sas程序如下:1)单批数据箱线图 第44页/共52页第45页/共52页第46页/共52页第47页/共52页2)多批数据箱线图 对于多批数据,我们可以将各批数据的箱线图并列起来,从而进行分布特征的比较.sas程序如下:第48页/共52页第49页/共52页第50页/共52页作业题:必做:11、14、18、23选做:19、24第51页/共52页感谢您的观看!第52页/共52页