《总体样本与统计量.ppt》由会员分享,可在线阅读,更多相关《总体样本与统计量.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 统计概念统计概念第一节第一节 总体、样本与统计量总体、样本与统计量第二节第二节 顺序统计量、经验分布函数顺序统计量、经验分布函数 和直方图和直方图第三节第三节 抽样分布抽样分布第四节第四节 应用案例应用案例第一节第一节 总体、样本与统计量总体、样本与统计量1 总体与个体总体与个体2 样本样本3 常用统计量常用统计量 一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象.1.1.总体(总体(population)研究对象的全体称为研究对象的全体称为总体总体,总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体中每个成员称为总体中每个成员称为
2、个体个体,因此在理论上可以把因此在理论上可以把总体总体与与概率分布概率分布等同起来等同起来.总总体可以用随机变量及其分布来描述体可以用随机变量及其分布来描述.在实际研究中在实际研究中,我们关心的是总体中的个体的某个我们关心的是总体中的个体的某个或某些指标或某些指标(如人的身高、灯泡的寿命如人的身高、灯泡的寿命,汽车的耗油量汽车的耗油量).例例1 研究某批灯泡的寿命时,关心的数量指标就是研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量寿命,那么,此总体就可以用随机变量 X 表示,或表示,或用其分布函数用其分布函数 F(x)表示表示.某批某批灯泡的寿命灯泡的寿命总体总体寿
3、命寿命 X 可用一概率(指数)可用一概率(指数)分布来刻划分布来刻划 类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,用若关心的数量指标是身高和体重,用 X 和和Y 分别表分别表示身高和体重,那么此总体就可用二维随机变量示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数或其联合分布函数 F(x,y)来表示来表示.统计中,统计中,总体就是一个概率分布总体就是一个概率分布.2.样本(样本(sample)(1)定义定义 为了解总体的分布为了解总体的分布,从总体中随机地从总体中随机地取取 n 个有代表性的个体个有代表性的个体
4、 X1,Xn ,称称 X1,Xn 为总体的为总体的一个样本一个样本;n 称为称为样本容量样本容量.在实施抽样之后,得到在实施抽样之后,得到 n 个实数个实数 x1,xn,它们分别是它们分别是 X1,Xn 的观测值,称为的观测值,称为样本值,样本值,有时简称样本有时简称样本.注注:样本的二重性样本的二重性1.样本是随机变量样本是随机变量:X1,X2,Xn2.样本是一组数值样本是一组数值:x1,x2,xn例例.啤酒厂生产的瓶装啤酒规定净含量为啤酒厂生产的瓶装啤酒规定净含量为 640 g,由于随由于随机性机性,事实上不可能使得所有的啤酒净含量均达到标准事实上不可能使得所有的啤酒净含量均达到标准.现从
5、某厂生产的啤酒中随机地抽取现从某厂生产的啤酒中随机地抽取 10 瓶测定其净含量瓶测定其净含量,记为记为X1,X2,X10,具体结果如下:,具体结果如下:641 635 640 637 642 638 645 643 639 640这是一容量为这是一容量为 10 的样本的观测值的样本的观测值,对应的总体为该对应的总体为该厂生产的瓶装啤酒的净含量厂生产的瓶装啤酒的净含量.最常用的一种抽样叫作最常用的一种抽样叫作“简单随机抽样简单随机抽样”,其特点:,其特点:1.随机性随机性:X1,X2,Xn 中每一个与所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2.独立性独立性:X1,X2,Xn
6、 是相互独立的随机变是相互独立的随机变量量.由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本,它可以看,它可以看成是成是n个个相互独立相互独立且且与总体同分布与总体同分布的随机变量的随机变量X1,X2,Xn.(2)简单随机抽样简单随机抽样 简单随机样本是应用中最常见的情形,今后,当说到简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn 是取自某总体的样本是取自某总体的样本”时,时,若不特别说若不特别说明,就指简单随机样本明,就指简单随机样本.=F(x1)F(x2)F(xn)若总体若总体 X 的分布函数为的分布函数为 F(x),则其简单随机样本则其简
7、单随机样本(X1,X2,Xn)的联合分布函数为的联合分布函数为 若总体若总体 X 为离散型为离散型,分布列为分布列为其简单随机样本的联合概率分布列为其简单随机样本的联合概率分布列为 若总体若总体 X 为连续型为连续型,分布密度为分布密度为 p(x;),其简单随其简单随机样本的联合概率密度函数为机样本的联合概率密度函数为以后统一称为以后统一称为概率函数概率函数.总体(理论分布)?总体(理论分布)?样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料 样本值,去推断样本值,去推断总体的情况总体的情况总体分布总体分布 F(x)的性质的性质.总体分布决定了样本取值的概率规律,也就是样本
8、总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁样本是联系二者的桥梁注:总体、样本、样本值的关系注:总体、样本、样本值的关系3.常用统计量常用统计量定义定义 设设 X1,Xn 是来自总体是来自总体 X 的一个样本,若样的一个样本,若样本函数本函数 T=T(X1,Xn)不含任何未知参数,则称不含任何未知参数,则称 T 是一个是一个统计量统计量。统计量的分布称为统计量的分布称为抽样分布抽样分布。3.1 定义定义 3.常用统计量常用统计量3.2 样本均值样本均值 1、定义:、定义:设设 X1,X
9、2,Xn 是取自某总体的样本,是取自某总体的样本,其算术平均值称为其算术平均值称为样本均值样本均值,即:,即:它反映了它反映了总体均值总体均值的信息的信息(2)数据观察值与均值的偏差平方和最小数据观察值与均值的偏差平方和最小.即对即对任意常数任意常数 c 有有2、性质、性质(1)把样本中的数据与样本均值的差称为偏差。则)把样本中的数据与样本均值的差称为偏差。则样本所有偏差之和为样本所有偏差之和为 0.即:即:定理定理 13、样本均值的分布、样本均值的分布 设设 X1,X2,Xn 是来自某个总体是来自某个总体 X 的样本,的样本,(1)若总体分布为)若总体分布为 ,则,则(2)若总体分布未知或不
10、是正态分布,但)若总体分布未知或不是正态分布,但 则则 的的渐近分布渐近分布为为 。(大样本场合)(大样本场合)n 取不同值时样本均值的分布取不同值时样本均值的分布注注:总体:总体:样本:考虑投掷样本:考虑投掷 n 次,次,X1,Xn 表示第表示第 i 次投掷情况,次投掷情况,样本均值:样本均值:样本值:投掷样本值:投掷 100 次后,得到正面的次数为次后,得到正面的次数为 51 次,次,样本均值:样本均值:3.常用统计量常用统计量3.2 样本方差样本方差1、定义:、定义:设设 X1,X 2,Xn 是取自某总体的样本,是取自某总体的样本,则称则称为为样本方差样本方差,其算术平方根,其算术平方根
11、 S 称为称为样本标准差样本标准差。它反映了总体它反映了总体方差的信息方差的信息注:注:定义中的定义中的 n 是样本容量是样本容量,称为称为偏差偏差平方和平方和,n-1称为称为自由度自由度.即自由变动的即自由变动的 r.v.的个数的个数.这是由于这是由于 在在 确定后确定后,n 个偏差个偏差 中中只有只有n-1个可以自由变动个可以自由变动.定理定理 2设设 X1,X 2,Xn 是取自某总体是取自某总体 X 的样本,且的样本,且 X 具具有二阶矩,即有二阶矩,即则有则有它反映了总体它反映了总体方差的信息方差的信息思考题若总体四阶矩存在,考虑若总体四阶矩存在,考虑3.常用统计量常用统计量3.3 样本矩样本矩它反映了总体它反映了总体 k 阶原点矩的信息阶原点矩的信息为为样本样本 k 阶原点矩阶原点矩.k=1,2,定义:定义:设设 X1,X2,Xn 是取自某总体是取自某总体 X 的样本,的样本,称统计量称统计量3.常用统计量常用统计量3.3 样本矩样本矩为为样本样本 k 阶中心矩阶中心矩.它反映了总体它反映了总体 k 阶阶中心矩的信息中心矩的信息称统计量称统计量 k=2,3,
限制150内