随机样本直方图统计量.pptx
第六章第六章 样本及抽样分布(约样本及抽样分布(约4学时)学时)1、(、(13节)随机样本节)随机样本直方图直方图统计量统计量.1学时学时2、三大抽样分布、三大抽样分布.1学时学时4、抽样分布、抽样分布.2学时学时重点:三大抽样分布定义、查找分位数重点:三大抽样分布定义、查找分位数正态总体样本均值、样本方差的主要性质正态总体样本均值、样本方差的主要性质难点:总体、样本、统计量难点:总体、样本、统计量第1页/共38页主要内容(主要内容(1学时)学时)一、总体与个体。一、总体与个体。二、随机样本(难点)。二、随机样本(难点)。三、(频率)直方图。三、(频率)直方图。四、统计量(重点)。四、统计量(重点)。第1-31-3节 随机样本 直方图 统计量 第2页/共38页1、举例说明:一、总体与个体 例例 1企业为了解生产的灯泡企业为了解生产的灯泡平均使用寿命平均使用寿命.使用寿命是使用寿命是一个随机变量一个随机变量X.为求为求 E(X),从产品中抽取部分进行寿命测试,从产品中抽取部分进行寿命测试,根据测试数据对灯泡平均使用寿命作出推断根据测试数据对灯泡平均使用寿命作出推断.例例 2 要了解某城市居民的日常生活消费水平要了解某城市居民的日常生活消费水平.消费水平消费水平是一个随机变量是一个随机变量,设为设为 Y,从居民中抽取一部分,进行消费水从居民中抽取一部分,进行消费水平调查,再根据调查数据对所有居民的平调查,再根据调查数据对所有居民的平均消费水平平均消费水平 E(Y),消消费水平与均值的偏离程度费水平与均值的偏离程度 D(Y)作出推断作出推断.例1的使用寿命、例2的消费水平即为总体。通过样本推断第3页/共38页2、总体与个体的概念 说明:说明:总体:随机现象的某一数量指标的全体可能观测值总体:随机现象的某一数量指标的全体可能观测值。个体:总体中的每一种可能观测值。个体:总体中的每一种可能观测值。(1)(1)总体是由许多具有共同性质的元素组成:总体是由许多具有共同性质的元素组成:数量指标、可相同数量指标、可相同(2)总体对应一随机变量总体对应一随机变量X,每一个体是每一个体是X的一个可能取值的一个可能取值.总体用字母总体用字母 X,Y,Z 表示表示.总体的分布即总体的分布即X的分布的分布,不区分,不区分(3)(3)总体分类:总体分类:有限总体、有限总体、无限总体无限总体(容量无限,或容量很大容量无限,或容量很大)(4)(4)一个随机现象可能对应多个总体。一个随机现象可能对应多个总体。第4页/共38页3、具体例子(2)(2)某大学同学的健康状况(用身高、体重、血型评价)。某大学同学的健康状况(用身高、体重、血型评价)。血型:总体血型:总体Z(A=1,B=2,AB=3,O=4)(3)(3)上市公司经营绩效。上市公司经营绩效。每股收益:每股收益:总体总体X X 净资产收益率净资产收益率:总体:总体Y Y EPSEPS增长率:增长率:总体总体Z Z(1)(1)某工厂生产的某工厂生产的灯泡寿命灯泡寿命:总体总体X X身高:总体X 体重:Y第5页/共38页1、样本及其容量现实中,总体的分布一般未知,或者分布已知,但含有未知现实中,总体的分布一般未知,或者分布已知,但含有未知参数。从总体中抽取参数。从总体中抽取样本样本,根据,根据样本信息样本信息推断总体的分布推断总体的分布样本:从总体样本:从总体X中抽取的部分个体。中抽取的部分个体。二、随机样本(难点)样本容量:样本中包含的个体个数。样本容量:样本中包含的个体个数。第6页/共38页2、简单随机样本、样本观察值说明:说明:样本样本如何抽取样本?如何抽取样本?无限总体:无限总体:不放回抽样不放回抽样。有限总体:放回抽样,nN时不放回。第7页/共38页例如:研究某工厂生产的灯泡寿命(总体例如:研究某工厂生产的灯泡寿命(总体X X)分布。)分布。第8页/共38页3、样本的分布函数统计推断的任务统计推断的任务:对对从总体抽取的简单随机样本进行适当整理,由样从总体抽取的简单随机样本进行适当整理,由样本的分布规律近似地推断总体的分布规律本的分布规律近似地推断总体的分布规律.第9页/共38页第10页/共38页第11页/共38页三、(频率)直方图为分析样本数据的统计规律,将样本数据整理,为分析样本数据的统计规律,将样本数据整理,频率直方图频率直方图基本方法:样本分组、确定组距、确定组限、统计频率、直方图基本方法:样本分组、确定组距、确定组限、统计频率、直方图过程:过程:(1)确定样本分组数)确定样本分组数k通常组数通常组数5-10组,组数主要取决于样本容量。组,组数主要取决于样本容量。样本容量样本容量n50,组数增加。,组数增加。本例本例k=5第12页/共38页(2)确定各组组距)确定各组组距d各组区间长度:组距。一般各组组距相同(也可不同)各组区间长度:组距。一般各组组距相同(也可不同)方便起见方便起见,取取d=10(3)确定每组组限)确定每组组限分组区间:分组区间:(147,157,(157,167,(167,177,(177,187,(187,197第13页/共38页(4)统计频数频率)统计频数频率统计样本数据落入各区间的个数统计样本数据落入各区间的个数(频数频数),计算相应区间的频率,计算相应区间的频率组序分组区间组中值频数频率累计频率(%)12345(147,157(157,167(167,177(177,187(187,197152162172182192485210.20.40.250.10.0520608595100合计201组中值组中值=(组上限组上限+组下限组下限)/2:近似代表该组的变量取值近似代表该组的变量取值第14页/共38页作法:横坐标代表作法:横坐标代表X取值区间、纵坐标表示频率取值区间、纵坐标表示频率(或频数)或频数)频数频率直方图演示频数频率直方图演示(5)频率直方图)频率直方图第15页/共38页1、统计量样本是统计推断的基础。但在应用时,一般不直接用样本本样本是统计推断的基础。但在应用时,一般不直接用样本本身推断总体的分布,而是身推断总体的分布,而是利用样本构造适当的函数利用样本构造适当的函数(统计量统计量),通过统计量对总体的分布进行统计推断,通过统计量对总体的分布进行统计推断。四、统计量(重点)第16页/共38页2、常用统计量(1 1)样本均值)样本均值:第17页/共38页(2 2)样本方差及标准差)样本方差及标准差:第18页/共38页(3 3)样本)样本k k阶矩、阶矩、k k阶中心矩阶中心矩:第19页/共38页第20页/共38页本节重点总结本节重点总结一、随机样本。一、随机样本。二、常用统计量。二、常用统计量。第21页/共38页第二节第二节 三大抽样分布三大抽样分布1、分布分布2、t分布分布3、F分布分布第22页/共38页说明:统计量是样本的函数,是统计量是样本的函数,是随机变量随机变量,有其概率,有其概率分布,统计量的分布称为分布,统计量的分布称为抽样分布抽样分布.要求要求:了解了解 分布分布、t 分布、分布、F 分布的定义,及来自分布的定义,及来自正态总体正态总体X的样本均值的分布等常见统计量的分布。的样本均值的分布等常见统计量的分布。会会查查 分布分布、t 分布、分布、F 分布的上分布的上 分位数分位数。第23页/共38页一、卡方分布()分布分布1、定义(重点)、定义(重点)说明说明:第24页/共38页2、概率密度及其图形、概率密度及其图形5 10 15 20 分布图形:分布图形:第25页/共38页3、主要特征:、主要特征:第26页/共38页4、上侧分位数(重点)、上侧分位数(重点)说明:说明:第27页/共38页第28页/共38页第29页/共38页二、t分布(student分布)1、定义(重点)、定义(重点)即即n充分大时,充分大时,t分布以标准正态分布为极限分布分布以标准正态分布为极限分布.第30页/共38页(1)图形特征)图形特征2、主要特征:、主要特征:(2)数字特征)数字特征第31页/共38页3、上侧分位点(重点)、上侧分位点(重点)说明:说明:第32页/共38页第33页/共38页三、F分布1、定义(重点)、定义(重点)第34页/共38页2、主要性质、主要性质第35页/共38页3、上侧分位点(重点)、上侧分位点(重点)说明:说明:第36页/共38页第37页/共38页感谢您的观看!第38页/共38页