第5章 统计量及其分布优秀PPT.ppt
《第5章 统计量及其分布优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第5章 统计量及其分布优秀PPT.ppt(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5章 统计量及其分布现在学习的是第1页,共76页例例5.0.15.0.1 某公司要采购一批产品,每件产品不某公司要采购一批产品,每件产品不 是合格品就是不合格品,但该批产品总有一是合格品就是不合格品,但该批产品总有一 个不合格品率个不合格品率 p p。由此,若从该批产品中随。由此,若从该批产品中随 机抽取一件,用机抽取一件,用 x x 表示这一批产品的不合格表示这一批产品的不合格 数,不难看出数,不难看出 x x 服从一个二点分布服从一个二点分布b b(1,1,p p),但分布中的参数但分布中的参数 p p 是不知道的。一些问题:是不知道的。一些问题:现在学习的是第2页,共76页 p 的大小
2、如何;p 大概落在什么范围内;能否认为 p 满足设定要求(如 p 0.05)。现在学习的是第3页,共76页5.1 总体与个体总体与个体总体的三层含义:研究对象的全体;数据;分布现在学习的是第4页,共76页例5.1.1 考察某厂的产品质量,以0记合格品,以1记不合格品,则 总体=该厂生产的全部合格品与不合格品 =由0或1组成的一堆数若以 p 表示这堆数中1的比例(不合格品率),则该总体可由一个二点分布表示:X 0 1P 1 p p现在学习的是第5页,共76页比如:比如:两个生产同类产品的工厂的产品的总体两个生产同类产品的工厂的产品的总体 分布:分布:X01p0.9830.017X01p0.915
3、0.085现在学习的是第6页,共76页例5.1.2 在二十世纪七十年代后期,美国消费 者购买日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?1979年4月17日日本朝日新闻刊登调查报 告指出N(m,(5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5,m+5)上的均匀分布。原因在于总体的差异上!现在学习的是第7页,共76页图5.1.1 SONY彩电彩色浓度分布图现在学习的是第8页,共76页等级 I II III IV美产 33.3 33.3 33.3 0 日产 68.3 27.1 4.3 0.3表5.1.1 各等级彩电的比例(%)现在学
4、习的是第9页,共76页5.1.2 样本样品样品、样本样本、样本量样本量:样本具有两重性 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1,X2,Xn 表示;另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1,x2,xn 表示是恰当的。简单起见,无论是样本还是其观测值,样本一般均用 x1,x2,xn 表示,应能从上下文中加以区别。现在学习的是第10页,共76页例例5.1.35.1.3 啤酒厂生产的瓶装啤酒规定净含量为啤酒厂生产的瓶装啤酒规定净含量为640 640 克。由于随机性,事实上不可能使
5、得所有的啤酒克。由于随机性,事实上不可能使得所有的啤酒 净含量均为净含量均为640640克。现从某厂生产的啤酒中随机克。现从某厂生产的啤酒中随机 抽取抽取1010瓶测定其净含量,得到如下结果瓶测定其净含量,得到如下结果:641,635,640,637,642,638,645,643,639,640641,635,640,637,642,638,645,643,639,640这是一个容量为这是一个容量为1010的样本的观测值,的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量。对应的总体为该厂生产的瓶装啤酒的净含量。这样的样本称为这样的样本称为完全样本。完全样本。现在学习的是第11页,共76
6、页例例5.1.45.1.4 考察某厂生产的某种电子元件的考察某厂生产的某种电子元件的 寿命,选了寿命,选了100100只进行寿命试验,得到只进行寿命试验,得到 如下数据:如下数据:现在学习的是第12页,共76页表表5.1.25.1.2 100100只元件的寿命数据只元件的寿命数据表5.1.2中的样本观测值没有具体的数值,只有一个范围,这样的样本称为分组样本。寿命范围 元件数 寿命范围 元件数 寿命范围 元件数 (0 24 4 (192 216 6 (384 408 4 (24 48 8 (216 240 3 (408 432 4 (48 72 6 (240 264 3 (432 456 1 (
7、72 96 5 (264 288 5 (456 480 2 (96 120 3 (288 312 5 (480 504 2 (120 144 4 (312 336 3 (504 528 3 (144 168 5 (336 360 5 (528 552 1 (168 192 4 (360 184 1 552 13现在学习的是第13页,共76页 独立性:样本中每一样品的取值不影响其 它样品的取值-x1,x2,xn 相互独立。要使得推断可靠,对样本就有要求,使样本能很好地代表总体。通常有如下两个要求:随机性:总体中每一个个体都有同等机会 被选入样本-xi 与总体X有相同的分布。样本的要求:简单随机样
8、本现在学习的是第14页,共76页设总体设总体X X具有分布函数具有分布函数F F(x x),x x1 1,x x2 2,x xn n 为取自该总体的容量为为取自该总体的容量为n n的样本,则的样本,则样本样本联合分布函数联合分布函数为为用简单随机抽样方法得到的样本称为用简单随机抽样方法得到的样本称为简单随机样本,简单随机样本,也简称也简称样本。样本。于是,样本于是,样本 x x1 1,x x2 2,x xn n 可以看成是可以看成是独立同分布独立同分布(iid iid)的随机变量,的随机变量,其共同分布即为其共同分布即为总体分布。总体分布。现在学习的是第15页,共76页总体分为有限总体与无限总
9、体实际中总体中的个体数大多是有限的。当个体数充实际中总体中的个体数大多是有限的。当个体数充分大时,将有限总体看作无限总体是一种合理的抽分大时,将有限总体看作无限总体是一种合理的抽象。象。对无限总体,随机性与独立性容易实现,困难在于对无限总体,随机性与独立性容易实现,困难在于排除有意或无意的人为干扰。排除有意或无意的人为干扰。对有限总体,只要总体所含个体数很大,特别是与样本对有限总体,只要总体所含个体数很大,特别是与样本量相比很大,则独立性也可基本得到满足。量相比很大,则独立性也可基本得到满足。现在学习的是第16页,共76页例5.1.5 设有一批产品共N个,需要进行抽样检 验以了解其不合格品率p
10、。现从中采取不放回 抽样抽出2个产品,这时,第二次抽到不合格 品的概率依赖于第一次抽到的是否是不合格 品,如果第一次抽到不合格品,则而若第一次抽到的是合格品,则第二次抽到不合格而若第一次抽到的是合格品,则第二次抽到不合格品的概率为品的概率为P(x2=1|x1=1)=(Np1)/(N1)P(x2=1|x1=0)=(Np)(N1)现在学习的是第17页,共76页显然,如此得到的样本不是简单随机样本。但是,显然,如此得到的样本不是简单随机样本。但是,当当N N 很大时,我们可以看到上述两种情形的概率很大时,我们可以看到上述两种情形的概率都近似等于都近似等于p p。所以当。所以当N N 很大,而很大,而
11、n n不大(一个经不大(一个经验法则是验法则是 n n N N 0.1 0.1)时可以把该样本近似地看)时可以把该样本近似地看成简单随机样本。成简单随机样本。思考:若总体的密度函数为若总体的密度函数为p p(x x),则其样本的(联,则其样本的(联 合)密度函数是什么?合)密度函数是什么?现在学习的是第18页,共76页5.2.1 经验分布函数5.2 样本数据的整理与显示设 x1,x2,xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 x(1),x(2),x(n),则称 x(1),x(2),x(n)为有序样本,用有序样本定义如下函数 现在学习的是第19页,共76页则则
12、F Fn n(x x)是一非减右连续函数,且满足是一非减右连续函数,且满足F Fn n()=0)=0 和和 F Fn n()=1)=1由此可见,由此可见,F Fn n(x x)是一个分布函数,是一个分布函数,并称并称F Fn n(x x)为为经验分布函数。经验分布函数。现在学习的是第20页,共76页例5.2.1 某食品厂生产听装饮料,现从生产线上 随机抽取5听饮料,称得其净重(单位:克)351 347 355 344 351x(1)=344,x(2)=347,x(3)=351,x(4)=354,x(5)=355这是一个容量为5的样本,经排序可得有序样本:现在学习的是第21页,共76页其经验分布
13、函数为由由伯努里大数定律:伯努里大数定律:只要只要 n n 相当大,相当大,F Fn n(x x)依概率收敛于依概率收敛于F F(x x)。0 0,x x 344 344 0.20.2,344 344 x x 347 347F Fn n(x x)=0.4)=0.4,347 347 x x 351 351 0.8 0.8,344 344 x x 347 347 1 1,x x 355 355现在学习的是第22页,共76页更深刻的结果也是存在的,这就是格里纹科定理。更深刻的结果也是存在的,这就是格里纹科定理。定理定理5.2.15.2.1(格里纹科定理)(格里纹科定理)设设x1,x2,xn是取自是取
14、自 总体分布函数为总体分布函数为F F(x x)的样本的样本,F Fn n(x x)是其经验分是其经验分 布函数,布函数,当当n n时时,有,有P P supsup F Fn n(x x)F F(x x)0 0 =1=1格里纹科定理表明:格里纹科定理表明:当当n n 相当大时,经验分布函数是总相当大时,经验分布函数是总体分布函数体分布函数F F(x x)的一个良好的近似。的一个良好的近似。经典的统计学中一切统计推断都以样本为依据,其经典的统计学中一切统计推断都以样本为依据,其理由就在于此。理由就在于此。现在学习的是第23页,共76页 160 196 164 148 170 160 196 16
15、4 148 170 175 178 166 181 162 175 178 166 181 162 161 168 166 162 172 161 168 166 162 172 156 170 157 162 154 156 170 157 162 1545.2.2 频数-频率分布表样本数据的整理是统计研究的基础,整理数据的最常样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其用方法之一是给出其频数分布表频数分布表或或频率分布表。频率分布表。例例5.2.25.2.2 为研究某厂工人生产某种产品的能力,为研究某厂工人生产某种产品的能力,我们随机调查了我们随机调查了2020位工人某
16、天生产的该种产品位工人某天生产的该种产品 的数量,数据如下的数量,数据如下现在学习的是第24页,共76页(1)(1)对样本进行分组:对样本进行分组:作为一般性的原则,组数通作为一般性的原则,组数通 常在常在520520个,对容量较小的样本个,对容量较小的样本;(2)(2)确定每组组距:确定每组组距:近似公式为近似公式为组距组距d d=(=(最大观测值最大观测值 最小观测值最小观测值)/)/组数组数;(3)(3)确定每组组限确定每组组限:各组区间端点为各组区间端点为a a0 0,a a1 1=a a0 0+d d,a a2 2=a a0 0+2+2d d,a ak k=a a0 0+kdkd,形
17、成如下的分组区间形成如下的分组区间(a a0 0,a,a1 1,(,(a a1 1,a a2 2,(,(a ak k-1-1 ,a ak k 对这对这2020个数据个数据(样本样本)进行整理进行整理,具体步骤如下具体步骤如下:其中其中a a0 0 略小于最小观测值略小于最小观测值,a ak k 略大于最大观测值略大于最大观测值.现在学习的是第25页,共76页(4)统计样本数据落入每个区间的个数统计样本数据落入每个区间的个数频数,频数,并列出其频数频率分布表。并列出其频数频率分布表。表5.2.1 例5.2.2 的频数频率分布表 组序 分组区间 组中值 频数 频率 累计频率(%)1 (147,15
18、7 152 4 0.20 20 2 (157,167 162 8 0.40 60 3 (167,177 172 5 0.25 85 4 (177,187 182 2 0.10 95 5 (187,197 192 1 0.05 100合计 20 1现在学习的是第26页,共76页5.2.3 样本数据的图形显示一、直方图直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。现在学习的是第27页,共76页把每一个数值分为两部分,前面一部分(百位和
19、十位)称为茎,后面部分(个位)称为叶,然后画一条竖线,在竖线的左侧写上茎,右侧写上叶,就形成了茎叶图。如:二、茎叶图数值 分开 茎 和 叶 112 11|2 11 和 2现在学习的是第28页,共76页例例5.2.35.2.3 某公司对应聘人员进行能力测试,测试某公司对应聘人员进行能力测试,测试 成绩总分为成绩总分为 150 150分。下面是分。下面是5050位应聘人员的测位应聘人员的测 试成绩(已经过排序):试成绩(已经过排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108
20、112112114116118119119122123125126128133我们用这批数据给出一个茎叶图,见下页。现在学习的是第29页,共76页图5.2.3 测试成绩的茎叶图6 4 77 0 2 4 6 6 98 0 1 2 2 3 5 6 8 9 1 1 2 3 3 3 5 6 6 7 7 910 0 0 2 4 6 6 7 8 811 2 2 4 6 8 9 912 2 3 5 6 813 3 现在学习的是第30页,共76页在要比较两组样本时,可画出它们的背靠背的茎叶图。甲车间 6 2 0 5 6 乙车间8 7 7 7 5 5 5 4 2 1 1 6 6 7 7 8 8 8 7 7 6
21、6 4 4 2 1 7 2 2 4 5 5 5 5 6 6 6 8 8 9 8 7 6 6 5 3 2 8 0 1 1 3 3 3 4 4 4 6 6 7 7 8 7 3 2 1 0 9 0 2 3 5 8 5 3 0 0 10 7 注意:茎叶图保留数据中全部信息。当样本量较 大,数据很分散,横跨二、三个数量级时,茎叶图并不适用。现在学习的是第31页,共76页5.3.1 统计量与抽样分布5.3 统计量及其分布当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义5.3.1 设 x1,x2,xn 为取自某总体的样 本,若样本函数T=T(x1,x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 统计量及其分布优秀PPT 统计 及其 分布 优秀 PPT
限制150内