《正态分布、常用统计分布和.ppt》由会员分享,可在线阅读,更多相关《正态分布、常用统计分布和.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 正态分布、常用统计分布和极限定理一、什么是正态分布 正态分布(Normal Distribution)服从一类确定的规律,又称为常态分布或高斯分布。如统计了96人的初婚年龄18.5 20.5 22.5 24.5 26.5 28.5 30.5 32.5x(x)表5-1图5-1 (x)1.正态分布曲线是单峰,有一个最高点;2.分布曲线有一个对称轴x=;3.分布曲线以横轴为渐近线。中位值、中值、均值三者重叠。分布密度曲线的特征:1.曲线在x=处达到最高值,并且以x=对称。正态分布的概率密度表达式为:2.在不变的情况下,越小,图形越尖锐,反之则低阔。123图5-2图5-3=0.5=1=2参数和
2、代表的意义正态曲线下每一小块面积就是随机变量 在该小块取值 所出现的概率,曲线下的整个面积由无数个小直方形拼成。曲线下任意两点 的概率,就是对从 到 的所有小块面积进行累加,即几个典型取值区间的概率值图5-434.13%34.13%13.6%13.6%2.16%2.16%0.11%0.11%二、标准正态分布 根据Z值所得到的分布就是标准正态分布,概率密度为变量值标准化 标准正态分布其实是一般正态分布的一个特例,记作N(0,1),一般正态分布记作N(,2)。一般正态分布之所以能变成唯一的标准正态分布,就是把原来坐标中的零点沿着X轴迁到点,并且以为单位记分。图5-50=1(一)正态分布与标准正态分
3、布的特点对比1.标准正态曲线在Z=0处达到最高点;2.标准正态曲线以Z=0为中心,双侧对称;3.标准正态曲线从最高点向左右缓慢下降,并无限延伸,但永不与基线相交;4.平均数为0,标准差为1;5.标准正态曲线从最高点向左右延伸时,正负1个标准差内向下向内弯,从正负1个标准差开始,向下向外弯。(二)正态分布与标准正态分布面积之间的对应关系34.13%34.13%13.6%13.6%2.16%2.16%0.11%0.11%图5-6(三)标准分的实际意义 例1:甲、乙、丙3个同学社会统计学分数都是80分,甲同学所在班平均成绩甲=80分,乙=75分,丙=70分,标准差都是10,比较甲、乙、丙3个同学在班
4、上的成绩。例2:设甲、乙、丙三个学生所在班级的平均成绩都为75分,甲=10分,乙=15分,丙=20分,比较甲、乙、丙三个学生在班上的成绩。如果各科原始分数呈正态分布,可将各科原始分数转换成标准分,求其总和,再比较总分大小。例3:甲、乙两生高考的政治分数分别为70分、60分,物理分数分别为60分、70分,从总分上看,两生的总成绩相等,但政治的平均分是70分,=20,而物理的平均分是50分,=40。为了使标准分Z值变成形式上的原始分数,一般将Z值乘以10,加上50,就变成了T分数:T=10Z+50T甲=0.2510+50=52.5;T乙=010+50=50标准分数的大小和正负可以反映某一个考生在全
5、体考分中所处的地位,如甲生英语分数为Z=-0.44之上有67%的考生;乙生Z=0.25之上有40.13%的考生,通过每个考生在总体中的位置比较优劣,所以称为相对分数。三、标准正态分布表的使用 标准正态分布表是根据概率密度,用积分计算Z取不同值时正态分布曲线下的面积。有的从Z=-开始,Z逐渐增加,表中所列是某个Z分数以下的累积概率;有的从Z=0开始,Z逐渐变化,计算从Z=0到某一定值之间的概率,因为正态分布对称,且对称轴为=0,所以当Z0时相应的Z分数概率值相等。任意两点Z1,Z2之间的面积就是图5-7图5-8图5-9例4:例5:例6:例7:例8:例9:即在60.24分到83.76分之间包括有9
6、5%的学生。图5-1095%例10:表5-2图5-11 0 Z四、常用统计分布样本具有两重性:假设x1、x2xn是从总体X中抽取的样本,在一次具体的观测或试验中,它们是一批测量值,是一些已知数,即样本具有数的属性。在不同的观测中样本取值可能不同,因此当脱离开特定的具体试验或观测时,并不知道样本 x1、x2xn的具体取值是多少,可以把它们看作随机变量,即样本具有随机变量的属性。如果在相同条件下对总体X进行n次重复的独立观测,那么可以认为所获得的样本x1、x2xn是独立的,并且服从相同分布的随机变量。如:当我们把一个长度为的物体测量了n次,获得样本x1、x2xn之后,要计算其算术平均数作为的估计,
7、其平均数就是对样本进行处理后得到的一个统计量。样本均值、样本方差是几个主要的统计量。三大分布:x2分布、t分布和F分布 (一)x2分布随着自由度增加,图形渐趋对称;x2具有可加性。设x2(k1)、x2(k2),且与相互独立,则+=x2(k1+k2),即+x2(k1+k2)图5-12K=1K=2K=6X2分布表的编制与使用(附表6)(二)t分布(学生分布)设随机变量N(0,1),x2(k),且与相互独立,则随机变量的分布称为自由度为k的t分布或学生分布,并记作t(k)。图5-130t分布表的使用(三)F分布图5-140(1,10)(5,10)(10,10)(,10)F分布表是根据F分布函数计算得来的,附表7中对于不同的自由度及不同的(0 1),给出了满足式 的F值。五、大数定理与中心极限定理 当观察次数n趋向于无穷大时所得出的一系列定理,统称为极限定理。极限定理又分为大数定理和中心极限定理。大数定理一般讨论n个随机变量的平均值的稳定性;中心极限定理讨论在一般情况下,n个随机变量的和当n时的极限分布是正态分布。(一)贝努里大数定理(二)切贝谢夫大数定理(三)中心极限定理上面的表达式还有以下几种表达方法:
限制150内