正态分布 (2)精.ppt
正态分布第1页,本讲稿共27页n正态分布的通俗概念:如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。正态分布的概念第2页,本讲稿共27页 下面我们以第一节某地13岁女孩118人的身高(cm)资料,来说明身高变量服从正态分布。n频数分布表:第3页,本讲稿共27页频数分布图一(又称直方图)从频数表及频数分布图上可得知:该数值变量资料频数分布呈现中间频数多,左右两侧基本对称的分布。所以我们通俗地认为该资料服从正态分布。第4页,本讲稿共27页频数分布图二第5页,本讲稿共27页频数分布图三第6页,本讲稿共27页正态分布图四第7页,本讲稿共27页n正态分布的数理统计学概念:正态分布的数理统计学概念:如果随机变量(X)的概率密度函数为:-x+则该随机变量服从正态分布。式中为总体标准差;为总体均数;为圆周率,即3.14159;e为自然对数的底,即2.71828。第8页,本讲稿共27页若某一随机变量的概率密度函数(频率曲线方程)为上式,则称该变量X服从参数为和的正态分布,记为:XN(,2)。函数方程中为位置参数,为形状参数。在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移。在不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若变小时,曲线形状变的越来越“瘦”和“高”。第9页,本讲稿共27页若某一随机变量X,其总体均数=0,总体标准差=1,即XN(0,1),则称变量X服从标准正态分布。习惯把服从标准正态分布的变量用字母U或Z表示,此时,我们把U或Z称为标准正态变量。标准正态分布是正态分布中的一个典型分布,数理统计上证明:对一服从正态分布的随机变量(X),若进行特定的变量变换,可将任何一服从正态分布的随机变量(X)转变成服从标准正态分布的随机变量(U或Z),这种变量变换过程称为变量的标准化,也称为U或Z变换。式中符号意义如前述。第10页,本讲稿共27页正态分布的特征及其面积规律正态分布的特征及其面积规律正态分布曲线位于横轴上方,呈钟形。正态分布曲线以均数所在处最高,且以均数为中心左右对称。第11页,本讲稿共27页正态分布曲线由两个参数决定,即总体均数和总体标准差。在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移,故称为位置参数。在不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若变小时,曲线形状变的越来越“瘦”和“高”,故称为形态参数或变异度参数。N(,0.52)、N(,12)、N(,22)N(1,2)、N(2,2)第12页,本讲稿共27页正态曲线下面积分布有一定的规律性。对于服从正态分布的随机变量(X),随机变量值出现在某一区间(x1,x2)的概率与正态分布概率密度曲线与横轴在该区间所围成的区域的面积大小相对应(相等)。正态分布概率密度曲线与横轴围成的区域的总面积恒等于1。正态分布概率密度曲线下横轴上一定区间的面积可应用数学知识求出。在实际应用中,由于所有正态分布都可以通过变量变换转变为标准正态分,为了省去积分计算不同正态分布曲线下横轴上一定区间面积的繁琐过程,所以数理统计学家专门编制了标准正态分布曲线下横轴上一定区间面积分布表,供查表求标准正态分布曲线下一定区间面积。第13页,本讲稿共27页标准正态分布标准正态分布q标准正态分布曲线下对称于0的区间,面积相等,各占50%,即左右各为0.5。q标准正态分布曲线的纵坐标与面积关系图q即纵坐标从移到u所对应区域的面积为上图红色区域面积的大小,这样一个区域的面积我们用(u)表示,可通过查标准正态分布曲线面积分布表得到(u)的大小。qu值查表所对应的面积是区间(-,u)所对应的面积,即(u)。q若u=-1.96,那么(-1.96)则表示从移到1.96所对应区域的面积,通过查标准正态分布曲线面积分布表得到(-1.96)=0.025。第14页,本讲稿共27页u u u指单侧U界值,也称随机变量U的上侧分位数。其意义为:从到+这一侧的面积为,也即在随机变量U的所有取值中,有100的值比大,有100(1-)的值比小。第15页,本讲稿共27页u u/2/2第16页,本讲稿共27页第17页,本讲稿共27页第18页,本讲稿共27页第19页,本讲稿共27页当有一随机变量X服从正态分布N(,2),若要求某一区间(x1,x2)的曲线与横轴围成的面积时,无须运用积分学知识求从x1移到x2所对应区域的面积大小来得到这一区间所对应的面积。此时,我们可以通过变量变换,把X转变成u,即把一般的正态分布变换为标准正态分布,通过求标准正态分布区间(u1,u2)所对应的面积来间接求得一般正态分布区间(x1,x2)所对应的面积。当随机变量的参数和未知时,若来自该总体的样本含量n很大时,可分别用样本均数和样本标准差作为和的估计值来计算u值。第20页,本讲稿共27页第21页,本讲稿共27页第22页,本讲稿共27页第23页,本讲稿共27页第24页,本讲稿共27页正态分布的应用正态分布的应用 第25页,本讲稿共27页第26页,本讲稿共27页第27页,本讲稿共27页