第六章概率分布PPT讲稿.ppt
《第六章概率分布PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第六章概率分布PPT讲稿.ppt(137页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章概率分布第1页,共137页,编辑于2022年,星期三第一节 概率的基本概念v一、概率v二、概率的基本性质v三、概率分布类型第2页,共137页,编辑于2022年,星期三一、概率v(一)随机现象v(二)事件与概率第3页,共137页,编辑于2022年,星期三(一)随机现象v1、确定性现象:在一定条件下事先可以断言必然会发生某种结果的现象。v必然现象:在一定条件下必然会发生的现象。v不可能现象:在一定条件下必然不会发生的现象。v2、随机现象:在一定条件下,事先不能断言会出现哪种结果的现象。v随机试验:对随机现象的一次观察。v随机试验是研究随机现象的手段。第4页,共137页,编辑于2022年,星期
2、三随机现象的特点 v偶然性:一次试验前,不能预言发生哪一种结果。v必然性:在相同条件下,进行大量次重复试验,呈现出统计规律性。第5页,共137页,编辑于2022年,星期三随机事件v随机事件:随机现象中出现的各种可能的结果,简称事件。v随机事件中有两种极端情况:必然事件和不可能事件。v必然事件:某一事件包含随机试验中所有可能的结果。v不可能事件:某一事件不包含随机试验中的任何结果。第6页,共137页,编辑于2022年,星期三(二)事件与概率v在N次重复试验中,事件A发生的次数为n,那么n与试验总次数N的比值,称为事件A发生的频率,记作:第7页,共137页,编辑于2022年,星期三那么什么是概率呢
3、?v概率是表明随机事件出现可能性大小的客观指标。v概率的两种不同定义:后验概率、先验概率。第8页,共137页,编辑于2022年,星期三1、后验概率v如果把一枚质地均匀的硬币抛出以后,正面向上的概率有多大呢?v假定,在n次抛掷(试验)中,硬币正面向上的次数为m,则正面朝上的频率为mn。这个频率不是概率,因为有随机误差的存在。在这n次试验中,可能碰巧正面朝上的情况多一点,在另外的n次试验中,也许正面朝上的情况就少一点。为了减少这种误差,就要加大试验的次数。第9页,共137页,编辑于2022年,星期三抛硬币v随着抛掷次数的不断增加,硬币正面朝上的次数与抛掷总次数的频率越来越趋于稳定在0.5附近,于是
4、0.5就被认定为正面朝上的概率,这个概率称为后验概率。第10页,共137页,编辑于2022年,星期三后验概率 v后验概率是在大量试验的基础上建立起来的,假定用A表示一个随机事件,后验概率就是在大量试验中随机事件A出现次数的稳定比率。即:对随机事件进行n次实验,某一事件A出现m次,m与n的比值叫做随机事件A的频率,当n时,随机事件A的频率m/n趋于某一常数P,则这一常数P就是随机事件A发生的概率,即 第11页,共137页,编辑于2022年,星期三2、先验概率v在某些条件下,我们不做试验就可以确定随机事件的概率,这种无需进行大量实验的概率就是先验概率,也称古典概率。第12页,共137页,编辑于20
5、22年,星期三古典概型v先验概率涉及的问题都比较简单,例如掷骰子(touzi)、抛硬币等,这些随机现象有两个共同的特点:a、结果数目有限,b、各种结果出现的可能性被认为是相等的。满足这两个条件的模型,称为古典概型。第13页,共137页,编辑于2022年,星期三先验概率的定义v先验概率就是通过古典概型加以定义的。即某一随机事件A的概率为该事件所包含的可能结果个数m与所有可能结果的总数n的比值,即第14页,共137页,编辑于2022年,星期三例题v例6-1,一个箱子里有100个球,其中97个是白色的,3个是红色的,从箱子里任意取出一个球,这个球是红色的概率是多少?v例6-2,抛掷硬币3次,问其中一
6、次正面朝上的概率是多大?第15页,共137页,编辑于2022年,星期三二、概率的基本性质v(一)概率的公理系统v(二)概率的加法定理v(三)概率的乘法定理第16页,共137页,编辑于2022年,星期三(一)概率的公理系统v1、任何一个随机事件A的概率都是非负的。v2、在一定条件下必然发生的事件即必然事件的概率为1。v3、在一定条件下,必然不发生的事件,即不可能事件的概率为0。v 0P(A)1,越接近1,事件发生的可能性越大,越接近0,可能性越小,2、3反过来不成立。第17页,共137页,编辑于2022年,星期三(二)概率的加法定理v1、不相容事件:在一次实验中,不可能同时出现的事件。即,则称A
7、与B为互不相容事件。v2、加法定理:两个互不相容事件A、B之和的概率,等于这两个事件的概率之和:P(A+B)=P(A )+P(B)。v3、推论:有限个互不相容事件和的概率,等于这些事件概率之和。第18页,共137页,编辑于2022年,星期三(三)概率的乘法定理v1、独立事件:一个事件的出现对另一事件的出现不发生影响,则称这两个事件为相互独立事件:。v2、相关事件:如果事件A的概率随事件B是否出现而改变,事件B的概率随事件A的出现而改变,则这两个事件为相关事件。v3、乘法定理:两个独立事件积的概率,等于这两个事件概率的乘积。即 。v4、推论:有限个独立事件积的概率,等于这些事件概率的乘积。第19
8、页,共137页,编辑于2022年,星期三例6-3v盒中有6支红粉笔、5支黄粉笔、2支绿粉笔和7支白粉笔。问任意摸得一只红色或绿色粉笔的概率是多少?任意摸得一支红色或黄色或白色粉笔的概率是多少?第20页,共137页,编辑于2022年,星期三例6-4v某专业研究生复试,让考生从6个试题中任意抽取一题进行,若抽到每一题的概率为16,前一考生抽过的试题再放回,后一考生再抽,问2个考生都抽到试题1的概率是多少?第21页,共137页,编辑于2022年,星期三练习v1、掷出一个骰子,计算骰子数字大于3的概率。v2、连续抛2枚硬币,计算两次都是正面朝上的概率。第22页,共137页,编辑于2022年,星期三三、
9、概率分布类型v(一)按随机变量取值类型v(二)依分布函数的来源来分v(三)依据概率分布所描述的数据特征第23页,共137页,编辑于2022年,星期三(一)按随机变量取值类型v1、离散分布:随机变量只取孤立数值的分布。如二项分布、泊松分布、超几何分布。v2、连续分布:连续型随机变量的分布。如正态分布、负指数分布、威布尔分布等。第24页,共137页,编辑于2022年,星期三(二)依分布函数的来源来分v1、经验分布:根据观察或实验所获得的数据而编制的次数分布或相对频率分布。经验分布往往是总体的一个样本,它可对所研究的对象给以初步描述,并作为推论总体的依据。v2、理论分布:(1)随机变量概率分布的函数
10、数学模型。(2)按某种数学模型计算出的总体的次数分布。第25页,共137页,编辑于2022年,星期三(三)依据概率分布所描述的数据特征v1、基本随机变量分布:理论分布中描述构成总体的基本变量的分布。常用的有二项分布和正态分布。v2、抽样分布:样本统计量的理论分布。又称随机变量的函数分布。第26页,共137页,编辑于2022年,星期三第二节 正态分布(normal distribution)第27页,共137页,编辑于2022年,星期三正态分布v正态分布也称常态分布或常态分配,是连续随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。v正态分布是由棣莫弗1733年
11、发现的。拉普拉斯高斯对正态分布的研究也做出了贡献,故有时称正态分布为高斯分布。第28页,共137页,编辑于2022年,星期三一、正态分布特征 v(一)正态分布曲线函数v(二)正态分布的特征v(三)标准正态分布第29页,共137页,编辑于2022年,星期三(一)正态分布曲线函数v 为待定参数(即理论平均数和理论标准差),且 ,则称随机变量X服从正态分布,记作:。v影响正态分布函数形态的有两个参数:。决定曲线的中心位置,决定曲线的陡峭程度。第30页,共137页,编辑于2022年,星期三(二)正态分布的特征v1、正态分布的形式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点的垂线。正态分
12、布中,平均数、中数、众数三者相等。此点y值最大(0.3989)。左右不同间距的y值不同,各相同间距的面积相等,y值也相等。v2、正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端间向靠近基线处无限延伸,但始终不能和基线相交。整条曲线呈现“中间高、两边低”的形状。第31页,共137页,编辑于2022年,星期三(二)正态分布的特征v3、正态曲线下的面积为1,由于它在平均数处左右对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,即各为0.50。正态曲线下每一横坐标所对应的面积与总面积(总面积为1)之比其值等于该部分
13、面积值,故正态曲线下的面积可视为概率,即值为每一横坐标值(加减一定标准差)的随机变量出现的概率。v4、正态分布是一族分布。当 时的正态分布称为标准正态分布,即作N(0,1)。第32页,共137页,编辑于2022年,星期三(二)正态分布的特征v5、正态分布中各差异量数值相互间有固定比率。v6、在正态曲线下,标准差与概率有一定的数量关系。第33页,共137页,编辑于2022年,星期三(三)标准正态分布v当 时的正态分布称为标准正态分布,记作N(0,1)。v标准正态分布的 是确定的,它的位置和形状也都是确定的。标准正态分布在Z0时达到最高点,曲线的拐点为Z1两点。v在数理统计中,任何一般的正态分布都
14、可以转化为标准正态分布。若 ,令 ,则ZN(0,1)。第34页,共137页,编辑于2022年,星期三标准正态分布的特点 v1、Z0处曲线位于最高点。v2、曲线以Z0为中心左右对称。v3、曲线从最高点向左右缓慢下降,以横轴为渐近线。v4、。v5、在Z1处有拐点。v6、从Z-3到Z3这个区间包括的概率几乎达到1。第35页,共137页,编辑于2022年,星期三二、正态分布表的编制与使用v(一)正态分布表的编制与结构v(二)正态分布表的使用第36页,共137页,编辑于2022年,星期三(一)正态分布表的编制与结构v1、第一栏是Z分数单位 v2、纵高y v3、概率值P 第37页,共137页,编辑于202
15、2年,星期三(二)正态分布表的使用v1、依据Z分数求概率P。v2、从概率(P)求Z分数。v3、已知概率P或Z值,求概率密度y。v4、将非标准正态分布转化为标准正态分布来查表求值。第38页,共137页,编辑于2022年,星期三1、依据Z分数求概率Pv(1)求某Z分数值与平均数(Z0)之间的概率。v(2)求某Z分数以上或以下的概率。v(3)求两个Z分数之间的概率。第39页,共137页,编辑于2022年,星期三例v设随机变量Z服从标准正态分布,求:vP0Z1、P-1Z0vPZ0、PZ0、PZ1、PZ1、PZ1vP-1Z1、P1Z2、P-2Z1第40页,共137页,编辑于2022年,星期三2、从概率(
16、P)求Z分数v(1)已知从平均数开始的概率值求Z值。v(2)已知位于正态分布两端的概率值求该概率值分界点的Z值。v(3)若已知正态曲线下中央部分的概率,求Z分数是多少。第41页,共137页,编辑于2022年,星期三例vZN(0,1),已知下列概率,求Z0。vP0ZZ00.45vPZZ00.05 vP-Z0ZZ00.90第42页,共137页,编辑于2022年,星期三3、已知概率或Z值,求概率密度y v例,ZN(0,1),求下列情况下对应的曲线纵高YvZ1.93vZ=-1.93vP0ZZ00.32894第43页,共137页,编辑于2022年,星期三4、将非标准正态分布转化为标准正态分布来查表求值
17、v例,设随机变量X服从平均数为10,标准差为2的正态分布,求:vP10X12vP9X10vPX14第44页,共137页,编辑于2022年,星期三4、将非标准正态分布转化为标准正态分布来查表求值v例,求以下概率:第45页,共137页,编辑于2022年,星期三三、次数分布是否正态的检验方法v 检验v偏态峰态量数描述方法v累加次数曲线法v直方图法v概率纸法等。第46页,共137页,编辑于2022年,星期三(一)皮尔逊偏态量数法 v正偏态:MMdMo;负偏态:MMdMo。v偏态量数:。vSK0,分布对称;SK0,正偏态;SK0,负偏态。第47页,共137页,编辑于2022年,星期三(二)峰度、偏度检验
18、法v这种方法是根据分析分布的峰度系数与偏度系数,确定分布形态。一般情况下,需要观测数据的数目要足够大,应用这种方法才有意义。v1、偏度系数g1v2、峰度系数g2第48页,共137页,编辑于2022年,星期三1、偏度系数g1vg10,分布对称;g10,正偏态;g10,负偏态。vN200时,g1才可靠。第49页,共137页,编辑于2022年,星期三2、峰度系数g2vg20,正态分布的峰度;g20,低阔;g20,高狭。vN1000时,g2才可靠。第50页,共137页,编辑于2022年,星期三四、正态分布的一些实际应用v(一)标准分数及其应用v(二)利用正态分布,确定录取分数线 v(三)确定在正态分布
19、下特定分数界限内的考生人数 v(四)划等级评定为测量数据v(五)确定测验题目的难易度v(六)在能力分组或等级评定时确定人数v(七)测验分数的正态化 第51页,共137页,编辑于2022年,星期三(二)利用正态分布,确定录取分数线v在选拔性或竞赛性的考试中,录取或授奖的人数(或比率)往往是事先确定的。若考分呈正态分布,在根据考试结果确定分数线时,可将录取或授奖的人数比率作为正态分布中分数右侧,即上端的面积,由此找出相应标准分数Z值,然后根据 ,由Z求原始分数X。第52页,共137页,编辑于2022年,星期三例题v例,某项职业录取考试,在参加考试的1600人中准备录取200人,考试分数接近正态分布
20、,平均分数为74,标准差为11,问录取分数线是多少?v例,在某年高考的平均分数为500,标准差为100的正态总体中,某考生得到650分。设当年高考录取率为10,问该生的成绩能否入围?第53页,共137页,编辑于2022年,星期三(三)确定在正态分布下特定分数界限内的考生人数 v例,某地区某年高考物理科考生4.7万人,平均分为57.08,标准差为18.04。试问:v(1)成绩在90分以上有多少人?v(2)成绩在80分到90分之间有多少人?v(3)成绩60分以下有多少人?第54页,共137页,编辑于2022年,星期三(四)划等级评定为测量数据v例,A、B两位评定者对50名学生的口头表达能力作出优、
21、良、中、及格、不及格五个等级的评定。由于评定者掌握的标准不可能完全相同,同一个学生,可能得到两个不同的等级评定。例如对于学生甲,A评定为“优”,B评定为“良”,对于学生乙,A评定为“良”,B评定为“优”。那么,学生甲与学生乙究竟哪个口头表达能力强?第55页,共137页,编辑于2022年,星期三不相上下?v(1)不同的评定者由于各自的标准不同 v(2)等级分数界限宽,又不一定是等距尺度,所以不能计算平均分。第56页,共137页,编辑于2022年,星期三解决办法v要将等级评定转化为测量数据,然后求平均。v要求:数据必须是正态分布。第57页,共137页,编辑于2022年,星期三转换步骤 v(1)根据
22、各等级被评者的数目求各等级的人数比率。v(2)求各等级比率值的中间值,作为该等级的中点。v(3)求各等级中点以上(或以下)的累加比率。v(4)用累加比率查正态表求Z值,该Z值就是各等级代表性的测量值。v(5)求被评者所得评定等级的测量数据的算术平均数,即为每个被评定者的综合评定分数。第58页,共137页,编辑于2022年,星期三(五)确定测验题目的难易度v测验题目的难易度一般用答对者的百分数确定。但不是等距尺度,无法比较。办法是转换成难度分数。v原理是假设一个测验中不同难易测验题目的分布是正态的,即一个测验中通过率较大和较小的题目很少,而通过率居中的题目较多。v转换之后就有理由认为难度分数是等
23、距尺度,不同题目之间的难易差异就可直接比较。第59页,共137页,编辑于2022年,星期三确定题目难易分数的具体步骤 v(1)计算各题目的通过率。v(2)用0.5减去通过率,不计正负号,获得正态分布表中的概率值。v(3)依据P值查正态表中相应的Z值,通过率大于50的Z值计为负值,通过率小于50的Z值计为正值。v(4)将查表得到的Z分数加上5,便可得到从010的十进制的难度分数值。第60页,共137页,编辑于2022年,星期三(六)在能力分组或等级评定时确定人数v假定能力是正态分布,这时若将能力分组,分成等距的几个等级,各组人数应是多少?v在确定各等级人数时,可将正态分布基线上Z-3至Z+3之间
24、6个标准差的距离分成相等的几份(因为在Z3之间的面积已达到0.9973,几乎包括了全体学生),然后用附表1求出各段Z值间的面积,再乘以学生总人数,即为各等级人数。第61页,共137页,编辑于2022年,星期三例v如果100个人某种能力呈正态分布,欲将其分成甲、乙、丙、丁四个等距的等级,问各等级应有多少人?v分为五个等级、六个等级呢?第62页,共137页,编辑于2022年,星期三(七)测验分数的正态化v将样本原始分数分布转换成为正态分布,称作次数分布的正态化。正态化是建立正态标准分数的关键。v前提条件:研究对象的总体事实上应该是正态分布。v正态化是将原始分数转换成Z分数,但转换后的Z分数往往有小
25、数点,并且有负值,看着很不习惯,所以常常要进一步将其转换成T分数,转换公式为TKZ+C。也就是将标准分数扩大K倍,再移到C这个中心位置来表示分数。转换后得到的T值仍保持了Z分数的特征,是一种标准分数。第63页,共137页,编辑于2022年,星期三进行合理的转换,要求 vTKZ+Cv(1)K值应大于(至少等于)原始分数的标准差;v(2)C不应小于3K(一般考试中)或4K(在大规模考试中)。vT分数的平均数为C,标准差为K。第64页,共137页,编辑于2022年,星期三几种常见的T分数v1、T分数:vT10Z+50。是麦克尔(W.A.McCall,1939年)创用的方法,常被用在心理与教育测验中建
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 概率 分布 PPT 讲稿
限制150内