体育统计正态分布.ppt
第四章 概率和概率分布一、概率与频率一、概率与频率o必然现象:必然现象:在一定条件下一定发生的现象。o必然事件:必然现象的结果。o不可能事件:在一定条件必然不会发生的事情。例:(1)在标准大气压下,纯水加热到100摄氏度,必然会沸腾。(2)投出去的标枪必然会落到地面上。随机事件随机事件o随机现象随机现象:在一定条件下可能发生或可能不发生的现象称为随机现象。o随机试验随机试验:任何一个试验,满足:(1)可在相同条件下重复进行;(2)每次试验得到多个结果;(3)每次试验前不能肯定这次试验将得到什么结果。o例:投掷硬币观察哪一面向上,要求某学生投篮并了解其投篮技术,均为做了一次试验。掷硬币投篮均为随机试验。o随机事件随机事件:随机试验的结果称称为随机事件。一般以大写英文字母A、B、C等表示。例:(1)投篮:投中、投不中是两个随机事件。(2)掷骰子:1点,2点,6点,点数 大于3,点数为奇数,等等均为随机事件。随机事件的概率随机事件的概率o频率频率:随机事件A在n次重复实验中发生了m次则比值m/n称为随机事件A的频率。记作:W(A)=m/n。o含义含义:反映随机事件发生的频繁程度。o频率的频率的稳定性稳定性:随着试验次数的增加,随机事件的频率逐渐稳定在某一个常数附近,这一特性称为频率的稳定性。投硬投硬币币次次数数正面正面向向上上频频率率10104 440%40%100100454545%45%20020010510552.552.5%50050024024048%48%1000100049549549.549.5%10000100005025502550.2550.25%例:数学家贝努里关于抛硬币的实验。例:数学家贝努里关于抛硬币的实验。o概率概率:随机事件A的频率W(A)随着试验次数的变化而变化,当n充分大时,频率W(A)越来越接近于一个常数p则这个常数p成为随机事件A的概率,记作p(A)即 随机事件A的概率的取值范围(0,1)概率与频率的区别和联系概率与频率的区别和联系(1)概率准确地反映随机现象的内在规律内在规律,往往是未未知知的;频率是通过随机现象反映其内在规律,试验后,便是己知己知的。(2)概率是事件发生的可能性大小的量度,不随试验次数的变化而变化,只要条件不变,每次试验中某事件发生的概率都是一样的;而频率随试验次数的变化而变化,具有随机性随机性。(3)随着试验次数的增大,频率呈现出稳定的趋势,围绕着概率波动,并随试验次数的无限增大,频率以概率为极限,所以,当试验次数n很大时,人们往往用频率 去近似代替概率P。小概率事件原则o小概率事件小概率事件:概率必须很小,那么,究竟要小到什么程度?在体育统计中一般认为在0.05以下为小。o小概率事件原则小概率事件原则:小概率事件在一次试验中是不会发生的。o 一次试验一次试验:若多次试验,尽管是小概率事件,也很可能发生。o原则原则:这是个原则,不是定理,有人为规定的含义,存在犯错误的风险,但是犯错误的概率又是小概率。所以人们共同遵循。二、正态分布o正态分布正态分布:靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布。o正态分布是应用最广泛的一种连续型分布。o正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布。身高的分布(a)(b)(d)(c)正态分布的概率密度函数 o如果随机变量X的概率密度函数 则称X服从正态分布,记作XN(,2),其中,为分布的均数,为分布的标准差。(-X+)正态分布图示x0.1.2.3.4f(x)o正态曲线正态曲线:是一条中央高,两侧逐渐下降、低平,两端无限延伸,与横轴相靠而不相交,左右完全对称的钟形曲线,称为正态曲线。o正态分布是对称分布,但是对称分布不一定是正态分布。正态分布曲线的性质(1)曲线在X轴上方,X轴是他的一条水渐近线。(2)它的图像是由两个参数决定的:均数均数决定他的位置位置,即在图像在x=处对称,并且在该处取到最大值。标准差标准差决定他的形状形状,标准差越小小,图像越瘦高瘦高;标准差越大大,图像越扁平扁平。(3)曲线与X轴之间的面积等于1。方差相等、均数不等的正态分布图示312均数相等、方差不等的正态分布图示213 max(1)y2y1的含义。表示x2处数据分布的密集程度大于x1处。由于均数的含义可知均数是一组数据中分布最密集的位置,所以在均数处取到最大值。(2)阴影部分面积的含义?表示落入x1与x2之间的数据占总体的百分比。(3)为什么标准差越小,图像越瘦高?(定性分析)因为标准差越小,说明数据分布的密集程度就越大,那么落入x1和x2之间的数据就增加,那么阴影部分的面积就增加,而区间长度不变,所以图像只能向高处发展。标准正态分布o标准正态分布是均数为0,标准差为1的正态分布。o记为N(0,1)。o标准正态分布是一条曲线。o概率密度函数:(-u+)正态分布转换为标准正态分布o若 XN(,2),作变换:则u服从标准正态分布。ou称为标准化公式(把一般的正态分布转化成标准正态分布)。或或标准正态分布的重要性o一般的正态分布取决于均值和标准差 o计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的o若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表。标准正态分布表(p287、288)u 0.00-0.02-0.04-0.06-0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4840 0.4761 0.46810u例:例:P(u-1.96)=0.0250P(u-1.96)=0.0250P(u-1.64)=0.0505P(u-1.64)=0.0505例1、求求p(u0.96)p(u0.96)。0.96查表:查表:p(u0.96)p(u0.96)p(u0.96)。0.96查表:查表:p(u0.96)=1-p(u0.96)=1-p(u0.96)=1-0.8315=0.1685=1-0.8315=0.1685例例3 3、已知已知a=0.14a=0.14、b=1.52b=1.52,求,求p(0.14u1.52)p(0.14u1.52)。0.141.52查表:查表:p(0.14u1.52)p(0.14u1.52)=p(u1.52)-p(u0.14)=p(u1.52)-p(u0.14)=0.9357-0.5557=0.38=0.9357-0.5557=0.38(2)已知u落在某个区间的概率p0,求u。例4:p(ux)=0.8315,求x。xP=0.8315查表:已知:p(u0.96)p(u0.96)=0.8315所以:x=0.96例5:p(ux)=0.7141,求x。xP=0.7141查表可知:P(u0.56)=0.7123,即p1=0.7123时,x1=0.56P(u0.57)=0.7157,即p2=0.7157时,x2=0.57插值公式:把 p1=0.7123时,x1=0.56 p2=0.7157时,x2=0.57 带入得:(3)已知x值,求x落在某个区间的概率.例6:已知xN(10,9),求p(x13)。10 13解:先标准化查表得(4)已知x落在某个区间的概率p0,求x.例7:已知XN(10,4),P(Xx)=0.8,求x。10 x解:先查表得 P(u0.84)=0.79950.8 由标准化公式可知:u=0.84所以:总结关于查表的四种情况(1)已知u值,求u落在某个区间的概率值。(2)已知u落在某个区间的概率p0,求u。(3)已知x值,求x落在某个区间的概率值。(4)已知x落在某个区间的概率p0,求x。正态曲线下的常用面积-1.96+1.962.5%2.5%95%正态曲线下的常用面积-1.64+1.645%5%90%正态曲线下的常用面积-2.58+2.580.5%0.5%99%正态分布的应用(1)利用正态分布估计实际情况 例9:某大型网球中心,每天接待的人数x服从正态分布,其均数=800 人,标准差=150 人,试求:每天接待人数在 6501000人之间的概率。解解:6508001000先标准化:查表:查表:(2)确定参考值范围例例9 9、现有10000名成年男子,假定身高服从正态分布,其均数=175厘米,标准差=15 厘米。估计这些人中,以均数为中心,概率为75%的身高区间是多少?x标准化公式:175y黄色阴影部黄色阴影部分面积为分面积为0.3751u解:查表得:P(u-1.15)=0.1251所以:u1=-1.15(3)用正态分布比较不同运动项目成绩的优劣o例10:某人推铅球的成绩为15.9米,另一人的400米跑成绩为55秒,这两个人谁的运动成绩好些?本章重点内容o概率与频率的概念,以及它们之间的关系;o小概率事件原则;o正态分布曲线的性质;o正态分布标准化公式;o标准正态分布表;o正态分布的两个应用。0 xy max假设假设p=0.2那么阴那么阴影部分面积的含影部分面积的含义?义?