概率统计基础.pdf
《概率统计基础.pdf》由会员分享,可在线阅读,更多相关《概率统计基础.pdf(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Page 1SAQM上海质量管理科学研究院(SAQM)版权所有概率统计基础概率统计基础上海质量管理科学研究院上海质量管理科学研究院Page 2SAQM上海质量管理科学研究院(SAQM)版权所有学习目标学习目标?导入概率分布概念导入概率分布概念 概率密度函数概率密度函数 连续概率分布和离散概率分布连续概率分布和离散概率分布 了解正态分布了解正态分布正态分布的概率密度函数正态分布的概率密度函数标准正态分布标准正态分布/标准正态分布的分位数标准正态分布的分位数正态分布的计算正态分布的计算不合格品率的计算不合格品率的计算学会利用学会利用Minitab从概率分布求概率值的方法从概率分布求概率值的方法?理
2、解总体和样本理解总体和样本?如何运用统计量如何运用统计量常用统计量常用统计量正态总体参数的无偏估计正态总体参数的无偏估计Page 3SAQM上海质量管理科学研究院(SAQM)版权所有?随机现象和随机变量概率分布概念概率分布概念?现实世界的两类现象确定性现象、随机现象个别随机现象的不确定性和大量随机现象的规律性现实世界的两类现象确定性现象、随机现象个别随机现象的不确定性和大量随机现象的规律性?随机变量随机试验和随机事件随机变量随机变量随机试验和随机事件随机变量随机试验可能出现的结果(骰子16点、抛硬币正反面、命中飞碟的次数)随机试验可能出现的结果(骰子16点、抛硬币正反面、命中飞碟的次数)Pag
3、e 4SAQM上海质量管理科学研究院(SAQM)版权所有?波动与分布大家知道,没有二个产品(或中间产品)是完全一样的。产品间的差异是通过适当的质量特性表现出来。产品间的差异是由于质量特性波动而引起的。质量特性的波动是随机的,它时隐时现,时大时小,时正时负。假如把很多产品的质量特性放在一起,隐藏在随机性后面的统计规律性就被揭露出来了。它就是(概率)分布或者称为随机变量的分布。概率分布概念概率分布概念Page 5SAQM上海质量管理科学研究院(SAQM)版权所有?如何发现分布假如我们连续测量一批产品中每个的质量特性。画出直方图,就可发现这个统计规律性分布。xxxxf(x)xxx概率分布概念概率分布
4、概念Page 6SAQM上海质量管理科学研究院(SAQM)版权所有?f(x)概率密度函数概率密度函数概率密度函数f(x)(又简称为分布),是隐藏在质量特性x随机取值后面的统计规律性。分布有多种形式。有的位置不同,有的散布不同,有的形状不同。这些不同的分布形式反映了质量特性在总体上的差别。这种差别正是管理层特别关注之处。xxx正态正态偏态偏态位置不同散布不同形状不同位置不同散布不同形状不同概率分布概念概率分布概念 概率密度函数概率密度函数Page 7SAQM上海质量管理科学研究院(SAQM)版权所有?计量型/连续型数据:能测定的品质特性的值。例)强度(kg/cm计量型/连续型数据:能测定的品质特
5、性的值。例)强度(kg/cm2 2),重量(kg),长度(cm),温度(C)等计量型数据。),重量(kg),长度(cm),温度(C)等计量型数据。?数据的形态数据的形态?计数型/离散型数据:按个数能数的品质特性的值例)满意特性、不合格数,不合格品数等计数型数据。计数型/离散型数据:按个数能数的品质特性的值例)满意特性、不合格数,不合格品数等计数型数据。概率分布的类型概率分布的类型 连续与离散连续与离散Page 8SAQM上海质量管理科学研究院(SAQM)版权所有数据形态的练习数据形态的练习1.请判断以下数据属于何种类型?请判断以下数据属于何种类型??平均每件产品返工浪费的小时平均每件产品返工浪
6、费的小时?平均每张申请表中的错误平均每张申请表中的错误?冷却水浓度(冷却水浓度(PPM)?冷却水浓度(合格冷却水浓度(合格/不合格)不合格)?投诉的顾客数投诉的顾客数?21%的投诉顾客年龄在的投诉顾客年龄在5565岁之间岁之间Page 9SAQM上海质量管理科学研究院(SAQM)版权所有2.请将以下连续型数据转换成离散型数据:请将以下连续型数据转换成离散型数据:?每次来电等候的时间等候时间超过每次来电等候的时间等候时间超过30秒的来电数秒的来电数?零件的直径超差的零件数零件的直径超差的零件数?油箱内的油量油箱空了或者没空油箱内的油量油箱空了或者没空?每件零件的加工费用超过预定费用的零件数每件零
7、件的加工费用超过预定费用的零件数?每个合同的完成时间每个合同的完成时间?学生的成绩学生的成绩数据形态的练习数据形态的练习Page 10SAQM上海质量管理科学研究院(SAQM)版权所有?概率分布概率分布(Probability Distribution)概率变量的数值对应概率的关系,有计量型(连续)概率分布和计数型(离散)概率概率变量的数值对应概率的关系,有计量型(连续)概率分布和计数型(离散)概率分布。分布。不合格数数据:泊松分布?注意现场的连续性数据一般服从正态分布。但可靠性数据是随指数分布或Weibull分布的情况多,在只规定单侧规格或工程有异常情况时,数据一般也不按正态分布。?概率分布
8、的种类不合格数数据:泊松分布?注意现场的连续性数据一般服从正态分布。但可靠性数据是随指数分布或Weibull分布的情况多,在只规定单侧规格或工程有异常情况时,数据一般也不按正态分布。?概率分布的种类计数型 概率分布:概率变量 X是计数型概率变量时计数型 概率分布:概率变量 X是计数型概率变量时 不合格品数据:二项分布不合格品数据:二项分布计量型 概率分布:概率变量 X是计量型概率变量时计量型 概率分布:概率变量 X是计量型概率变量时 正态分布正态分布概率分布概念概率分布概念 连续概率分布与离散概率分布连续概率分布与离散概率分布Page 11SAQM上海质量管理科学研究院(SAQM)版权所有?离
9、散型概率分布?离散型概率分布?掷两颗骰子,?掷两颗骰子,“点数和为8点数和为8”的概率是多少?的概率是多少?1/362/363/364/365/366/365/364/363/362/361/36PY=yi12111098765432yi?答案:?答案:“点数和为8点数和为8”的概率是 5/36离散型概率分布的特点:随机变量的概率一定为非负数;所有的概率之和为 1。的概率是 5/36离散型概率分布的特点:随机变量的概率一定为非负数;所有的概率之和为 1。我们可以将掷两颗骰子时可能出现的点数的概率写出来,再来进行计算。结果见下表:我们可以将掷两颗骰子时可能出现的点数的概率写出来,再来进行计算。结
10、果见下表:Page 12SAQM上海质量管理科学研究院(SAQM)版权所有121110987654320.180.160.140.120.100.080.060.040.020.00X概率X概率分布图分布图离散,值=yi,概率=PY=yiPage 13SAQM上海质量管理科学研究院(SAQM)版权所有?离散概率分布离散概率分布?两项分布(Binomial Distribution)结果只分为合格品/不合格品或成功/失败两种的试验进行了 n 次重复试验时,成功次数 X 服从二项分布。?两项分布(Binomial Distribution)结果只分为合格品/不合格品或成功/失败两种的试验进行了 n
11、 次重复试验时,成功次数 X 服从二项分布。00.10.20.30.405101520试验次数概率试验次数概率p=0.1p=0.2p=0.3p=0.4p=0.5例)n=15 的二项分布中,显示随p值概率值的图表。例)n=15 的二项分布中,显示随p值概率值的图表。计数型概率分布计数型概率分布计数型概率分布计数型概率分布Page 14SAQM上海质量管理科学研究院(SAQM)版权所有?生产现场的两项分布?生产现场的两项分布n个的产品中交付期内送达顾客的产品数。n个的产品中交付期内送达顾客的产品数。在平均不合格品率为 p的工序中取出的n个产品包含的不合格品数。p:发生特定现象的概率在平均不合格品率
12、为 p的工序中取出的n个产品包含的不合格品数。p:发生特定现象的概率,)1()()(xnxppxnxXpxf=nx,1,0=(1-p):不发生的概率(1-p):不发生的概率,)1()!(!xnxppxnxn=两项分布的均值(期望),方差,标准差:均值(期望):两项分布的均值(期望),方差,标准差:均值(期望):np,np,方差:方差:npnp(1(1-p-p),标准差:),标准差:)1(pnp计数型概率分布计数型概率分布计数型概率分布计数型概率分布Page 15SAQM上海质量管理科学研究院(SAQM)版权所有两项分布的练习两项分布的练习从一批产品中随机抽取进行检测,产品检测人员每检验完一件产
13、品后,再将其放回这批产品中(有放回抽样)。根据历史数据得知,产品的不合格率为从一批产品中随机抽取进行检测,产品检测人员每检验完一件产品后,再将其放回这批产品中(有放回抽样)。根据历史数据得知,产品的不合格率为10%,检验人员共检测了,检验人员共检测了6件产品,请问:件产品,请问:?6件产品全部合格的概率为多少?件产品全部合格的概率为多少??不合格品小于不合格品小于2件的概率为多少?件的概率为多少?Page 16SAQM上海质量管理科学研究院(SAQM)版权所有对于流水线上生产的一大批二极管的输出电压进行测量。经计算得知,它们的中位数为对于流水线上生产的一大批二极管的输出电压进行测量。经计算得知
14、,它们的中位数为2.3V。某日上午,从该批随机抽取了。某日上午,从该批随机抽取了400个二极管,对它们进行了测定。记个二极管,对它们进行了测定。记X为输出电压比为输出电压比2.3V大的二极管,结果发现,大的二极管,结果发现,X=258支,为了检测此时的生产是否正常。先要确定支,为了检测此时的生产是否正常。先要确定X的分布。可以断言:的分布。可以断言:A.X近似为均值是近似为均值是200,标准差是,标准差是20的正态分布。的正态分布。B.X近似为均值是近似为均值是200,标准差是,标准差是10的正态分布。的正态分布。C.X是(是(180,220)上的均匀分布。)上的均匀分布。D.X是(是(190
15、,210)上的均匀分布。)上的均匀分布。两项分布的练习两项分布的练习Page 17SAQM上海质量管理科学研究院(SAQM)版权所有?泊松分布(Poisson Distribution)适用于按时间或空间发生频率低的罕见事件的单位发生数等适用的分布。?泊松分布(Poisson Distribution)适用于按时间或空间发生频率低的罕见事件的单位发生数等适用的分布。例)例)机器一天的故障次数,单位时间打来的电话次数,产品的单位面积不合格数,十字路口一天发生的交通事故数,大量生产产品的不合格数。机器一天的故障次数,单位时间打来的电话次数,产品的单位面积不合格数,十字路口一天发生的交通事故数,大量
16、生产产品的不合格数。00.20.40.60.8105101520不合格数概率不合格数概率dpu=0.1dpu=1.0dpu=2.0dpu=2.5dpu=4.0例)显示随每单位不合格数(dpu)值的概率值的图表。例)显示随每单位不合格数(dpu)值的概率值的图表。计数型概率分布计数型概率分布计数型概率分布计数型概率分布Page 18SAQM上海质量管理科学研究院(SAQM)版权所有,.2,1,0,!)()()(=xxmexXPxfxm 概率密度函数平均发生次数:m概率密度函数平均发生次数:m 均值(期望)和方差均值(期望):均值(期望)和方差均值(期望):E E(X X)=m(=dpu)=m(=
17、dpu),方差:,方差:V V(X X)=m(=dpu)=m(=dpu)计数型概率分布计数型概率分布计数型概率分布计数型概率分布Page 19SAQM上海质量管理科学研究院(SAQM)版权所有泊松分布的练习泊松分布的练习1、已知一条产品装配流水线装配的产品,平均每个产品有3个缺陷,请问:1、已知一条产品装配流水线装配的产品,平均每个产品有3个缺陷,请问:?如果生产出的产品没有一个缺陷的概率为多少?如果生产出的产品没有一个缺陷的概率为多少??如果生产出的产品少于两个缺陷的概率为多少?2、在某快餐店中午营业期间内,每分钟顾客到来人数为平均值是8的泊松(Poisson)分布。若考虑每半分钟到来的顾客
18、分布,则此分布近似为:a)平均值是8的泊松(Poisson)分布b)平均值是4的泊松(Poisson)分布c)平均值是2的泊松(Poisson)分布d)分布类型将改变如果生产出的产品少于两个缺陷的概率为多少?2、在某快餐店中午营业期间内,每分钟顾客到来人数为平均值是8的泊松(Poisson)分布。若考虑每半分钟到来的顾客分布,则此分布近似为:a)平均值是8的泊松(Poisson)分布b)平均值是4的泊松(Poisson)分布c)平均值是2的泊松(Poisson)分布d)分布类型将改变Page 20SAQM上海质量管理科学研究院(SAQM)版权所有泊松分布的练习泊松分布的练习3、从1000米布匹
19、中随机抽取3米进行检验,若3米中无瑕疵才可接收,假设送检布匹平均每米有一个瑕疵,则被拒收的概率为?a0.05 b0.90c0.95 d0.723、从1000米布匹中随机抽取3米进行检验,若3米中无瑕疵才可接收,假设送检布匹平均每米有一个瑕疵,则被拒收的概率为?a0.05 b0.90c0.95 d0.72Page 21SAQM上海质量管理科学研究院(SAQM)版权所有离散分布的练习离散分布的练习1、将一颗骰子连掷2次,“至少出现一次6点”的概率为?a 1/11 b 1/36c 11/36 d 25/362、设离散型随机变量X的分布列为:则为?a0.5 b0.3c0.4 d0.151、将一颗骰子连
20、掷2次,“至少出现一次6点”的概率为?a 1/11 b 1/36c 11/36 d 25/362、设离散型随机变量X的分布列为:则为?a0.5 b0.3c0.4 d0.150.10.30.10.20.20.1P543210X)31(XPPage 22SAQM上海质量管理科学研究院(SAQM)版权所有?连续型概率分布?连续型概率分布?从直方图到概率密度曲线下图是对收集到的1512名成年男子身高数据绘制的频率直方图。随着数据的不断增加,频率渐趋稳定,频率的稳定值就是概率。如果要求整个曲线下面的面积正好为1,则这条曲线就被称为概率密度曲线。?从直方图到概率密度曲线下图是对收集到的1512名成年男子身
21、高数据绘制的频率直方图。随着数据的不断增加,频率渐趋稳定,频率的稳定值就是概率。如果要求整个曲线下面的面积正好为1,则这条曲线就被称为概率密度曲线。185180175170165160155150140120100806040200身高频率身高频率均值168.5标准差5.408N1512身高 的直方图身高 的直方图正态 Page 23SAQM上海质量管理科学研究院(SAQM)版权所有1.851.801.751.701.651.601.551.50876543210X密度X密度分布图分布图正态,均值=1.68,标准差=0.0551851801751701651601551500.080.070.
22、060.050.040.030.020.010.00X密度X密度分布图分布图正态,均值=168,标准差=5.5?概率密度曲线的量纲?连续型概率分布的特点:概率密度函数一定为非负数;概率密度函数曲线与横轴所围成的面积永远为 1。?概率密度曲线的量纲?连续型概率分布的特点:概率密度函数一定为非负数;概率密度函数曲线与横轴所围成的面积永远为 1。Page 24SAQM上海质量管理科学研究院(SAQM)版权所有0ba事件的概率与概率密度分布的关系图事件的概率与概率密度分布的关系图xP(x)?事件的概率与概率密度函数的关系?事件的概率与概率密度函数的关系随机变量落入随机变量落入a,ba,b,的概率就等于
23、密度函数曲线在,的概率就等于密度函数曲线在a,ba,b上的积分。上的积分。()=badxxpbXaPPage 25SAQM上海质量管理科学研究院(SAQM)版权所有?正态分布正态分布正态分布正态分布(Normal distribution)Normal distribution)Normal distribution)Normal distribution)正态分布是最自然的分布,某一定范围内的所有实数值都可以取的概率分布,是计量型概率分布中最有代表性的分布。正态分布是最自然的分布,某一定范围内的所有实数值都可以取的概率分布,是计量型概率分布中最有代表性的分布。-概率密度函数是平均概率密度函数
24、是平均为为中心对称的钟模样中心对称的钟模样-分布的模样和位置用分布的平均和方差决定分布的模样和位置用分布的平均和方差决定-从社会性,自然性现象出来的分布大部分与正态分布类似-拥有平均从社会性,自然性现象出来的分布大部分与正态分布类似-拥有平均,方差,方差 2 2的正态分布如下表示的正态分布如下表示?正态分布的概率密度函数正态分布的概率密度函数正态分布的概率密度函数正态分布的概率密度函数),(2NX=xexfx-,21)(222)(121=1 12121221 随随与 的正态分布模样与 的正态分布模样 1 1 2 2 1 1=2 2 1 1=2 2 1 1 2 2 1 1 2 2 1 1 2 2
25、了解正态分布了解正态分布了解正态分布了解正态分布Page 26SAQM上海质量管理科学研究院(SAQM)版权所有正态分布正态分布正态分布正态分布 标准正态分布标准正态分布标准正态分布标准正态分布?正态分布正态分布正态分布正态分布 标准正态分布标准正态分布?=0和和=1的正态分布称为标准正态分布。记为的正态分布称为标准正态分布。记为N(0,1)。服从标准正态分布的随机变量记为。服从标准正态分布的随机变量记为u,它的概率密度函数记为,它的概率密度函数记为(u)。?标准正态分布的概率密度函数。标准正态分布的概率密度函数。?标准正态分布标准正态分布N(0,1)存在的意义在于:一些质量特性的不合格品率均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 基础
限制150内