2022年概率统计模型 .pdf
《2022年概率统计模型 .pdf》由会员分享,可在线阅读,更多相关《2022年概率统计模型 .pdf(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率统计模型自然界中存在两种现象:确定性现象和不确定性现象同一实验或者试验在不同次重复中,可能出现不同的结果的现象称为随机现象 随机现象的结果尽管是不确定的,但是,同一随机现象的多次重复却表现出某种规律性,即同一事件在不同次试验或者实验中出现的概率是确定的、唯一的因此,随机现象中包含确定性现象对随机现象的研究可以通过对随机现象的某些事件的发生概率来研究变量之间也存在两种关系:确定性关系和不确定性关系确定性关系:可用一个表达式确切描述,如圆的面积与半径之间的关系描述确定性关系的数学模型有函数,微分方程,差分方程等不确定性关系:不可用一个表达式确切描述,如人的体重与身高等不确定性关系在现实生活中大
2、量存在,即使许多看来是确定性关系的变量,在实际中也会受到各种不同随机因素的影响而变得不确定,确定性关系只是它们的一种近似,如自然科学的很多规律本章主要介绍利用概率统计知识分析随机现象和随机数据,建立随机模型,求解随机模型,并对得到的结果进行分析,最后运用于实际第一节介绍几个直接利用概率知识的建模问题,如赌博问题,巴拿赫(Banach)火柴盒问题,信与信封的配对问题,切割机的收益问题;第二节回归分析模型,主要介绍施肥效果分析问题;第三节判别分析模型,主要介绍螨虫分类问题;第四节时间序列分析,主要介绍Chesapeake 海湾的收成预测问题;第五节随机模拟模型,主要介绍利用随机模拟方法产生随机数据
3、及模拟随机现象的方法;第六节排队论模型,主要介绍用排队论的方法分析,处理等候问题通过以上这些模型和方法的学习,使读者了解和掌握一些处理随机问题的一般思想和方法,如果读者想进一步学习和了解随机数学的专业理论与方法,可阅读随机数学的一些分支的专门著作,如:随机过程,时间序列分析,回归分析,多元统计分析等名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 30 页 -4-1 几个直接利用概率知识的建模问题对随机现象的研究可以通过对随机现象的某些事件的发生概率来研究本节就来介绍几个概率模型,主要利用的基本知识就是古典概率模型的概率计算及其相关问题,随机变量的概率分布及其计算可以参看任意一本大
4、学理工科的概率论与数理统计教科书7,也可以参考周义仓、赫孝良两位老师编写的教科书6问题描述问题 1:赌博问题均匀正方体骰子的六个面分别编号1,2,3,4,5,6现将一对骰子抛掷6 次以决定胜负,请问将赌注押在“出现两个点”和“完全不出现两个点”哪个更有利?问题 2:巴拿赫(Banach)火柴盒问题波兰数学家巴拿赫随身带着两盒火柴,分别放在两个衣袋里,每盒有n 根火柴使用时,每次随机地从其中一盒中取出一根试求他将一盒火柴用完时,另一盒剩余火柴根数的分布律问题 3:信与信封的配对问题某人给它的 N 个朋友写信,写好后,分别将这些信装入N 个信封中,并在信封上随机、不重复地写上N 个收信人的地址 问
5、他一个都没写正确和恰有r 个写正确的概率各是多少?问题 4:切割机的收益问题3一台线切割机把金属线切割成规定的长度由于切割机的某种不准确性,切割线的长度X 可以看作是在区间11.5,12.5上的均匀分布的随机变量规定的长度是 12cm如果 11.712.2X,该种线能卖出去而获利润0.25元如果12.2X,可以重切,并且最后得到0.10元的利润,而如果11.7X,则以 0.02元的损失丢弃试计算:如果切割N 段金属线,那么,请估计平均每根金属线为老板贡献的利润是多少?问题求解1.问题的求解问题是一个古典概率模型的概率计算问题解决这样的问题的关键就是事件的表示 为此,我们令kiA分别表示第 i
6、次抛掷骰子时第k枚骰子(1,2k)名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 30 页 -出现点的事件那么,在第i 次抛掷中,两枚骰子都出现点的事件iA表示为12iiiAA A(4.1.1)而 6 次抛掷中至少出现一次两个点的事件B 可以表示为6121iiiBA A(4.1.2)这样,事件 B 的对立事件是661211iiiiiBAAA(4.1.3)所以1P BP B(4.1.4)由于事件12,1,2,3,4,5,6iiAAi相互独立,于是有6111iiP BP BP A(4.1.5)而212125553566636iiiiiP APAP AP AP A所以661351110
7、.155536iiP BP BP A(4.1.6)这样,出现两个一点的概率是0.1555,大大小于完全不出现两个一点的概率0.8445因此,应将赌注押在完全不出现两个一点上2.问题 2 的求解设巴拿赫总共取出的火柴根数为Z,而分别来自于两个火柴盒,设从左右口袋的两个火柴盒中分别取出的火柴根数分别是,X Y,于是ZXY(4.1.7)而用 U 表示总共剩余的火柴根数,于是,UkXk YnYk Xn(4.1.8)那么,我们要计算的随机变量U 的分布列设巴拿赫发现左口袋火柴刚好取完时,右口袋里还剩Yk根火柴,因此,右口袋已经被取了nk根这样,当巴拿赫首次发现左口袋没有火柴时,已经进行了2nknnk次随
8、机试验在这2nk次试验中,事件A,即火柴取自左口袋出现了n 次,事件A,即火柴取自右口袋出现了nk次对右口袋先取完,我们又类似的讨论这样,这个名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 30 页 -问题实际上是一个二项分布的概率计算问题于是2222,|111111112222221,0,1,2,2nknnknnnnknknknnkP UkP Xk YnP Yk XnP Xk Yn P YnP Yk Xn P XnCCCkn(4.1.9)3.问题 3 的求解经过分析,问题相当于将N 封写好的信放到写着正确地址的信封问题要求,计算所有的信都没有正确放到该放的信封的事件的概率,以及
9、计算恰有r封信正确放到该放的信封的概率这是一个古典概型问题我们分别用,rA B表示没有正确放到该放的信封的事件以及恰有r 封信正确放到该放的信封的事件用iA表示第 i 封信能正确放对信封的事件,1,2,iN,那么12NAA AA(4.1.10)这里特别要注意:1,NAA不是相互独立的,而事件121rrNiiiiiA AA AA是互不相容(12,Niii是1,2,N的一个排列)的 因此,不能利用下式计算概率P A12NP AP AP AP A(4.1.11)但是,注意到公式111NiiP AP APA(4.1.12)而111,1,1,1,1,1,1112112311|1|.1111111112N
10、NNNNiiijijkNii jiji j kijkiNNijiijikiji jiji j kij kNNNNNNPAP AP A AP AA AP AANP A P AAP A P AAP AA ANP AP AA AACCNNNNN11111111!kNkNNk(4.1.13)名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 30 页 -所以,由(4.1.12),有01!kNkPAk(4.1.1)用rC表示恰好指定的r 封信装对信封,则由乘法原理,rB中的样本点数为(这里()rn B和()rn C分别是事件,rrBC的基本事件个数,或称样本点数)rrNrn BC n C(4.
11、1.15)而!rrrrNn Bn CP BCNN(4.1.16)根据前面的分析和结论,有01!kNrrkP Ck(4.1.17)而由古典概率的计算公式,有01!kNrrrkn CP CkNr(4.1.18)于是,得到01!kNrrkn CNrk(4.1.19)011,0,1,2,!kNrrkP BkNrk(4.1.20)4.问题 4 的求解我们只要知道了在三类区间的线段的数目,就可以计算出总的收益设长度在区间 11.712.2X、区间12.2X和区间11.7X上的切割线的数目分别是,pglNNN,而总数目为N,则pglNNNN(4.1.21)如果总利润是I,那么平均每根金属线的利润为0.250
12、.100.02pglNNNIwNNNN(4.1.22)我们知道,,pglNNNNNN分别是随机变量X 落在如上三个区间的频率,而频率具有稳定性,当N 充分大时,频率近似等于相应的概率值,即名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 30 页 -12.211.712.512.211.711.5111.711.20.512.5 11.5112.20.312.5 11.5111.70.212.5 11.5pglNPXdxNNP XdxNNP XdxN所以,平均来说,单根金属线的利润为0.25 0.50.10 0.30.02 0.20.151w(元)(4.1.23)研究性问题4-2-
13、1 供电问题:设某车间有200 台车床相互独立地工作,由于经常需要维修、测量、调换刀具、变换位置等种种原因要停车若每台车床有60%的时间在开动,而每台车床在开动时要耗电1KW,问应供给这个车间多少电力才能保证在 h 生产中大约仅有0.5min 因电力不足而影响生产?4-2-2 钓鱼问题:为了估计湖中鱼的数量,先从湖中钓出r条鱼做上记号,并放回湖中过一段时间后再从湖中钓出S条鱼,结果发现其中有x 条鱼标有记号问应该如何估计湖中鱼的数量N4-2 农作物施肥量与产量的关系问题描述某地区农作物生长所需的营养素主要是氮(N)、磷(P)、钾(K),农作物研究所在该地区对土豆与生菜做了一定数量的实验,实验数
14、据如表4.2.1,其中:ha表示公顷,t 表示吨,kg 表示公斤当一个营养素的施肥量变化时,将另二个营养素的施肥量保持在第七水平,如对土豆关于N 的施肥量做实验时,P与 K 的施肥量分别取196kg/ha(第七水平)与 372kg/ha(第七水平)表 4.2.1 施肥量与产量实验数据土豆N P K 施肥量(kg/ha)产量(t/ha)施肥量(kg/ha)产量(t/ha)施肥量(kg/ha)产量(t/ha)0 15.18 0 33.46 0 18.98 34 21.36 24 32.47 47 27.35 名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 30 页 -67 25.72
15、 49 36.06 96 34.86 101 32.29 73 37.96 140 38.52 135 34.03 98 41.04 186 38.44 202 39.45 147 40.09 279 37.73 259 43.15 196 41.26 372 38.43 336 43.46 245 42.17 465 43.87 404 40.83 294 40.36 558 42.77 471 30.75 342 42.73 651 46.22 生菜N P K 施肥量(kg/ha)产量(t/ha)施肥量(kg/ha)产量(t/ha)施肥量(kg/ha)产量(t/ha)0 11.02 0 6
16、.39 0 15.75 28 12.70 49 9.48 47 16.76 56 14.56 98 12.46 93 16.89 84 16.27 147 14.33 140 16.24 112 17.25 195 17.10 185 17.56 168 22.59 294 21.94 279 19.20 224 21.63 391 22.64 372 17.97 280 19.34 489 21.34 465 15.84 336 16.12 587 22.07 558 20.11 392 14.11 685 24.53 651 19.40 试建立模型分析施肥量与产量的关系,并对所得结果从应用
17、价值与如何改进等方面作出分析问题分析农作物的产量与施肥量之间存在密切的关系,但很难用一个确定的函数关系来表达,故可考虑用回归分析方法来研究其相关关系,建立回归方程近似描述产量与施肥量之间的相关关系.模型假设1.实验中,只考虑施肥量对农作物产量的影响,其它因素:如温度,湿度,其它微量元素的含量,均处于相同水平,不预考虑.2.各次实验相互独立,结果互不影响,观测误差独立同分布,服从20,0N,N,P,K 的用量可精确控制,误差忽略不计.名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 30 页 -变量及符号说明n:实验总次数,本问题中为10.1iQ:对土豆而言,第i 次实验的产量,1,
18、2,in2iQ:对生菜而言,第i 次实验的产量,1,2,in1NiQ:对土豆而言,与1iN对应的第 i 次实验的产量,1,2,in1PiQ:对土豆而言,与1iP对应的第 i 次实验的产量,1,2,in1KiQ:对土豆而言,与1iK对应的第 i 次实验的产量,1,2,in2 NiQ:对生菜而言,与2iN对应的第 i 次实验的产量,1,2,in2PiQ:对生菜而言,与2iP对应的第 i 次实验的产量,1,2,in2KiQ:对生菜而言,与2iK对应的第 i 次实验的产量,1,2,in1iN:对土豆而言,第i 次实验的 N 的用量,1,2,in2iN:对生菜而言,第i 次实验的 N 的用量,1,2,i
19、n1iP:对土豆而言,第i 次实验的 P的用量,1,2,in2iP:对生菜而言,第 i 次实验的 P 的用量,1,2,in1iK:对土豆而言,第i 次实验的 K 的用量,1,2,in2iK:对生菜而言,第i 次实验的 K 的用量,1,2,in.模型建立1.先对实验数据,作出散点图,直观分析产量与施肥量的变化趋势及关系.从散点图来看,三种营养素的施肥量与产量之间存在非线性关系,尤其,氮肥的施用量与产量之间存在明显的二次关系,故可考虑建立三种营养素的施肥量与产量之间的一元二次回归模型名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 30 页 -2.三种营养素的施肥量与产量之间的一元二次
20、回归模型21101111211,1,2,NiiiNiQaa Na Nin21101111211,1,2,PiiiPiQbb Pb Pin21101111211,1,2,KiiiKiQcc Kc Kin22202112212,1,2,NiiiNiQaaNaNin22202112212,1,2,PiiiPiQbb Pb Pin22202112212,1,2,KiiiKiQcc Kc Kin对上述模型,由已知实验数据,利用Mathematica软件编程计算可得回归方程但是,考虑到作物的产量是各种营养素综合作用的结果,而以上建立的仅仅是一元回归模型,故须对模型进行改进3.包含所有变量的全回归模型210
21、11111121111111iNiPiKiNNiNPiiNKiiPPiPKiiKKiiQaa Na Pa KaNaN PaN KaPaP KaK由全回归模型的求解结果(如表 4.2.7)及残差可看出,残差均匀分布在零点两侧,无系统偏差,模型基本合适但注意到,作物产量受各种营养素的影响不是同样的,且营养素两两之间的交互作用对产量的影响也不是同等的,故需对变量进行选择,进行逐步回归4.逐步回归模型利用 MA TLAB 中的逐步回归函数stepwise 对变量进行逐步回归,回归结果表明:对于土豆,首先进入模型的是N 与 K 的交互作用项,其次是NN 项;对于生菜,首先进入模型的是P,其次是 NN 项
22、模型求解对以上三个模型的求解,采用MATLAB 软件进行结果如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共 30 页 -1.一元回归模型的结果及分析对土豆而言,N的施肥量与产量的回归方程系数:表4.2.2 常数项一次项二次项14.7416 0.1972 0.0003 对土豆而言,P的施肥量与产量的回归方程系数:表4.2.3 常数项一次项二次项32.9161 0.0719 0.00013783 对土豆而言,K的施肥量与产量的回归方程系数:表4.2.4 常数项一次项二次项24.4144 0.0749752 7*10(-5)对生菜而言,N的施肥量与产量的回归方程系数:表4.2.5
23、 常数项一次项二次项79.2501 3.516472 0.0106883 对生菜而言,P的施肥量与产量的回归方程系数:表4.2.6 常数项一次项二次项6.87795 0.0606347 5.5*10(-5)对生菜而言,K的施肥量与产量的回归方程系数:表4.2.7 常数项一次项二次项16.2329 0.00511548 7.2*10(-7)以上一元回归模型结果表明:二次项系数较小且为负值,说明产量先随施名师资料总结-精品资料欢迎下载-名师精心整理-第 10 页,共 30 页 -肥量增加而增加,达到一个峰值,然后,随施肥量增加而下降说明,在一定范围内,施肥量对产量有促进作用,这对我们在生产管理中,
24、科学、有效、经济地确定施肥量具有指导意义2.对土豆的全回归模型的结果及分析表4.2.8 常数项一次项交互作用项二次项N P K NP NK PK NN PP KK 15.2093 0.0749752 0.0265478 0.0284431 0.000222494 0.000173897 0 000 325779 0.00017 1209 0.000067809 结果表明:一次项系数由大到小依次是N,K,P,交互作用项依次是NP,NK,说明我们在生产管理中,不但要重视每中肥料的单独作用,还要充分重视肥料间的交互作用,这样才能在生产中充分发挥肥料对产量的促进作用3.逐步回归模型的结果对于土豆,首先
25、进入模型的是N 与 K 的交互作用项,其次是NN 项;对于生菜,首先进入模型的是P,其次是NN 项回归结果表明,对土豆等块茎类作物,NK的交互作用对作物的生长起显著作用,对生菜等叶类作物,P 的作用非常显著,其次,N 的作用对各种作物都是重要的得到的结果符合作物栽培学原理与实际经验研究性问题以上是从产量的角度考虑其与施肥量的关系对此问题,还可以从经济学的角度考虑以下问题:1.研究产量与肥料用量的变化关系,确定各种肥料的边际用量;2.考虑到各种肥料的成本不同,为了达到最大效益,确定各种肥料用量的最佳组合4-3 AF 螨虫和 APF 螨虫的区分问题问题描述现有 9只 AF 螨虫和 6 只 APF
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年概率统计模型 2022 概率 统计 模型
限制150内