《数学实验概率论与数理统计.pptx》由会员分享,可在线阅读,更多相关《数学实验概率论与数理统计.pptx(189页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 查到查到 年前该学校同龄学生的平均身高为为年前该学校同龄学生的平均身高为为近期还调查了附近近期还调查了附近 农村同龄男生的身高农村同龄男生的身高,计算处均计算处均值和方差分别为值和方差分别为 和和 如何判定当前男生的身高是否发生明显变化如何判定当前男生的身高是否发生明显变化?第1页/共189页一、MatLab中常用分布的有关函数常见分布二项分布泊松分布均匀分布指数分布命令字符binoPoissunifexp常见分布正态分布 分布 分布 分布命令字符normchi2tF几种常见分布及其相应函数表达几种常见分布及其相应函数表达第2页/共189页函数概率密度函数分布函数分位数均值与方差随机生成数字
2、符每种分布提供的五类函数及其相应函数表达每种分布提供的五类函数及其相应函数表达第3页/共189页 1.概率密度函数(分布律)及调用格式概率密度函数(分布律)及调用格式 MatLab自带了一些常见分布的概率密度函数(分布自带了一些常见分布的概率密度函数(分布律)律).函数名称及调用格式见下表函数名称及调用格式见下表:第4页/共189页函数名称及调用格式常见分布二项分布泊松分布均匀分布指数分布正态分布 分布分布分布第5页/共189页例例 设设画出该分布的图形画出该分布的图形.输入语句输入语句图形为图形为第6页/共189页 的分布律图形的分布律图形第7页/共189页 我们知道我们知道,当当 较大而较
3、大而 适中时适中时,二项分布可用二项分布可用泊松分布来近似计算泊松分布来近似计算,即有公式即有公式我们对上例进行对比我们对上例进行对比.第8页/共189页第9页/共189页例例 设设当当 时时,画出指数函数画出指数函数的密度函数图形的密度函数图形.程序如下程序如下:第10页/共189页 相应的图形为相应的图形为第11页/共189页例例 设设 画出相应的的密度函数图形画出相应的的密度函数图形.程序如下程序如下:第12页/共189页 相应的图形为相应的图形为第13页/共189页 2.分布函数的调用格式分布函数的调用格式 我们知道我们知道,若随机变量若随机变量 的分布函数为的分布函数为 即即则则由此
4、由此,当分布函数已知时当分布函数已知时,可以求出所需的概率可以求出所需的概率.第14页/共189页例例 设设求求 标准正态分布的分布函数的调用函数为标准正态分布的分布函数的调用函数为 输入语句输入语句 返回值返回值注 一般调用格式第15页/共189页例例 设设 求求 因随机变量并不服从标准正态分布因随机变量并不服从标准正态分布,由转换公式由转换公式此时此时 由计算公式由计算公式,得得再输入命令再输入命令第16页/共189页返回值返回值 第17页/共189页例例 设打一次电话所用的时间(单位设打一次电话所用的时间(单位min)服从参数为)服从参数为解解 令令 表示电话间那人打电话所占用的时间表示
5、电话间那人打电话所占用的时间,则由题则由题0.2的指数分布的指数分布,如果有人刚好在你前面走进公用电话如果有人刚好在你前面走进公用电话间(假定电话间只有一部电话可供使用)间(假定电话间只有一部电话可供使用),试求你将等试求你将等待待超过超过5分钟的概率分钟的概率;5分钟到分钟到10分钟之间的概率分钟之间的概率.意知意知:因此相应的密度函数为因此相应的密度函数为第18页/共189页因而因而 输入命令输入命令 返回值返回值 输入命令输入命令 返回值返回值 第19页/共189页 指数分布函数的一般调用格式指数分布函数的一般调用格式即第20页/共189页 输入语句输入语句结果为即:第21页/共189页
6、例例 某人向空中抛一枚质地均匀的硬币某人向空中抛一枚质地均匀的硬币 次次,求这求这次中正面向上的次数恰好为次中正面向上的次数恰好为 与小于与小于 次的概率次的概率.解解 记记 为为 次中正面向上的次数次中正面向上的次数,则则所求概率为所求概率为:输入语句输入语句概率为概率为第22页/共189页再执行命令再执行命令概率为概率为若还要计算介于若还要计算介于 到到 之间的概率之间的概率,即计算即计算再执行命令再执行命令概率为概率为第23页/共189页 以上数据你是否发现问题以上数据你是否发现问题?如何解释该问题如何解释该问题?第24页/共189页例例 设设求求 作出其分布函数的图形作出其分布函数的图
7、形.解解 输入命令输入命令概率为概率为该概率即为正态分布中的该概率即为正态分布中的 准则准则!输入命令输入命令第25页/共189页图形为图形为从这个图形中你能感觉到什么从这个图形中你能感觉到什么?第26页/共189页 3.分位数的调用分位数的调用 在统计学中在统计学中,分位数是个极其重要的概念分位数是个极其重要的概念.分位数定义分位数定义:设设 是随机变量是随机变量,满足满足 的的 称为该随机变量的称为该随机变量的上上 分位数分位数;满足满足的的 称为该随机变量的称为该随机变量的下下 分位数分位数;满足满足第27页/共189页的的 称为该随机变量的称为该随机变量的双侧双侧 分位数分位数.第28
8、页/共189页分布名称上 分位数调用格式上 分位数正态分布 分布 分布 分布几种常见分布的上几种常见分布的上 分位数调用格式分位数调用格式第29页/共189页例例 就就 求对应的上求对应的上 分位数分位数;求求 并给出该点的具体位置并给出该点的具体位置.程序为程序为结果为结果为第30页/共189页 输入语句输入语句结果为结果为第31页/共189页程序如下程序如下此时此时第32页/共189页图形为图形为分位数点分位数点第33页/共189页 4.随机数生成函数的调用格式随机数生成函数的调用格式 泊松分布随机数泊松分布随机数 格式格式 其中其中 为分布中的未知参数为分布中的未知参数,即即 为矩阵的阶
9、数为矩阵的阶数.第34页/共189页例例 产生一个产生一个 的矩阵的矩阵,其列向量是参数为其列向量是参数为的泊松随机数的泊松随机数.输入命令输入命令返回值返回值第35页/共189页 正态分布随机数正态分布随机数 格式格式例例 生成一个生成一个 的矩阵的矩阵,其列向量服从其列向量服从输入命令输入命令结果为结果为第36页/共189页例例 生成一个生成一个 的矩阵的矩阵,其列向量服从其列向量服从输入命令输入命令结果为结果为再计算方差再计算方差返回值返回值第37页/共189页 标准正态分布随机数的另一个函数为标准正态分布随机数的另一个函数为 在前例中在前例中,若输入命令若输入命令 结果为结果为第38页
10、/共189页 均匀分布随机数均匀分布随机数 格式格式第39页/共189页例例 生成一个生成一个 的矩阵的矩阵,其列向量服从其列向量服从输入命令输入命令结果为结果为第40页/共189页例例 生成一个生成一个 的矩阵的矩阵,其列向量服从其列向量服从输入命令输入命令结果为结果为第41页/共189页 注注 生成服从生成服从 上均匀分布随机数还可用函数上均匀分布随机数还可用函数得到得到.在前例中在前例中,输入命令输入命令返回值返回值结果大致相同结果大致相同.第42页/共189页二、大数定理及中心极限定理中的问题 1.大数定律大数定律 设随机试验设随机试验 事件事件 在在 次试验中出现次数为次试验中出现次
11、数为若若则事件则事件 在一次试验中发生的概率为在一次试验中发生的概率为第43页/共189页例例 (抛硬币问题试验)(抛硬币问题试验)假设抛均匀硬币出现正面的假设抛均匀硬币出现正面的概率为概率为 分三种情况验证硬币正面出现的频率与概分三种情况验证硬币正面出现的频率与概率的关系。率的关系。三种情况下均进行三种情况下均进行1000组实验组实验,每组实验每组实验的次数分别为的次数分别为 次次.程序如下程序如下:第44页/共189页第45页/共189页第46页/共189页第47页/共189页第48页/共189页叠加后的效果叠加后的效果:第49页/共189页结论结论 随着实验次数的增加随着实验次数的增加,
12、频率将逐渐趋于稳定频率将逐渐趋于稳定.利用大数定律利用大数定律,还可以以解决下面的问题还可以以解决下面的问题.第50页/共189页例例 求圆周率求圆周率 问题描述问题描述 在矩形在矩形 中任取一个点中任取一个点,则该点可能落在圆内则该点可能落在圆内,其中其中 为为 的面积的面积.也有可能落在圆外也有可能落在圆外.由几何概率知道由几何概率知道:落在区域落在区域 内的内的概率为概率为第51页/共189页为估计概率为估计概率,今产生随机数今产生随机数:其中其中:且随机变量且随机变量 均服从区间均服从区间由此得到问题的解法由此得到问题的解法.上的均匀分布上的均匀分布.则则第52页/共189页 下面这段
13、程序给下面这段程序给记录有多少个点在圆内记录有多少个点在圆内.出了问题的求解方法出了问题的求解方法.第53页/共189页 计算结果为计算结果为第54页/共189页例例 用大数定律估计定积分用大数定律估计定积分相应程序为相应程序为:积分值积分值第55页/共189页 2.中心极限定理及应用中心极限定理及应用 中心极限定理中心极限定理 设设 是一个独立同分布的随机变量序列是一个独立同分布的随机变量序列,且且则对则对 任意一个任意一个 有有第56页/共189页 中心极限定理的几何描述中心极限定理的几何描述 当当 较大时较大时,近似服从正态分布近似服从正态分布.程序如下程序如下第57页/共189页 相应
14、的图形为相应的图形为第58页/共189页下图是下图是 时泊松分布的图形时泊松分布的图形.第59页/共189页例例 产生服从二项分布产生服从二项分布 的的 个随机数个随机数,这里取这里取计算计算 个随机数的和个随机数的和以及以及并把这个过程重复并把这个过程重复 次次,用这用这 个个绘制频率直方图绘制频率直方图,并讨论并讨论 与标准正态分与标准正态分布的关系布的关系.第60页/共189页程序如下程序如下 第61页/共189页第62页/共189页例例 (高尔顿钉板实验)(高尔顿钉板实验)高尔顿设计了一个钉板实验高尔顿设计了一个钉板实验,图中每个每个黑点表示钉在板上的一个钉子图中每个每个黑点表示钉在板
15、上的一个钉子,它们彼此它们彼此的距离相等的距离相等,上一层的每一个钉子的水平位置恰好位于上一层的每一个钉子的水平位置恰好位于下一层的两个钉子的正中间下一层的两个钉子的正中间.从入口处放进一个直径略从入口处放进一个直径略小于两个钉子之间的距离的小球小于两个钉子之间的距离的小球.在在小球向下降落过程中小球向下降落过程中,碰到钉子后均碰到钉子后均以以 的概率向左或向右滚下的概率向左或向右滚下,于是于是又碰到下一层钉子又碰到下一层钉子.如此进行下去如此进行下去,直直到滚到底板的一个格子里为止到滚到底板的一个格子里为止.把许把许第63页/共189页多同样大小的小球不断从入口处放下多同样大小的小球不断从入
16、口处放下,只要球的数目相只要球的数目相当大当大,它们在底板将堆成近似正态分布它们在底板将堆成近似正态分布 的密的密度函数图形度函数图形.第64页/共189页Ox-8-7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8共共1616层小钉层小钉小球碰第小球碰第 层钉后向右落下层钉后向右落下小球碰第小球碰第 层钉后向左落下层钉后向左落下高尔顿高尔顿(Francis(Francis Galton,1822-Galton,1822-1911)1911)英国人类学英国人类学家和气象学家家和气象学家第65页/共189页程序如下程序如下 第66页/共189页输出图形输出图形 第67页/共1
17、89页例例 掷骰子实验掷骰子实验.掷掷 次同一个均匀的骰子次同一个均匀的骰子,观察每个点数出现的频率观察每个点数出现的频率.程序如下程序如下第68页/共189页结果为结果为第69页/共189页三、数据的描述与直方图 1.数据描写的常用命令为数据描写的常用命令为 功能功能 生成已知数据的直方图生成已知数据的直方图.格式格式 第70页/共189页例例 对服从正态分布的数据生成相应的直方图对服从正态分布的数据生成相应的直方图.输入命令输入命令图形为图形为第71页/共189页 功能功能 对已知数据计算相应的均值对已知数据计算相应的均值.格式格式第72页/共189页例例 生成一个生成一个 的服从均匀分布
18、的矩阵的服从均匀分布的矩阵,并求相并求相应的均值应的均值.输入命令输入命令结果为结果为第73页/共189页 功能功能 对已知数据计算相应的标准差对已知数据计算相应的标准差.格式格式 第74页/共189页例例 生成生成 个服从个服从 的随机矩阵的随机矩阵,并计算并计算相应的均值和方差相应的均值和方差.程序如下程序如下 第75页/共189页例例 生成生成 个服从个服从 的随机矩阵的随机矩阵,并计算并计算相应的均值和方差相应的均值和方差.程序如下程序如下 第76页/共189页 功能功能 对已知数据计算相应的标准差对已知数据计算相应的标准差.格式格式 第77页/共189页例例 生成生成 个服从个服从
19、的随机矩阵的随机矩阵,并计算并计算相应的均值和方差相应的均值和方差.程序如下程序如下 第78页/共189页 功能功能 计算数据列中的最大数与最小数的差计算数据列中的最大数与最小数的差.格式格式 第79页/共189页例例 生成生成 个服从个服从 的数据的数据,计算相应的均值计算相应的均值,方差和极差方差和极差.程序为程序为结果为结果为第80页/共189页 功能功能 由已知数据作出相应的直方图由已知数据作出相应的直方图.格式格式 第81页/共189页例例 生成生成 个服从个服从 的数据的数据,作出相应的直方作出相应的直方图图.输入语句输入语句第82页/共189页图形为图形为第83页/共189页四、
20、参数估计中的计算 1.点估计的意义点估计的意义参数参数,设设 为总体为总体,为总体的分布为总体的分布,其中其中 为未知为未知为来自总体的样本为来自总体的样本,为相应的观察值为相应的观察值,则则就称为参数就称为参数 的点估计的点估计.第84页/共189页 通常的点估计为通常的点估计为:均值均值 的点估计的点估计:及及 方差方差 的点估计的点估计:无偏估计渐进无偏估计第85页/共189页 2.区间估计的意义区间估计的意义参数参数,设设 为总体为总体,为总体的分布为总体的分布,其中其中 为未知为未知为来自总体的样本为来自总体的样本,为相应的观察值为相应的观察值,为统计量为统计量,使得使得则称区间为则
21、称区间为 的双侧的双侧 置信区间置信区间,称为称为置信水平置信水平.第86页/共189页 常用的区间估计常用的区间估计 正态总体中正态总体中 已知时已知时 的区间估计的区间估计:这里这里 是标准正态分布的上是标准正态分布的上 分位数分位数.第87页/共189页 正态总体中正态总体中 未知时未知时 的区间估计的区间估计:第88页/共189页这里这里为为 的点估计的点估计.正态总体中正态总体中 已知时已知时 的区间估计的区间估计:第89页/共189页 正态总体中正态总体中 未知时未知时 的区间估计的区间估计:这里这里为为 的点估计的点估计.第90页/共189页 正态总体中正态总体中 已知时均值差已
22、知时均值差 的区间估计的区间估计:第91页/共189页 正态总体中正态总体中 未知时均值差未知时均值差 的区间估计的区间估计:这里这里第92页/共189页 将生成概率密度函数的调用函数中的将生成概率密度函数的调用函数中的 改成改成即可得到相应的点估计和区间估计即可得到相应的点估计和区间估计.基本格式基本格式 2.区间估计方法区间估计方法第93页/共189页例例 设设是取自某正态总体的样本观察值是取自某正态总体的样本观察值,求其均值求其均值 和方差和方差的点估计和区间估计的点估计和区间估计.输入命令输入命令第94页/共189页结果为结果为 第95页/共189页五、假设检验 1.假设检验的意义假设
23、检验的意义 问题问题 甲方生产一种产品的尺寸服从均值甲方生产一种产品的尺寸服从均值 、标准差标准差 的正态分布的正态分布,按批向乙方供货(每批的数按批向乙方供货(每批的数量很大)量很大),双方商定每批抽取双方商定每批抽取 件(样本)测量其尺寸件(样本)测量其尺寸,根据样本均值决定乙方是否接受这批产品根据样本均值决定乙方是否接受这批产品.取取 若样本均值与若样本均值与 差的绝对值差的绝对值 不超过不超过即即 时时,则拒绝该产品则拒绝该产品.第96页/共189页 由随机性由随机性,存在这样的可能存在这样的可能,该批产品合格但仍被拒该批产品合格但仍被拒绝绝.商定水平商定水平 使合格品被错误地拒绝的概
24、率不超过使合格品被错误地拒绝的概率不超过 记样本的均值记样本的均值则则取取并使得并使得第97页/共189页故可取故可取即当即当时(时(),则接受该产品则接受该产品,否则拒绝否则拒绝.第98页/共189页 总体均值假设检验的一般作法总体均值假设检验的一般作法 设抽取一容量为设抽取一容量为 的样本的样本,均值及标准差分别为均值及标准差分别为记记 分别称为分别称为原假设原假设和和被选被选假设假设,检验的结果为检验的结果为:接受接受 或拒绝或拒绝 再设显著性水平为再设显著性水平为当总体方差当总体方差 已知时已知时,记记则有则有第99页/共189页从而得到从而得到 这样的检验又称这样的检验又称 检验检验
25、.第100页/共189页 2.MatLab中的检验方法中的检验方法 格式格式 说明说明 时表示在显著性水平为时表示在显著性水平为 时接受假设时接受假设,而当而当 拒绝假设拒绝假设;表示表示 的均值等于的均值等于 已知时均值已知时均值 的检验(的检验(检验法)检验法)第101页/共189页 表示表示 的均值大于的均值大于 表示表示 的均值小于的均值小于 是在假设成立时的概率是在假设成立时的概率;是均值的置信水平为是均值的置信水平为 的置信区间的置信区间.第102页/共189页 未知时均值未知时均值 的检验(的检验(检验法)检验法)格式格式 注注 检验的意义与检验的意义与 检验法相同检验法相同,此
26、时统计量为此时统计量为第103页/共189页例例 生成正态总体生成正态总体 的的 个随机样本个随机样本,分别在分别在已知和已知和 未知的两种情况下未知的两种情况下,检验检验 和和(取(取 ).程序如下程序如下:第104页/共189页相应的结果为相应的结果为:接受检验接受检验相应的概率相应的概率置信区间置信区间第105页/共189页相应的相应的 值值注意到注意到对于检验对于检验 相应的结果为相应的结果为:第106页/共189页拒绝检验拒绝检验相应的概率相应的概率置信区间置信区间第107页/共189页相应的相应的 值值 未知时的检验结果与上平行未知时的检验结果与上平行.第108页/共189页 两个
27、正态总体均值差的假设检验两个正态总体均值差的假设检验 两个正态总体两个正态总体 和和 的均值的均值与与 比较的检验比较的检验,命令格式为命令格式为第109页/共189页例例 分别生成服从分别生成服从各各 个个随机数随机数,检验两个总体均值检验两个总体均值程序如下程序如下运行结果表明结果的不稳定性运行结果表明结果的不稳定性.在上面的问题中在上面的问题中,若将样本容量取到若将样本容量取到则检验则检验结果比较稳定结果比较稳定.(拒绝的概率较大)(拒绝的概率较大)第110页/共189页 正态总体分布的检验正态总体分布的检验 意义意义 检查已知数据是否来自一个正态总体检查已知数据是否来自一个正态总体.格
28、式格式 结果分析结果分析 若数据来自一个正态总体若数据来自一个正态总体,则图形以直线则图形以直线形式显示形式显示.第111页/共189页例例 对问题中的对问题中的 个数据个数据,作以下判定作以下判定:该该 个数据是否来自一个正态总体个数据是否来自一个正态总体?检验学生平均身高是否较检验学生平均身高是否较 有明显提高有明显提高?解解 分别执行分别执行结果结果通过正态性检验通过正态性检验第112页/共189页正态性检验结果正态性检验结果第113页/共189页 两种情况都说明该数据来自正态总体两种情况都说明该数据来自正态总体.再输入再输入 结果为结果为拒绝假设拒绝假设第114页/共189页相应的置信
29、区间为相应的置信区间为由此得到结论由此得到结论:年后年后,该地区同一年龄的学生的平均该地区同一年龄的学生的平均身高有显著提高身高有显著提高.第115页/共189页六、回归分析 回归分析是数据分析中的一个重要方面回归分析是数据分析中的一个重要方面,它在控制理它在控制理论论,风险预测等方面都有很重要的应用风险预测等方面都有很重要的应用.第116页/共189页 1.问题的提出问题的提出例例 为了研究弹簧悬挂不同重量为了研究弹簧悬挂不同重量 时长度时长度 的关系的关系,通通过实验得到下面过实验得到下面 组数据组数据,510152025307.258.128.959.9010.9011.80相应的散点图
30、为相应的散点图为:第117页/共189页第118页/共189页 图形让我们有理由相信这两者之间的关系是个线性关图形让我们有理由相信这两者之间的关系是个线性关系系,由此产生如下问题由此产生如下问题:线性关系的系数是多少线性关系的系数是多少?即要知道即要知道中的常数中的常数由此得到的常数的可信度是多少由此得到的常数的可信度是多少?第119页/共189页 2.一元回归分析一元回归分析 设有数据设有数据关系式关系式 称为称为一元线性回归模型一元线性回归模型,称为称为回归系数回归系数.在MatLab下的回归实现.第120页/共189页 命令格式命令格式 符号说明符号说明:回归系数的点估计回归系数的点估计
31、回归系数的区间估计回归系数的区间估计残差与残差的置信区间残差与残差的置信区间用于回归分析中的相关数据用于回归分析中的相关数据第121页/共189页相关系数相关系数值值,若若 ,则拒绝则拒绝对应的概率对应的概率,当概率小于当概率小于 时时,回归模回归模越大回归方程越显著越大回归方程越显著型成功型成功第122页/共189页 在原问题中在原问题中,再输入再输入可得到如下结果可得到如下结果:点估计点估计区间估计区间估计第123页/共189页相关系数相关系数 说明回归方程显著说明回归方程显著说明回归方程显著说明回归方程显著第124页/共189页 最后画出残差图最后画出残差图,输入输入图形为图形为第125
32、页/共189页 应用应用葡萄酒与心脏病问题分析葡萄酒与心脏病问题分析 适量饮用葡萄酒可以预防心脏病适量饮用葡萄酒可以预防心脏病,下表是下表是 个发达国个发达国家一年的葡萄酒消耗量(每人从所喝的葡萄酒所摄取的家一年的葡萄酒消耗量(每人从所喝的葡萄酒所摄取的酒精升数)以及一年中因心脏病死亡的人数(每酒精升数)以及一年中因心脏病死亡的人数(每 万万人数)人数).第126页/共189页国家国家酒精数酒精数死亡人数死亡人数国家国家酒精数酒精数死亡人数死亡人数澳大利亚澳大利亚2.5211荷兰荷兰1.8167奥地利奥地利3.9167新西兰新西兰1.9266比利时比利时2.9131挪威挪威0.8277加拿大加
33、拿大2.4191西班牙西班牙6.586丹麦丹麦2.9220瑞典瑞典0.8207芬兰芬兰0.8297瑞士瑞士5.8115法国法国9.171英国英国1.3285冰岛冰岛0.8211美国美国1.2199爱尔兰爱尔兰0.7300德国德国2.7172意大利意大利7.9107第127页/共189页要求要求:由上表做散点图由上表做散点图;求回归系数的点估计和区间估计求回归系数的点估计和区间估计;画出残差图画出残差图,并做残差分析并做残差分析;已知某个国家成年人每年平均从葡萄酒中摄取已知某个国家成年人每年平均从葡萄酒中摄取 的的酒精酒精,请预测该国家心脏病的死亡率并作图请预测该国家心脏病的死亡率并作图.第12
34、8页/共189页 散点图为散点图为第129页/共189页 程序运行后的结果为程序运行后的结果为第130页/共189页相关系数相关系数 说明回归方程显著说明回归方程显著说明回归方程显著说明回归方程显著第131页/共189页残差的置信区间都包含零点残差的置信区间都包含零点,说明回归模型较为理想说明回归模型较为理想.第132页/共189页线性函数曲线图形与散点图线性函数曲线图形与散点图第133页/共189页 预测预测:由线性函数由线性函数 得得第134页/共189页例例 合金强度与碳含量关系分析合金强度与碳含量关系分析 研究表明研究表明 合金的强度合金的强度 与含碳量与含碳量 存在某种关系存在某种关
35、系.现有一批数据现有一批数据,试研究这两者之间的关系试研究这两者之间的关系.0.100.110.120.130.140.1541.042.545.045.545.047.50.160.170.180.200.220.2449.051.050.055.557.559.5第135页/共189页 首先进行曲线拟合首先进行曲线拟合,观察数据点的特征观察数据点的特征.输入语句输入语句第136页/共189页第137页/共189页 进行回归分析进行回归分析,输入语句输入语句第138页/共189页 结果为结果为回归比较理想回归比较理想.第139页/共189页残差图为残差图为第140页/共189页在残差图中在残
36、差图中,第四个数据异常第四个数据异常,剔除该数据后剔除该数据后,继续检验继续检验第141页/共189页此时再剔除第五个数据后有此时再剔除第五个数据后有第142页/共189页 相应的数据值为相应的数据值为:残差的置信区间都包含零点残差的置信区间都包含零点,说明回归模型较为理想说明回归模型较为理想.第143页/共189页 3.可线性化的一元非线性回归可线性化的一元非线性回归 某些变量间的关系并非一定是线性关系某些变量间的关系并非一定是线性关系,所以要考虑所以要考虑将这类关系转化为线性关系将这类关系转化为线性关系.这类关系中比较典型的是这类关系中比较典型的是指数关系指数关系.采用的方法是通过取对数的
37、方法将其转化采用的方法是通过取对数的方法将其转化为线性关系为线性关系.第144页/共189页例例 炼钢过程中需要钢包来盛钢水炼钢过程中需要钢包来盛钢水,由于受到钢水的侵由于受到钢水的侵作用作用,钢包的容积会不断扩大钢包的容积会不断扩大,下表给出使用次数和容下表给出使用次数和容积增大的数据积增大的数据:第145页/共189页次数次数23457810容积容积106.42108.20109.58109.50110.00109.93110.49次数次数111415161819容积容积110.59110.60110.90110.76111.00111.20钢包使用次数和增大容积的数据钢包使用次数和增大容
38、积的数据第146页/共189页第147页/共189页图形中可以看出图形中可以看出,该曲线具有函数该曲线具有函数的特征的特征.两边取对数后有两边取对数后有以此数据作为回归数据以此数据作为回归数据,则有则有第148页/共189页第149页/共189页 残差图为残差图为第150页/共189页 4.多元回归分析多元回归分析 所谓多元回归指的是所谓多元回归指的是:设设 若若变量变量 具有关系具有关系上式即称为多元回归模型上式即称为多元回归模型.多元回归的意义多元回归的意义第151页/共189页 设有设有 个独立观察值个独立观察值由上式得由上式得记记第152页/共189页 则上式可简写成则上式可简写成再记
39、再记则则 的最小二乘估计为的最小二乘估计为第153页/共189页称其为观察值称其为观察值 的离差平方和的离差平方和;上式可以上式可以分解成分解成其中其中分别称为分别称为回归平方和回归平方和及及残差平方和残差平方和.第154页/共189页 模型的有效性检验模型的有效性检验:可以证明可以证明,当当 成立时成立时,有以下结论有以下结论:与与 相互独立相互独立;第155页/共189页 多元回归方法多元回归方法 与一元回归方法相仿与一元回归方法相仿,在在MatLab中中,进行回归的命令进行回归的命令是是:其中数值的意义与一元回归数值相仿其中数值的意义与一元回归数值相仿.第156页/共189页例例 血压、
40、年龄、体质指数与吸烟关系的数据分析血压、年龄、体质指数与吸烟关系的数据分析 体质指数体质指数 下表给出下表给出 个人的血压和体质指数个人的血压和体质指数,试建立相应的试建立相应的如果还有吸烟的习惯如果还有吸烟的习惯,怎样在模型中加以考虑怎样在模型中加以考虑.模型模型;第157页/共189页序号序号血压血压/mmHg年龄年龄体质指数体质指数吸烟习惯吸烟习惯11443924.2022154731.1131384522.6041454724.0151626525.9161424625.1071706729.5181244219.7091586727.21101545619.30第158页/共189页
41、序号序号血压血压/mmHg年龄年龄体质指数体质指数吸烟习惯吸烟习惯111626428.01121505625.80131405927.30141103420.10151284221.70161304822.21171354527.40181141818.80191162022.60201241921.50第159页/共189页序号序号血压血压/mmHg年龄年龄体质指数体质指数吸烟习惯吸烟习惯211363625.00221425026.21231203923.50241202120.30251604427.11261585328.61271446328.30281302922.012912525
42、25.30301756927.41第160页/共189页 记血压为记血压为 年龄为年龄为 体质指数为体质指数为 吸烟习惯为吸烟习惯为则模型为则模型为第161页/共189页 回归分析后的结果为回归分析后的结果为模型还是比较理想模型还是比较理想,残差图为残差图为第162页/共189页第163页/共189页说明数据中有说明数据中有2个异点个异点,剔除后模型更加完善剔除后模型更加完善.第164页/共189页结果为结果为第165页/共189页 由此得到回归方程由此得到回归方程:上式说明上式说明,在相同情况下在相同情况下,吸烟者比不吸引者血压将升吸烟者比不吸引者血压将升高高 第166页/共189页七、随机
43、模拟 1.随机模拟的意义随机模拟的意义 随机模拟是一种随机实验的方法随机模拟是一种随机实验的方法,又称为蒙特卡洛方又称为蒙特卡洛方法法.该方法起源于美国第二次世界大战期间研制原子弹该方法起源于美国第二次世界大战期间研制原子弹的的“曼哈顿曼哈顿”计划计划.该项目的主持人之一该项目的主持人之一冯冯诺依曼用驰名世界的赌诺依曼用驰名世界的赌城城摩纳哥的蒙特卡洛来命名这种方法摩纳哥的蒙特卡洛来命名这种方法.第167页/共189页 基本思想基本思想 设计某一个随机实验设计某一个随机实验,使得某个事件的概率与一个未使得某个事件的概率与一个未知数有关知数有关.对该问题做重复试验对该问题做重复试验,以频率取代该
44、问题的以频率取代该问题的概率概率.从而求得该问题的近似解从而求得该问题的近似解.第168页/共189页 2.的模拟计算的模拟计算例例 设计一个计算方法以得到设计一个计算方法以得到 的近似计算值的近似计算值.方法方法 以普丰投针法进行求解以普丰投针法进行求解.在平面上作出两条距离为在平面上作出两条距离为 的平行线的平行线.取一根长度取一根长度 为为 的针的针,将针投向该区域将针投向该区域,以以 表示针的中表示针的中点与最近一条平行线的距离点与最近一条平行线的距离,表示针与直线的交角表示针与直线的交角,则有则有:针与直线相交针与直线相交第169页/共189页即由几何概率知:针与平行线相交的概率 在
45、MatLab下,建立相应的求解程序.程序如下第170页/共189页第171页/共189页 的另一种估算方法 问题描述 在矩形 中任取一个点,则该点可能落在圆内,其中 为 的面积.也有可能落在圆外.由几何概率知道:落在区域 内的概率为第172页/共189页为估计概率,今产生随机数:其中:且随机变量 均服从区间由此得到问题的解法.上的均匀分布.则第173页/共189页例 用Monte Carlo方法估计定积分相应程序为:程序如下:第174页/共189页 问题 如何计算积分?程序如下:第175页/共189页例 用Monte Carlo方法估计定积分相应程序如下:在MatLab下进行数值积分,得积分值
46、:第176页/共189页 问题一 射击命中率 炮弹设计的目标为一椭圆形区域,在 方向半轴长120,轴方向半轴长为80.当瞄准目标的中心发射炮弹时,在众多的随机因素影响下,弹着点与目标中心有随机偏差,假定弹着点围绕中心呈正态分布,且偏差在两个方向上相互独立,均方差分别为60和40,求炮弹落在椭圆形区域中的概率.第177页/共189页 模型建立 建立平面坐标系统,目标中心为坐标原点,记目标区域为 单着点 的概率密度为第178页/共189页则,所求概率为:其中:该积分无法给出解析解.第179页/共189页 模型求解 做广义极坐标变换则原积分改为第180页/共189页在MatLab下进行二重积分.得概
47、率为第181页/共189页 用数据模拟方法估算该积分:首先做变量替换,则原积分式为其中再由对称性得:第182页/共189页编制程序如下:第183页/共189页第184页/共189页 应用中子逸出问题中的概率估算 下图是一个中子穿过用于中子屏蔽的铅墙示意图.铅墙的高度远大于左右厚度.设中子是垂直由左端进入铅墙,在铅墙中运行一个单位距离然后与一个铅原子碰撞.碰撞后,任意改变方向,并继续运行一个单位后与另一个铅原子碰撞.这样下去,如果中子在铅墙里消耗掉所有的能量或者从左端逸出就被视为中子被铅墙挡住,如果中子穿过铅墙由右第185页/共189页端逸出就视为中子逸出.如果铅墙厚度为5个单位,中子运行7个单位后能量耗尽,求中子逸出的几率.该问题并不复杂,但不容易找到一个解析表达式.而用模拟的方法求解却可以有满意的结果.第186页/共189页 建模 下面我们给出这个问题的思想方法和相应的模拟程序.我们关心的是一次碰撞后,中子在 轴方向行进了多少,所以行进方向是正负 的结果是一样的,我们就只考虑是正的情形.由于中子运行的方向 是随机的,我们用计算机抽取在0到 间均衡分布的随机数,模拟1000000个中子在铅墙里行进的情形,看看这些中子与铅原子碰撞7次后,有多少超过了铅墙的右端.第187页/共189页 程序如下第188页/共189页感谢您的观看!第189页/共189页
限制150内