2022年概率论与数理统计数学实验 .pdf
《2022年概率论与数理统计数学实验 .pdf》由会员分享,可在线阅读,更多相关《2022年概率论与数理统计数学实验 .pdf(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.概率论与数理统计数学实验目录实验一几个重要的概率分布的MATLAB 实现 p2-3 实验二数据的统计描述和分析 p4-8 实验三参数估计 p9-11 实验四假设检验 p12-14 实验五方差分析 p15-17 实验六回归分析 p18-27名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 27 页 -.实验一几个重要的概率分布的MATLAB 实现实验目的(1)学习 MATLAB 软件与概率有关的各种计算方法(2)会用 MATLAB 软件生成几种常见分布的随机数(3)通过实验加深对概率密度,分布函数和分位数的理解Matlab 统计工具箱中提供了约20种概率分布,对每一种分布提供了5种
2、运算功能,下表给出了常见 8种分布对应的Matlab 命令字符,表2给出了每一种运算功能所对应的Matlab 命令字符。当需要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令。分布均匀指数正态2分布t 分布F分布二项泊松字符unif exp norm chi2 t f bino poiss 功能概率密度分布函数逆概率密度均值与方差随机数生成字符pdf cdf inv stat rnd 例1 求正态分布2,1N,在 x=1.2 处的概率密度。解:在 MATLAB 命令窗口中输入:normpdf(1.2,-1,2)结果为:0.1089 例2 求泊松分布3P,在 k=5,6,
3、7处的概率。解:在 MATLAB 命令窗口中输入:poisspdf(5 6 7,3)结果为:0.1008 0.0504 0.0216 例3 设X服从均匀分布3,1U,计算22 5PX.。解:在 MATLAB 命令窗口中输入:unifcdf(2.5,1,3)-unifcdf(-2,1,3)结果为:0.75000 名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 27 页 -.例4 求概率995.0的正态分布2,1N的分位数X。解:在 MATLAB 命令窗口中输入:norminv(0.995,1,2)结果为:6.1517 例5 求t 分布10t的期望和方差。解:在 MATLAB 命令窗
4、口中输入:m,v=tstat(10)m=0 v=1.2500 例6 生成一个 2*3 阶正态分布的随机矩阵。其中,第一行3个数分别服从均值为1,2,3;第二行 3个数分别服从均值为4,5,6,且标准差均为0.1 的正态分布。解:在 MATLAB 命令窗口中输入:A=normrnd(1 2 3;4 5 6,0.1,2,3)A=1.1189 2.0327 2.9813 3.9962 5.0175 6.0726 例7 生成一个 2*3 阶服从均匀分布3,1U的随机矩阵。解:在 MATLAB 命令窗口中输入:B=unifrnd(1,3,2,3)B=1.8205 1.1158 2.6263 2.7873
5、 1.7057 1.0197 注:对于标准正态分布,可用命令randn(m,n);对于均匀分布1,0U,可用命令 rand(m,n)。名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 27 页 -.实验二数据的统计描述和分析实验目的(1)学习 MATLAB 软件关于统计作图的基本操作(2)会用 MATLAB 软件计算计算几种常用统计量的值(3)通过实验加深对均值、方差、中位数等常用统计量的理解1.频数表和直方图一组数据(样本观察值)虽然包含了总体的信息,但往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。将数据的取值范围划分为若干个区间,然后统
6、计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。2 经验累计分布函数图设nxxx,21是总体X的一个容量为n的样本观察值。将nxxx,21按自小到大的次序排列,并重新编号,设为nxxx21记nkknxxnkxxxnkxxxF,11,2,1,011则称xFn为总体X的经验累积分布函数,它的图像即为经验累计分布函数图。3 几种常用的统计量(1)算术平均值和中位数算术平均值(简称均值),niiXnX11,中位数是将数据由小到大排序后位于中间位置的那个数值。(2)标准差、方差名师资料总结-精品资料欢迎下载
7、-名师精心整理-第 4 页,共 27 页 -.标准差:211211niiXXns,它是各个数据与均值偏离程度的度量。方差是标准差的平方,记为2s。(3)偏度和峰度表示数据分布形状的统计量有偏度和峰度。偏度:niiXXsg13311反映数据分布对称性的指标,当01g时,称为右偏态,此时数据位于均值右边的比位于左边的多;当01g时称为左偏态,情况相反;而1g接近 0时,则可认为分布是对称的。峰度:niiXXsg14421),是数据分布形状的另一种度量,正态分布的峰度为3,若2g比3大得多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可以用作衡量偏离正态分布的尺度之一。将样本的观
8、测值nxxx,21代入以上各式后,即可求得对应统计量的观测值。4 MATLAB 实现下面我们列出用于数据的统计描述和分析的常用MATLAB 命令。其中,x为原始数据行向量。(1)用 hist 命令实现作频数表及直方图,其用法是:n,y=hist(x,k)返回 x的频数表。它将区间 min(x),max(x)等分为 k份(缺省时 k设定为 10),n返回 k个小区间的频数,y返回 k个小区间的中点。hist(x,k)返回 x的直方图。(2)用 cdfplot命令作累积分布函数图,其用法是:h,stats=cdfplot(x)在返回 x的累积分布函数图的同时,在stats 中给出样本的一些特征:样
9、本最小值、最大值、平均值、中位数和标准差。cdfplot(x,k)则直接返回 x的累积分布函数图。名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 27 页 -.(3)算术平均值和中位数Matlab 中mean(x)返回 x的均值,median(x)返回中位数。(4)标准差、方差和极差极差是nxxx,21的最大值与最小值之差。Matlab 中std(x)返回 x的标准差,var(x)返回方差,range(x)返回极差。(4)偏度和峰度Matlab 中skewness(x)返回 x的偏度,kurtosis(x)返回峰度。例1 某学校随机抽取100名学生,测量他们的身高,所得数据如下表
10、172 169 169 171 167 178 177 170 167 169 171 168 165 169 168 173 170 160 179 172 166 168 164 170 165 163 173 165 176 162 160 175 173 172 168 165 172 177 182 175 155 176 172 169 176 170 170 169 186 174 173 168 169 167 170 163 172 176 166 167 166 161 173 175 158 172 177 177 169 166 170 169 173 164 165
11、182 176 172 173 174 167 171 166 166 172 171 175 165 169 168 173 178 163 169 169 177 184 166 171 170 解:在 MATLAB 命令窗口中输入:X=172 169 169 171 167 178 177 170 167 169 171 168 165 169 168 173 170 160 179 172 166 168 164 170 165 163 173 165 176 162 160 175 173 172 168 165 172 177 182 175 155 176 172 169 176
12、 170 170 169 186 174 173 168 169 167 170 163 172 176 166 167 166 161 173 175 158 172 177 177 169 166 170 169 173 164 165 182 176 172 173 174 167 171 166 166 172 171 175 165 169 168 173 178 163 169 169 177 184 166 171 170;n,y=hist(X)n=2 3 6 18 26 22 11 8 2 2 y=156.5500 159.6500 162.7500 165.8500 168.
13、9500 172.0500 175.1500 178.2500 181.3500 184.4500 hist(X)名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 27 页 -.155160165170175180185190051015202530直方图x1=mean(X)x1=170.2500 x2=median(X)x2=170 x3=range(X)x3=31 x4=std(X)x4=5.4018 x5=skewness(X)x5=0.1545 x6=kurtosis(X)x6=3.5573 例2 产生 50个服从标准正态分布的随机数,指出它们的分布特征,并画出经验累积分布
14、函数图解:在 MATLAB 命令窗口中输入:x=normrnd(0,1,1,50);h,stats=cdfplot(x)h=171.0016 stats=min:-2.9443 max:3.5784 名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 27 页 -.mean:0.2840 median:0.3222 std:1.2625-3-2-10123400.10.20.30.40.50.60.70.80.91xF(x)Empirical CDF经验累积分布函数图名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 27 页 -.实验三参数估计实验目的(1)学习 MATL
15、AB 软件关于参数估计的有关操作命令(2)会用 MATLAB 软件求参数的点估计和置信区间(3)通过实验加深对参数估计基本概念和基本思想的理解1 参数估计的方法利用样本对总体进行统计推断的一类问题是参数估计,即假定总体的概率分布类型已知,由样本估计参数的分布。参数估计的方法主要有点估计和区间估计两种。2 参数估计的Matlab 实现在Matlab 统计工具箱中,有专门计算总体均值、标准差的点估计和区间估计的函数。对于正态总体,命令是mu,sigma,muci,sigmaci=normfit(x,alpha)其中 x 为样本(数组或矩阵),alpha 为显著性水平(alpha 缺省时设定为 0.
16、05),返回总体均值和标准差的点估计 mu 和sigma,及总体均值和标准差的区间估计 muci和sigmaci。当 x为矩阵时返回行向量。此外,Matlab 统计工具箱中还提供了一些具有特定分布总体的区间估计的命令,如expfit,poissfit,分别用于指数分布和泊松分布的区间估计,具体用法可参见MATLAB 的帮助系统。例1 已知某种木材横纹抗压力的实验值),(2NX,对 10个试件做横纹抗压力的试验数据如下:482,493,457,471,510,446,435,418,394,496(单位:公斤/平方厘米),试以 95%的可靠性估计该木材的平均横纹抗压力的置信区间:(1)2未知;(
17、2)2230。解:(1)2未知时,可直接使用normfit命令名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共 27 页 -.在MATLAB 命令窗口中输入:x=482,493,457,471,510,446,435,418,394,496;mu sigma muci sigmaci=normfit(x)mu=460.2 sigma=37.1776515904082 muci=433.60471018703 486.79528981297 sigmaci=25.5720976681307 67.8718993056142 2未知时,平均横纹抗压力的估计值为 460.2,其置信度为0
18、.95 的置信区间为433.6,486.8。(2)2已知时,的置信度为 0.95 的置信区间为1212xu,xunn。在MATLAB 命令窗口中输入:x=482,493,457,471,510,446,435,418,394,496;muci=mean(x)-norminv(0.975)*30/sqrt(10),mean(x)+norminv(0.975)*30/sqrt(10)muci=441.606149030863 478.793850969137 2已知时,平均横纹抗压力的置信度为 0.95 的置信区间为 441.6,478.8。同(1)比较可得,在置信水平相同的条件下,利用方差得到的
19、置信区间的长度要小于忽略方差得到的置信区间长度。例2 某厂生产的瓶装运动饮料的体积假定服从正态分布,抽取10瓶,测得体积(毫升)为595,602,610,585,618,615,605,620,600,606。求出方差的置信度为0.90 的置信区间。解:在MATLAB 命令窗口中输入:x=595,602,610,585,618,615,605,620,600,606;名师资料总结-精品资料欢迎下载-名师精心整理-第 10 页,共 27 页 -.mu sigma muci sigmaci=normfit(x,0.1)mu=605.6 sigma=10.8032916794425 muci=599
20、.337534833741 611.862465166259 sigmaci=7.8793483042824 17.773549266492 sigma2 ans=116.711111111111 sigmaci.2 ans=62.084129700198 315.89905352842 即2的估计值为 116.7,其置信度为0.9 的置信区间为62.08,315.9。例3 某炸药制造厂,一天中发生着火现象的次数X是一个随机变量,假设它服从以0为参数的泊松分布,参数未知。现有以下样本值:着火次数 k 0 1 2 3 4 5 6 发生着火的天数75 90 54 22 6 2 1 试求的极大似然估
21、计值和置信水平为95%的置信区间。解:在MATLAB 命令窗口中输入:x=75,90,54,22,6,2,1;lamda,lamdaci=poissfit(x)lamda=35.7142857142857 名师资料总结-精品资料欢迎下载-名师精心整理-第 11 页,共 27 页 -.lamdaci=31.2871783406817 40.1413930878897 即的极大似然估计值为35.71,其置信水平为95%的置信区间为31.29,40.14。实验四假设检验实验目的(1)学习 MATLAB 软件关于假设检验的有关操作命令(2)会用 MATLAB 软件求单个正态总体和双正态总体的假设检验问
22、题(3)会用 MATLAB 软件判断总体是否服从正态分布(4)通过实验加深对假设检验基本概念和基本思想的理解1 参数假设检验如果总体的分布函数类型已知,只是对总体分布中的参数做某种假设。然后,用样本检验此假设是否成立,这种检验称为参数检验。下面我们给出几种参数检验对应的Matlab 命令,相关的理论知识可参考教材。假设检验Matlab 命令单个总体均值(2已知)0H:01H:0(0,0)h,p,ci=ztest(x,mu,sigma,alpha,tail)单个总体均值(2未知)0H:01H:0(0,0)h,p,ci=ttest(x,mu,alpha,tail)两个总体均值(2221已知)0H:
23、211H:21(21,21)h,p,ci=ttest2(x,y,alpha,tail)注1:x 是样本,mu 是0H中的0,sigma是总体标准差,alpha 是显著性水平(alpha 缺省时设定为 0.05),tail是对备择假设1H的选择:1H为0时,令 tail=0(可缺省);1H为0时,令 tail=1;1H为0时,令 tail=-1。输出参数 h=0表名师资料总结-精品资料欢迎下载-名师精心整理-第 12 页,共 27 页 -.示接受0H,h=1表示拒绝0H,p表示在假设0H下样本均值出现的概率,p越小0H越值得怀疑,ci 是0的置信区间。注2:ttest2输入的是两个样本x,y,长
24、度可以不同。例1 某种电子元件的寿命x(以小时计)服从正态分布,2未知.现得 16只元件的寿命如下:159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于225(小时)?()解:需要检验:0H:225,1H:225x=159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170;h,p,ci=ttest(x,225,0.05,1)h=0 p=0.2570 ci=198.2321 Inf h=0,p=0.2570,说明在显著
25、水平为0.05 的情况下,不能拒绝原假设,认为元件的平均寿命不大于 225小时。例2 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一平炉上进行的。每炼一炉钢时除操作方法外,其它条件都可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交换进行,各炼了 10炉,其得率分别为:1标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.6 76.7 77.3 2新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1 设这两个样本相互独立且服从标准差相同的正态分布,问建议的新方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年概率论与数理统计数学实验 2022 概率论 数理统计 数学 实验
限制150内