欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    概率统计实验.docx

    • 资源ID:36030096       资源大小:46.62KB        全文页数:24页
    • 资源格式: DOCX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    概率统计实验.docx

    §13.6 概率统计实验学习目标1 会用Mathematica求概率、均值与方差;2 能进行常用分布的计算;3 会用Mathematica进行期望与方差的区间估计;4 会用Mathematica进行回归分析。 概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍Mathematica自带的统计程序包,其中有实现常用统计计算的各种外部函数。一、 样本的数字特征1. 一元的情况Mathematica的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的Statistic程序包子集中,位于目录D:Mathematica4.0AddOnsStandardPackagesStatistics下。通过查看Help,可以找到包含所需外部函数的程序文件名。在程序文件DescriptiveStatistics.m中,含有实现一元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差(最大数减最小数)。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。StandardDeviationMLEdata 求标准差。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。 解:In1:= << Statistics DescriptiveStatistics In2:= data = 6.5,3.8,6.6,5.7,6.0,6.4,5.3; In3:=Lengthdata Out3=7 In4:=Mindata Out4= 3.8 In5:=Maxdata Out5= 6.6 In6:=SampleRangedata Out6= 2.8 In7:=Mediandata Out7= 6. In8:=Meandata Out8= 5.75714 In9:=Variancedata Out9= 0.962857 In10:=StandardDeviationdata Out10= 0.981253 In11:=VarianceMLEdata Out11= 0.825306 In12:= StandardDeviationMLEdata Out12= 0.908464 说明:在上例中,In1首先调入程序文件,求数据个数、最大值与最小值使用内部函数。2. 多元的情况 在程序文件MultiDescriptiveStatistics.m中,含有实现多元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。 StandardDeviationMLEdata 求标准差。 Covariancexlist,ylist 求x,y的协方差(无偏估计)。 CovarianceMLExlist,ylist 求x,y的协方差。Correlationxlist,ylist 求x,y的相关系数。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例2 给出4个样本值:1.1,2.0,3.2,1.3,2.2,3.1,1.15,2.05,3.35,1.22,2.31,3.33,计算样本个数、均值、方差、标准差等。 解:In1:= << Statistics MultiDescriptiveStatistics In2:= data = 1.1,2.0,3.2,1.3,2.2,3.1, 1.15,2.05,3.35,1.22,2.31,3.33; Lengthdata Out3=4 In4:=SampleRangedata Out4= 0.2,0.31,0.25 In5:=Mediandata Out5= 1.185,2.125,3.265 In6:=Meandata Out6= 1.1925,2.14,3.245 In7:=Variancedata Out7= 0.00755833,0.0200667,0. In8:=VarianceMLEdata Out8= 0.00566875,0.01505,0.010325 In9:=CentralMomentdata,2 Out9= 0.00566875,0.01505,0.010325 In10:=x=dataAll,1;y=dataAll,2; z=dataAll,3; In11:=Covariancex,y Out11=0.0093 In12:=Covariancez,z Out12=0. In13:=CovarianceMLEy,y Out13=0.01505 In14:=Correlationy,z Out14=0. In15:=Correlationx,x Out15=1.二、 常用分布的计算 在计算机出现以前,统计计算总是依赖一堆函数表。使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。1. 离散分布 程序文件DiscreteDistributions.m中,含有用于离散分布计算的函数。其中常用的离散分布有: BernoulliDistributionp 贝努利分布。 BinomialDistributionn,p 二项分布。 GeometricDistributionp 几何分布。 HypergeometricDistributionn,M,N 超几何分布。 PoissonDistribution 泊松分布。 DiscreteUniformDistributionn 离散的均匀分布。 NegativeBinomialDistributionn,p 负二项分布。 以上函数中的参数,既可以是数值的,也可以是符号的。使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。真正进行计算的是下面的求值函数,它们使用以上的分布表达式作为一个参数。 常用的求值函数有: Domaindist 求dist的定义域。 PDFdist,x 求点x处的分布dist的密度值。 CDFdist,x 求点x处的分布函数值。 Quantiledist,q 求x,使CDFdist,x达到q。Meandist 求分布dist的期望。 Variancedist 求方差。 StandardDeviationdist 求标准差。 ExpectedValuef,dist,x 求Ef(x)。 CharacteristicFunctiondist,t 求特征函数(t)。 Randomdist 求具有分布dist的伪随机数。 RandomArraydist,dims 求维数为dims的伪随机数的数组。例3 观察下面二项分布的各种基本计算。 In1:= << Statistics DiscreteDistributions In2:= b=BinomialDistributionn,p Out2=BinomialDistributionn,p In3:=Meanb Out3=np In4:=Varianceb Out4= n(1-p)p In5:=CharacteristicFunctionb,t Out5= (1-p+e it p)n In6:=b=BinomialDistribution10,0.3 Out6= BinomialDistribution10,0.3 In7:=Domainb Out7= 0,1,2,3,4,5,6,7,8,9,10 In8:=PDFb,4 Out8= 0.200121 In9:=CDFb,3.9 Out9= 0.649611 In10:=CDFb,4 Out10= 0.849732 In11:=Varianceb Out11= 2.1说明:在上例中,首先调入程序文件。In2用b表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。In3In5进行的是符号运算,可以得到期望、方差等的一般公式。这是本程序与一般统计软件的不同之处,充分表达了Mathematica的特色。接下来给出具体的参数值,进行数值计算,这些计算取代了查表。以下是一些更广泛、深入的例子。例4 观察下面离散分布的各种计算。 In1:= << Statistics DiscreteDistributions In2:= h=HypergeometricDistributionn,M,N; Meanh Out3= In4:=Varianceh Out4= In5:= p=PoissonDistribution5; PDFp,2 Out6= In7:=N% Out7=0.0842243 In8:=PDFp,20 /N Out8=2.64121×10-7 In9:=NCDFp,20,20 Out9=0.999999912 In10:=ExpectedValuex2,p,x Out10=30 In11:=RandomArrayp,2,10 Out11=3,4,6,10,2,5,7,2,5,5, 4,3,2,11,5,4,2,2,4,6说明:在上例中表明,超几何分布的参数按我国教科书的习惯来表示,这里求出的期望与方差公式就与教科书上的相同了。In5中给出的参数是准确数5,Mathematica在下面进行的仍是符号计算,得到准确结果。如果参数改为5.0 ,则计算结果就都是近似值了。In10是求E2,ExpectedValue是一个很有用的函数,务必注意。除了以上介绍的内容外,还有些不常用的函数本书没有列出,有兴趣的读者可以浏览Help。2. 连续分布 程序文件ContinuousDistributions.m 中,含有用于连续分布计算的函数。其中常见的连续分布有: NormalDistribution, 正态分布。 UniformDistributionmin,max 均匀分布。 ExponentialDistribution 指数分布。 StudentTDistributionn t分布。ChiSquareDistributionn 2分布。 常用的求值函数与离散分布相同,这里不再列出。例5 计算:(1)N(0,1),求:P(1.96),P( -1.96),P(-1<2)。(2)N(8,0.5),求:P(10),P(7<9)。 解:In1:= << Statistics ContinuousDistributions In2:= n=NormalDistribution0,1; In3:=CDFn,1.96 Out3=0.975002 In4:=CDFn,-1.96 Out4=0.0249979 In5:=CDFn,2.- CDFn,-1. Out5= 0.818595 In6:= n=NormalDistribution8,0.5; In7:=CDFn,10 Out7=0.999968 In8:=CDFn,9- CDFn,7 Out8=0.9545 说明:在上例中,由于In2没有使用小数点,这时在In5中需要使用小数点才能得到近似值,否则得到符号解。反之,由于In6使用了小数点,后面的计算则不必再使用小数点了。如果使用人工查表的方法求In7,还需要首先转换成标准正态分布,这里就显得方便了。例6 绘制2分布在n分别为1,5,15时的分布密度函数图。 解:In1:= << Statistics ContinuousDistributions In2:=PlotPDFChiSquareDistribution1,x, PDFChiSquareDistribution5,x, PDFChiSquareDistribution15,x,x,0,30, PlotRange0,0.2得到如图13-46所示的函数图形。图13-46 2分布的分布密度图 说明:上例中的绘图语句使用了函数嵌套,其中的函数名较长,最好自制统计函数模板。 因为这些统计计算都可以是符号的,所以能用于查询各种公式。以下是一个实例: In1:= << Statistics ContinuousDistributions In2:=PDFNormalDistribution0,1,x Out2= In3:= n=NormalDistribution,; Meann Out4= In5:=Variancen Out5= 2 In6:= e=ExponentialDistribution; Meane Out7= In8:=Variancee Out8= In9:=ExpectedValuex2,e,x Out9= 三、 区间估计1. 总体数学期望的区间估计 程序文件ConfidenceIntervals.m 中,含有用于总体参数区间估计的函数。其中用于总体数学期望的区间估计的函数是: MeanCIdata,KnownVariancevar 已知方差var,由数据表data求总体数学期望的置信区间(基于正态分布)。 MeanCIdata 由数据表data求总体数学期望的置信区间(方差未知、基于t分布)。 其中参数KnownVariance也可以改为 KnownStandardDeviation,即已知标准差。 以上两个函数由样本数据表data直接求置信区间。但有时已知的是样本平均值,这时改用以下函数: NormalCImean,sd 标准差已知,且sd=,由样本平均值mean求总体数学期望的置信区间(基于正态分布)。 StudentTCImean,se,dof 用于方差未知,由样本平均值mean求总体数学期望的置信区间(基于t分布),其中,se =,而dof是自由度(等于n - 1)。以上函数都有可选参数:ConfidenceLevel 置信度,默认值为0.95。例7 已知某炼铁厂的铁水含碳量(%)服从正态分布,现测得5炉铁水的含碳量分别是:4.28,4.4,4.42,4.35,4.37。如果已知标准差为=0.108,求铁水平均含碳量的置信区间(置信度为0.95)。 解:In1:= << Statistics ConfidenceIntervals In2:= data=4.28,4.4,4.42,4.35,4.37; MeanCIdata,KnownVariance 0.1082 Out3=4.26934,4.45866 例8 假定新生男婴的体重服从正态分布,随机抽取12名男婴,测得体重分别是(单位:g):3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。试求新生男婴平均体重的置信区间(置信度为0.95)。解:In4:= data=3100,2520,3000,3000,3600,3160,3560,3320, 2880,2600,3400,2540; MeanCIdata Out5=2818.2,3295.13 例9 在例7中如果改为已知测得9炉铁水的含碳量的平均值是4.484,其余条件不变,再求铁水平均含碳量的置信区间(置信度为0.95)。 解:In6:=NormalCI4.484,0.108 / Out6=4.41344,4.55456 例10 铅的比重测量值服从正态分布,测量16次算出=2.705,S=0.029。试求铅的比重的置信区间(置信度为0.95)。 解:In7:=StudentTCI2.705,0.029/Sqrt16,15 Out7=2.68955,2.72045 当调入程序文件ConfidenceIntervals.m时,为了计算各种统计量,这个程序会自动调入程序文件DescriptiveStatistics.m。因此,也可以首先由数据计算函数StudentTCI的各个参数,如下所示: In1:= << Statistics ConfidenceIntervals In2:= data=2.1,1.2,0.7,1.0,1.1,3.2,3.2,3.3,2.1,0.3; m=Meandata Out3=1.82 In4:= se=StandardErrorOfSampleMeandata Out4=0.354275 In5:=StudentTCIm,se,Lengthdata-1,ConfidenceLevel0.9 Out5=1.17057,2.46943 说明:上例中,In4利用数据直接求出se,而不是像教科书上先求S,In5示范了设置置信度为0.9的方法。2. 总体方差的区间估计 对总体的方差进行区间估计的函数是: VarianceCIdata 由数据表data求总体方差的置信区间(基于2 分布)。 ChiSquareCIvariance,dof 由无偏估计样本方差variance,求总体方差的置信区间,其中dof是自由度(等于n - 1)。例11 试求例8的新生男婴体重方差的置信区间(置信度为0.95)。 解:In1:= << Statistics ConfidenceIntervals In2:= VarianceCI3100,2520,3000,3000,3600,3160,3560, 3320,2880,2600,3400,2540 Out2=70687.2,406072. 例12 设炮弹速度服从正态分布,取9发炮弹测得无偏估计样本方差S2=11(m/s)2,求炮弹速度方差的置信区间(置信度为0.9)。 解:In3:= ChiSquareCI11,8,ConfidenceLevel0.9 Out3=5.67474,32.2033 四、 回归分析 对于线性回归,如果只想得到回归方程,只要使用函数Fit就行了。例13 已知某种商品的价格与日销售量的数据: 价格(元) 1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5 销量(斤) 5.0 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 试求线性回归方程,再求价格为4时的日销售量。 解:In1:=data1.0,5.0,2.0,3.5,2.0,3.0,2.3,2.7, 2.5,2.4, 2.6,2.5,2.8,2.0,3.0,1.5, 3.3,1.2,3.5,1.2; Fitdata,1,x,x Out2=6.43828-1.57531x In3:=% 2 / . x4 Out3=0.137029 以上函数虽然能用最小二乘法求出回归方程,但是没有相关性检验。 程序文件LinearRegression.m中,含有实现多元线性回归的专用函数,具体调用格式如下: Regressdata,funs,vars 由表data的数据,求由基函数表funs中函数的线性组合构成的回归方程,其中funs中函数的自变量由表vars给出。 其中表data的一般形式为x11,x21,y1,x12,x22,y2,表funs的一般形式为f1,f2,而表vars的一般形式为x1,x2,其实这里的表示法与函数Fit相同,具体表示式的例子可以参看前面的例子,这里不再重复。例14 使用Regress重解例13。 解:数据已经在解例13时输入,这里使用Regress继续求解。 In4:= << Statistics LinearRegression In5:=Regressdata,1,x,x Out5=ParameterTable Estimate SE TStat PValue 1 6.43828 0.236494 27.2239 3.57135×10-9 x -1.57531 0.0911754 -17.2778 1.28217×10-7 RSquared0.973901,AdjustedRSquared0.970639 EstimatedVariance0.0397359,ANOVATable DF SumOfSq MeanSq FRatio PValue Model 1 11.8621 11.8621 298.524 1.28217×10-7 Error 8 0.317887 0.0397359 Total 9 12.18 以上生成回归分析报告表,这与我国教材所讲的步骤一致。一般教科书上讨论的非线性拟合与非线性回归,都是经过变换能线性化的。在Mathematica的Statistics程序包子集中,有直接解决非线性问题的程序文件NonlinearFit.m,其中含有实现多元非线性拟合与非线性回归的专用函数:NonlinearFit与NonlinearRegress。函数的参数与用法与线性的情况有许多是相似的。习题13.61 某厂生产的某种型号的细轴中任取20个,测得其直径数据如下(单位:mm):13.26,13.63,13.13,13.47,13.40,13.56,13.35,13.56,13.38,13.20,13.48,13.58,13.57,13.37,13.48,13.46,13.51,13.29,13.42,13.69 求以上数据的样本均值与样本方差。2 设X N(1.0,0.62),求:P(X > 1.96)与P(0.2 < X < 1.8)。3 从自动车床加工的同类零件中抽取16件,测得长度值为(单位:cm):12.15,12.12,12.01,12.28,12.09,12.16,12.03,12.01,12.06,12.13,12.07,12.11,12.08,12.01,12.03,12.06 设零件长度服从正态分布,求方差的置信区间(取置信水平为0.05)。4 有一大批袋装化肥,现从中随机地取出16袋,称得重量(kg)如下:50.6,50.8,49.9,50.3,50.4,51.0,49.7,51.2,51.4,50.5,49.3,49.6,50.6,50.2,50.9,49.6 设袋装化肥的重量近似地服从正态分布,试求总体均值的置信区间与总体方差2的置信区间(置信度分别为0.95与0.90)。5 对某矿体的8个采样进行测定,得到该矿体含铜量x(%)与含银量Y(%)的数据如下,试建立回归直线方程。x3734414341344045Y1.92.41012103.61013第 99 页

    注意事项

    本文(概率统计实验.docx)为本站会员(叶***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开