概率论与数理统计 课件 数理统计方法.ppt
《概率论与数理统计 课件 数理统计方法.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计 课件 数理统计方法.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2数理统计方法数理统计方法 2.1 2.1 数理统计的基本概念数理统计的基本概念 2.2 2.2 参数估计参数估计 2.3 2.3 假设检验假设检验 2.4 2.4 方差分析方差分析 2.5 2.5 回归分析回归分析 2.6 2.6 判别分析判别分析 2.7 2.7 建模实例建模实例 数理统计的任务是以数理统计的任务是以概率论为基础概率论为基础,根据试验根据试验的数据的数据,对研究对象的客对研究对象的客观规律性作出合理的估计观规律性作出合理的估计与推断与推断.近几年来的全国大学近几年来的全国大学生数学建模竞赛中,几乎生数学建模竞赛中,几乎每次都有一道题要用到此每次都有一道题要用到此方法方法.2
2、.1 2.1 数理统计的基本概念数理统计的基本概念 我们把研究对象的全体称为我们把研究对象的全体称为总体总体,而把而把组成总体的每个基本单元称为组成总体的每个基本单元称为个体个体.从总体从总体X中随机抽取中随机抽取n个个体个个体(X1,X2,Xn)称为称为总体总体X中一个中一个样本样本,n 称为称为样本容量样本容量.由于样本是随机抽样的由于样本是随机抽样的,可以认为来自可以认为来自总体总体X中一个样本中一个样本(X1,X2,Xn)是一组是一组相互独立且与总体相互独立且与总体X同分布的随机变量同分布的随机变量.样本的观测值记为样本的观测值记为(x1,x2,xn),样样本本(X1,X2,Xn)的不
3、含任何未知参数的的不含任何未知参数的函数函数 f(X1,X2,Xn)称为称为统计量统计量.常用统计量常用统计量样本均值样本均值样本方差样本方差样本标准差样本标准差 根据样本的观测值根据样本的观测值(x1,x2,xn),可以绘出样本频率直方图和累积频率直可以绘出样本频率直方图和累积频率直方图方图(具体方法见具体方法见P10-11).P10-11).根据样本频率直方图和累积频率直方根据样本频率直方图和累积频率直方图可以近似描绘出总体的分布密度函数曲图可以近似描绘出总体的分布密度函数曲线和分布函数曲线线和分布函数曲线.记住:最终还是要找出总体的分布规律!记住:最终还是要找出总体的分布规律!2.2 2
4、.2 参数估计参数估计 根据实际数据找出其规律根据实际数据找出其规律,它一般是含它一般是含有未知参数的数学关系式有未知参数的数学关系式.参数估计就是要根据实际数据给出数学参数估计就是要根据实际数据给出数学关系式中未知参数的估计值关系式中未知参数的估计值.参数估计的方法比较多参数估计的方法比较多.一般情况下一般情况下,参参数估计问题可归结为求一个函数的极值点问数估计问题可归结为求一个函数的极值点问题题.下面主要介绍最小二乘法和极大似然法下面主要介绍最小二乘法和极大似然法.最小二乘法最小二乘法 设设 y=f(x;),其中其中x是自变量是自变量(或向量或向量),),是未知参数是未知参数(或未知向量或
5、未知向量),),y 是是 x的函数的函数.x 和和 y 都是可观测的都是可观测的.(x1,y1),(x2,y2),(xn,yn)是是n组组观测值观测值.最小二乘法的基本思想就是求最小二乘法的基本思想就是求 的一个的一个估计值估计值,使函数取使函数取最小值最小值.例如,例如,2003年年全国大学生数学建模竞全国大学生数学建模竞赛赛A题:题:SARS的的传播传播(http:/)假如你已经得到已确诊假如你已经得到已确诊SARS病例累计病例累计数数x(t)与时间与时间t的关系符合的关系符合Logistic传播规律:传播规律:应用最小二乘法,可求出其中的未知应用最小二乘法,可求出其中的未知参数参数K、x
6、0 0、r(可利用可利用MATLAB软件中的软件中的fmins函数函数).).极大似然法极大似然法 设总设总体体 的概率分布的概率分布为为 p(x;),其中其中 是是未知参数未知参数.x1,x2,xn是总体的样本观测值是总体的样本观测值.称称L()为似然函数为似然函数.令令 极大似然法的基本思想是:在极大似然法的基本思想是:在 的取值的取值范围内范围内,挑选使似然函数挑选使似然函数L()取得最大值取得最大值的的 估计值估计值.一般只需求一般只需求ln L()的最大值点即可:的最大值点即可:max ln L().例如,例如,1999年年全国大学生数学建模竞全国大学生数学建模竞赛赛A题:自动化车床
7、管理题:自动化车床管理(P49).100次刀具故障记录次刀具故障记录(完成的零件数完成的零件数)服服从正态分布从正态分布(在假设检验中,我们将会验证在假设检验中,我们将会验证这一点这一点):似然函数为似然函数为可以验证未知参数可以验证未知参数、分别是样本均值与标准差分别是样本均值与标准差2.3 2.3 假设检验假设检验 假设总体期望值为假设总体期望值为 0,假设总体方差假设总体方差不大于不大于 02,假设总体服从某种分布,假设总体服从某种分布,上述上述种种假设是否成立呢?种种假设是否成立呢?还有某种品种是否比其它品种更优?还有某种品种是否比其它品种更优?某种药品是否比其它药品更有效?等等这某种
8、药品是否比其它药品更有效?等等这些问题需通过概率计算些问题需通过概率计算,采用假设检验的采用假设检验的方法方法,才能做出正确的推断才能做出正确的推断.假设检验的主要内容有:一个正态总假设检验的主要内容有:一个正态总体的假设检验、两个正态总体的假设检验体的假设检验、两个正态总体的假设检验以及分布律的假设检验以及分布律的假设检验.假设检验的基本方法假设检验的基本方法 提出待检验的假设提出待检验的假设H0 它可能有以下几个来源:它可能有以下几个来源:依据以往的经验依据以往的经验或某些实验的结果;或某些实验的结果;依据某种理论或某种模依据某种理论或某种模型;型;根据事先所做的某种规定根据事先所做的某种
9、规定.选择检验假设选择检验假设H0 的统计量,并确定其分的统计量,并确定其分布,再根据样本观测值计算出该统计量的值布,再根据样本观测值计算出该统计量的值.确定拒绝域并作出判断确定拒绝域并作出判断 在给定的检验水平在给定的检验水平(或显著性水平或显著性水平)(0(0 1)1)下,查所选统计量服从的分布表,求出临界下,查所选统计量服从的分布表,求出临界值,然后根据小概率事件在一次观测中不可能发值,然后根据小概率事件在一次观测中不可能发生的原理确定检验假设生的原理确定检验假设H0的拒绝域并做出判断的拒绝域并做出判断.一个正态总体的假设检验有以下两种:一个正态总体的假设检验有以下两种:未知未知方差方差
10、 2,检验假设检验假设H0:=0(0为为已知,步骤已知,步骤见见P15-16)P15-16)提出待检假设提出待检假设H0:=0.选取样本选取样本(X1,X2,Xn)的统计量:的统计量:再根据样本观测值计算出统计量再根据样本观测值计算出统计量T 的值的值.查表得临界值:查表得临界值:t =t (n-1).然后根据然后根据P|T|t =下结论:若下结论:若|T|t ,则否定则否定H0;否则否则,一般情况下接受一般情况下接受H0.未知未知期望期望,检验假设检验假设H0:2 02(02已知,步骤已知,步骤见见P16)P16)提出待检假设提出待检假设H0:2 02.选取样本选取样本(X1,X2,Xn)的
11、统计量:的统计量:再根据样本观测值计算出统计量再根据样本观测值计算出统计量 2 的值的值.查表得临界值:查表得临界值:2=2(n-1).然后根据然后根据P|2|2 =下结论:下结论:若若|2|2,则否定则否定H0;否则否则,一般情况一般情况下接受下接受H0.例如,假设你要例如,假设你要检查食盐检查食盐包装机工作是包装机工作是否正常?否正常?(见见P16)P16)首先首先,你要建立你要建立假设检验假设检验H0:=0(0=500),检验检验包装机有没有产生系统误差;包装机有没有产生系统误差;再建立再建立假设检验假设检验H1:2 02(02=102),检验检验包装机工作是否稳定包装机工作是否稳定.两
12、个正态总体的假设检验有以下三种:两个正态总体的假设检验有以下三种:未知期望未知期望 1,2,检验假设检验假设H0:12=22.建立待检假设建立待检假设H0:12=22.(步骤见步骤见P17)P17)选取样本选取样本(X1,X2,Xm),(Y1,Y2,Yn)的统计量的统计量(不妨设不妨设S12S22):再根据样本观测值计算出统计量再根据样本观测值计算出统计量F 的值的值.查表得临界值:查表得临界值:F/2=F/2(m-1,n-1).然后根据然后根据P FF/2 =/2 下结论:若下结论:若FF/2,则否定则否定H0;否则否则,一般情况下接受一般情况下接受H0.未知未知期望期望 1,2,检验假设检
13、验假设H0:12 22 建立待检假设建立待检假设H0:12 22.(步骤见步骤见P17)P17)选取样本选取样本(X1,X2,Xm),(Y1,Y2,Yn)的统计量:的统计量:再根据样本观测值计算出统计量再根据样本观测值计算出统计量F 的值的值.查表得临界值:查表得临界值:F =F(m-1,n-1).然后根据然后根据P FF =下结论:若下结论:若FF ,则否定则否定H0;否则否则,一般情况下接受一般情况下接受H0.未知未知方差方差 12,22,但但 12=22,检验假设,检验假设H0:1=2(步骤见步骤见P17)P17)建立建立待检假设待检假设H0:1=2.选取统计量:选取统计量:其中其中 特
14、别地特别地,当当m=n时时,查表得临界值:查表得临界值:t =t (m+n 2).然后根据然后根据P|T|t =下结论:若下结论:若|T|t ,则否定则否定H0;否则否则,一般情况下接受一般情况下接受H0.例如,要例如,要检查某种新药检查某种新药是否有效?是否有效?首先首先,将病人分为两类将病人分为两类,一类用该药一类用该药,另一类另一类不用不用.然后建立然后建立假设检验假设检验H0:12=22,检验检验两类两类病人指标方差是否相等?病人指标方差是否相等?当方差相等时当方差相等时,再建立再建立假设检验假设检验H1:1=2,检验检验两类病人指标均值是否相等?两类病人指标均值是否相等?又如,你要又
15、如,你要检查两台食盐检查两台食盐包装机中哪一台包包装机中哪一台包装机更好?装机更好?首先首先,你要分别建立你要分别建立假设检验假设检验H1:1=0与与H2:1=0(0=500),),检验每台检验每台包装机有没有产包装机有没有产生系统误差?生系统误差?再建立再建立假设检验假设检验H3:12 22,检验检验哪一台包哪一台包装机更好?装机更好?分布律的假设检验按分布律的假设检验按皮尔逊皮尔逊(K.Pearson)平方和准则平方和准则(步骤见步骤见P18-19)P18-19)例如,例如,1999年年全国大学生数学建模竞全国大学生数学建模竞赛赛A题:自动化车床管理题:自动化车床管理(P49).检验检验1
16、00次刀具故障记录次刀具故障记录(完成的零件数完成的零件数)是否服从是否服从正态分布正态分布N(600,38663.02=196.632).100100-200200-300300-400400-500500-600频频数数mi12461522概率概率pi0.00440.01550.04260.09100.15090.1945 600-700700-800800-900900-10001000-11001100频频数数mi22148411概率概率pi0.19450.15100.09100.04260.01550.0044首先做首先做假设假设H0:F(x)=F0(x),其中其中 其次选取统计量:
17、其次选取统计量:查表得临界值查表得临界值(12-1-2)=3.33.因为因为3.333.75,故否定故否定H0,所以在显著所以在显著性水平性水平0.05下认为?下认为?因为因为 (12-1-2)=3.333.75,故故否定否定H0.所以在显著性水平所以在显著性水平0.05下认为下认为 100次刀次刀具故障记录具故障记录(完成的零件数完成的零件数)不服从正态分布不服从正态分布N(600,196.632).但是但是(12-1-2)=4.17.因为因为3.754.17,故接受故接受H0.所以在显著性所以在显著性水平水平0.1下认为下认为 100次刀具故障次刀具故障记录服从正态分布记录服从正态分布N(
18、600,196.632).即有即有90%90%的可能性认为的可能性认为 100次刀具故障记录服次刀具故障记录服从正态分布从正态分布N(600,196.632).2.4 2.4 方差分析方差分析 用不同的生产方法生产同一种产品用不同的生产方法生产同一种产品,比较各种生产方法对产品的影响是人们经比较各种生产方法对产品的影响是人们经常遇到的问题常遇到的问题.为此为此,需要找出对产品有显著影响的需要找出对产品有显著影响的因素因素.方差分析就是鉴别各因素效应的一种方差分析就是鉴别各因素效应的一种有效的统计方法有效的统计方法.方差分析包括单因素方差分析和双因方差分析包括单因素方差分析和双因素方差分析素方差
19、分析.单因素方差分析单因素方差分析 如果在试验中只有一个因素在变化如果在试验中只有一个因素在变化,其其它可控制的条件不变它可控制的条件不变,称它为称它为单因素试验单因素试验;若试验中变化的因素多于一个若试验中变化的因素多于一个,则称为则称为双因双因素以及多因素试验素以及多因素试验.单因素试验中单因素试验中,若只有两个水平若只有两个水平,就是就是以前讲过的两个总体的比较问题以前讲过的两个总体的比较问题.超过两个超过两个水平的时候水平的时候,也就是需要好多个总体进行比也就是需要好多个总体进行比较较,这时这时,方差分析是一种有效的方法方差分析是一种有效的方法.单因素方差分析的假设前提、解题方法单因素
20、方差分析的假设前提、解题方法与步骤见与步骤见P20-21 例例 为了考察为了考察6种不同的农药的杀虫率有无显种不同的农药的杀虫率有无显著差异著差异,做了做了18次试验次试验,得数据如下:得数据如下:农药农药 杀杀 虫虫 率率(%)(%)行平均值行平均值 1 87.4 85.0 80.2 84.201 87.4 85.0 80.2 84.20 2 90.5 88.5 87.3 94.7 90.26 2 90.5 88.5 87.3 94.7 90.26 3 56.2 62.4 59.30 3 56.2 62.4 59.30 4 55.0 48.2 51.60 4 55.0 48.2 51.60
21、5 92.0 99.2 95.3 91.5 94.50 5 92.0 99.2 95.3 91.5 94.50 6 76.2 72.3 81.3 76.27 6 76.2 72.3 81.3 76.27 要考察这要考察这6 6种不同的农药的杀虫率有无显著差异,需种不同的农药的杀虫率有无显著差异,需要建立假设检验:要建立假设检验:H0:1=2=6=.进一步进一步,自然希望找出最优的农药自然希望找出最优的农药,以便提高杀虫率以便提高杀虫率.因此要检验假设:因此要检验假设:H1:2=5.双因素方差分析双因素方差分析 进行双因素方差分析的目的进行双因素方差分析的目的,是要检验是要检验两个因素对试验结果
22、有无影响两个因素对试验结果有无影响.在试验中在试验中,对每一因素的每一水平都可对每一因素的每一水平都可取一个容量为取一个容量为nij的样本的样本.按按nij=1(无重复试验无重复试验,不考虑两因素间不考虑两因素间的交互作用的交互作用)和和nij2(不等重复试验不等重复试验,考虑考虑两因素间的交互作用两因素间的交互作用)分为两种情形:无重分为两种情形:无重复试验的双因素方差分析和重复试验的双因复试验的双因素方差分析和重复试验的双因素方差分析素方差分析.在重复试验的双因素方差分析中,在重复试验的双因素方差分析中,就是要考察两个因素就是要考察两个因素 A,B之间是否存在之间是否存在交互作用的影响交互
23、作用的影响,需要对两个因素各种需要对两个因素各种水平的组合水平的组合(Ai,Bj)进行重复试验进行重复试验,假假设每一个组合都重复试验设每一个组合都重复试验 m(m1)次次(若是不等重复试验若是不等重复试验,残缺数据可按均值残缺数据可按均值补齐以便于计算补齐以便于计算).).无重复试验的双因素方差分析和重无重复试验的双因素方差分析和重复试验的双因素方差分析解题方法与步复试验的双因素方差分析解题方法与步骤见骤见P22-24 P22-24 例例 设设4 4个工人操作个工人操作3 3台机器各一天台机器各一天,日产日产量数据如下:量数据如下:工人工人机器机器B1 B2B3B4行平均值行平均值 A150
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论与数理统计 课件 数理统计方法 概率论 数理统计 方法
限制150内