概率论与数理统计数理统计方法.ppt
《概率论与数理统计数理统计方法.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计数理统计方法.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率论与数理统计课件数理统计方法现在学习的是第1页,共55页2.1 2.1 数理统计的基本概念数理统计的基本概念 我们把研究对象的全体称为我们把研究对象的全体称为总体总体,而把组成而把组成总体的每个基本单元称为总体的每个基本单元称为个体个体.从总体从总体X中随中随机抽取机抽取n个个体个个体(X1,X2,Xn)称为总体称为总体X中一中一个个样本样本,n 称为称为样本容量样本容量.由于样本是随机抽样的由于样本是随机抽样的,可以认为来自总体可以认为来自总体X中一个样本中一个样本(X1,X2,Xn)是一组相互独立且与是一组相互独立且与总体总体X同分布的随机变量同分布的随机变量.样本的观测值记为样本的观
2、测值记为(x1,x2,xn),样本样本(X1,X2,Xn)的不含任何未知参数的函数的不含任何未知参数的函数 f(X1,X2,Xn)称为称为统计量统计量.现在学习的是第2页,共55页常用统计量常用统计量样本均值样本均值样本方差样本方差样本标准差样本标准差现在学习的是第3页,共55页 根据样本的观测值根据样本的观测值(x1,x2,xn),可可以绘出样本频率直方图和累积频率直方图以绘出样本频率直方图和累积频率直方图(具具体方法见体方法见P10-11).P10-11).根据样本频率直方图和累积频率直方图可根据样本频率直方图和累积频率直方图可以近似描绘出总体的分布密度函数曲线和分布以近似描绘出总体的分布
3、密度函数曲线和分布函数曲线函数曲线.记住:最终还是要找出总体的分布规律!记住:最终还是要找出总体的分布规律!现在学习的是第4页,共55页2.2 2.2 参数估计参数估计 根据实际数据找出其规律根据实际数据找出其规律,它一般是含有未它一般是含有未知参数的数学关系式知参数的数学关系式.参数估计就是要根据实际数据给出数学关参数估计就是要根据实际数据给出数学关系式中未知参数的估计值系式中未知参数的估计值.参数估计的方法比较多参数估计的方法比较多.一般情况下一般情况下,参数参数估计问题可归结为求一个函数的极值点问题估计问题可归结为求一个函数的极值点问题.下面主要介绍最小二乘法和极大似然法下面主要介绍最小
4、二乘法和极大似然法.现在学习的是第5页,共55页最小二乘法最小二乘法 设设 y=f(x;),其中其中x是自变量是自变量(或向量或向量),),是未知参数是未知参数(或未知向量或未知向量),),y 是是 x的函数的函数.x 和和 y 都是可观测的都是可观测的.(x1,y1),(x2,y2),(xn,yn)是是n组观测值组观测值.最小二乘法的基本思想就是求最小二乘法的基本思想就是求 的一个的一个估计值估计值,使函数取使函数取最小值最小值.现在学习的是第6页,共55页 例如,例如,2003年年全国大学生数学建模竞赛全国大学生数学建模竞赛A题:题:SARS的传播的传播(http:/)假如你已经得到已确诊
5、假如你已经得到已确诊SARS病例累计数病例累计数x(t)与时间与时间t的关系符合的关系符合Logistic传播规律:传播规律:应用最小二乘法,可求出其中的未知参应用最小二乘法,可求出其中的未知参数数K、x0 0、r(可利用可利用MATLAB软件中的软件中的fmins函数函数).).现在学习的是第7页,共55页极大似然法极大似然法 设总设总体体 的概率分布的概率分布为为 p(x;),其中,其中 是未是未知参数知参数.x1,x2,xn是总体的样本观测值是总体的样本观测值.称称L()为似然函数为似然函数.令令 极大似然法的基本思想是:在极大似然法的基本思想是:在 的取值范的取值范围内围内,挑选使似然
6、函数挑选使似然函数L()取得最大值的取得最大值的 估计估计值值.一般只需求一般只需求ln L()的最大值点即可:的最大值点即可:max ln L().现在学习的是第8页,共55页 例如,例如,1999年年全国大学生数学建模竞赛全国大学生数学建模竞赛A题:自动化车床管理题:自动化车床管理(P49).100次刀具故障记录次刀具故障记录(完成的零件数完成的零件数)服服从正态分布从正态分布(在假设检验中,我们将会验证这在假设检验中,我们将会验证这一点一点):似然函数为似然函数为可以验证未知参数可以验证未知参数、分别是样本均值与标准差分别是样本均值与标准差现在学习的是第9页,共55页2.3 2.3 假设
7、检验假设检验 假设总体期望值为假设总体期望值为 0,假设总体方差不假设总体方差不大于大于 02,假设总体服从某种分布,假设总体服从某种分布,上述种种上述种种假设是否成立呢?假设是否成立呢?还有某种品种是否比其它品种更优?某种还有某种品种是否比其它品种更优?某种药品是否比其它药品更有效?等等这些问题需药品是否比其它药品更有效?等等这些问题需通过概率计算通过概率计算,采用假设检验的方法采用假设检验的方法,才能才能做出正确的推断做出正确的推断.假设检验的主要内容有:一个正态总体假设检验的主要内容有:一个正态总体的假设检验、两个正态总体的假设检验以及的假设检验、两个正态总体的假设检验以及分布律的假设检
8、验分布律的假设检验.现在学习的是第10页,共55页假设检验的基本方法假设检验的基本方法 提出待检验的假设提出待检验的假设H0 它可能有以下几个来源:它可能有以下几个来源:依据以往的经验依据以往的经验或某些实验的结果;或某些实验的结果;依据某种理论或某种模型;依据某种理论或某种模型;根据事先所做的某种规定根据事先所做的某种规定.选择检验假设选择检验假设H0 的统计量,并确定其分布,的统计量,并确定其分布,再根据样本观测值计算出该统计量的值再根据样本观测值计算出该统计量的值.确定拒绝域并作出判断确定拒绝域并作出判断 在给定的检验水平在给定的检验水平(或显著性水平或显著性水平)(0(0 1)1)下,
9、查所选统计量服从的分布表,求出临界值,然后下,查所选统计量服从的分布表,求出临界值,然后根据小概率事件在一次观测中不可能发生的原理确定检根据小概率事件在一次观测中不可能发生的原理确定检验假设验假设H0的拒绝域并做出判断的拒绝域并做出判断.现在学习的是第11页,共55页一个正态总体的假设检验有以下两种:一个正态总体的假设检验有以下两种:未知未知方差方差 2,检验假设检验假设H0:=0(0为已知,为已知,步骤步骤见见P15-16)P15-16)提出待检假设提出待检假设H0:=0.选取样本选取样本(X1,X2,Xn)的统计量:的统计量:再根据样本观测值计算出统计量再根据样本观测值计算出统计量T 的值
10、的值.查表得临界值:查表得临界值:t =t (n-1).然后根据然后根据P|T|t =下结论:若下结论:若|T|t ,则则否定否定H0;否则;否则,一般情况下接受一般情况下接受H0.现在学习的是第12页,共55页 未知未知期望期望,检验假设检验假设H0:2 02(02已知,步骤已知,步骤见见P16)P16)提出待检假设提出待检假设H0:2 02.选取样本选取样本(X1,X2,Xn)的统计量:的统计量:再根据样本观测值计算出统计量再根据样本观测值计算出统计量 2 的值的值.查表得临界值:查表得临界值:2=2(n-1).然后根据然后根据P|2|2 =下结论:下结论:若若|2|2,则否定则否定H0;
11、否则;否则,一般情况下接一般情况下接受受H0.现在学习的是第13页,共55页 例如,假设你要例如,假设你要检查食盐检查食盐包装机工作是否包装机工作是否正常?正常?(见见P16)P16)首先首先,你要建立假设检验你要建立假设检验H0:=0(0=500),检验包装机有没有产生系统误差;,检验包装机有没有产生系统误差;再建立假设检验再建立假设检验H1:2 02(02=102),检,检验包装机工作是否稳定验包装机工作是否稳定.现在学习的是第14页,共55页两个正态总体的假设检验有以下三种:两个正态总体的假设检验有以下三种:未知期望未知期望 1,2,检验假设检验假设H0:12=22.建立待检假设建立待检
12、假设H0:12=22.(步骤见步骤见P17)P17)选取样本选取样本(X1,X2,Xm),(Y1,Y2,Yn)的统计量的统计量(不妨设不妨设S12S22):再根据样本观测值计算出统计量再根据样本观测值计算出统计量F 的值的值.查表得临界值:查表得临界值:F/2=F/2(m-1,n-1).然后根据然后根据P FF/2 =/2 下结论:若下结论:若FF/2,则否定则否定H0;否则;否则,一般情况下接受一般情况下接受H0.现在学习的是第15页,共55页 未知未知期望期望 1,2,检验假设检验假设H0:12 22 建立待检假设建立待检假设H0:12 22.(步骤见步骤见P17)P17)选取样本选取样本
13、(X1,X2,Xm),(Y1,Y2,Yn)的统计量:的统计量:再根据样本观测值计算出统计量再根据样本观测值计算出统计量F 的值的值.查表得临界值:查表得临界值:F =F(m-1,n-1).然后根据然后根据P FF =下结论:若下结论:若FF ,则否则否定定H0;否则;否则,一般情况下接受一般情况下接受H0.现在学习的是第16页,共55页 未知未知方差方差 12,22,但但 12=22,检验假设,检验假设H0:1=2(步骤见步骤见P17)P17)建立建立待检假设待检假设H0:1=2.选取统计量:选取统计量:其中其中 特别地特别地,当当m=n时时,查表得临界值:查表得临界值:t =t (m+n 2
14、).然后根据然后根据P|T|t =下结论:若下结论:若|T|t ,则则否定否定H0;否则;否则,一般情况下接受一般情况下接受H0.现在学习的是第17页,共55页 例如,要例如,要检查某种新药检查某种新药是否有效?是否有效?首先首先,将病人分为两类将病人分为两类,一类用该药一类用该药,另一类不用另一类不用.然后建立假设检验然后建立假设检验H0:12=22,检验两类病人指标方检验两类病人指标方差是否相等?差是否相等?当方差相等时当方差相等时,再建立假设检验再建立假设检验H1:1=2,检验检验两类病人指标均值是否相等?两类病人指标均值是否相等?又如,你要又如,你要检查两台食盐检查两台食盐包装机中哪一
15、台包装机包装机中哪一台包装机更好?更好?首先首先,你要分别建立假设检验你要分别建立假设检验H1:1=0与与H2:1=0(0=500),),检验每台包装机有没有产生系统误检验每台包装机有没有产生系统误差?差?再建立假设检验再建立假设检验H3:12 22,检验哪一台包装机更检验哪一台包装机更好?好?现在学习的是第18页,共55页 分布律的假设检验按分布律的假设检验按皮尔逊皮尔逊(K.Pearson)平平方和准则方和准则(步骤见步骤见P18-19)P18-19)例如,例如,1999年年全国大学生数学建模竞赛全国大学生数学建模竞赛A题:自动化车床管理题:自动化车床管理(P49).检验检验100次刀具故
16、次刀具故障记录障记录(完成的零件数完成的零件数)是否服从正态分布是否服从正态分布N(600,38663.02=196.632).100100-200200-300300-400400-500500-600频数频数mi12461522概率概率pi0.0044 0.0155 0.0426 0.0910 0.1509 0.1945 600-700700-800800-900900-10001000-11001100频数频数mi22148411概率概率pi0.1945 0.1510 0.0910 0.0426 0.0155 0.0044现在学习的是第19页,共55页首先做首先做假设假设H0:F(x)=
17、F0(x),其中,其中 其次选取统计量:其次选取统计量:查表得临界值查表得临界值(12-1-2)=3.33.因为因为3.333.75,故否定故否定H0,所以在显著性所以在显著性水平水平0.05下认为?下认为?现在学习的是第20页,共55页 因为因为 (12-1-2)=3.333.75,故否定故否定H0.所以在显著性水平所以在显著性水平0.05下认为下认为 100次刀具次刀具故障记录故障记录(完成的零件数完成的零件数)不服从正态分布不服从正态分布N(600,196.632).但是但是(12-1-2)=4.17.因为因为3.754.17,故接受故接受H0.所以在显著性所以在显著性水平水平0.1下认
18、为下认为 100次刀具故障记录次刀具故障记录服从正态分布服从正态分布N(600,196.632).即有即有90%90%的可能性认为的可能性认为 100次刀具故障记录服从次刀具故障记录服从正态分布正态分布N(600,196.632).现在学习的是第21页,共55页2.4 2.4 方差分析方差分析 用不同的生产方法生产同一种产品用不同的生产方法生产同一种产品,比比较各种生产方法对产品的影响是人们经常遇较各种生产方法对产品的影响是人们经常遇到的问题到的问题.为此为此,需要找出对产品有显著影响的因素需要找出对产品有显著影响的因素.方差分析就是鉴别各因素效应的一种有效方差分析就是鉴别各因素效应的一种有效
19、的统计方法的统计方法.方差分析包括单因素方差分析和双因素方方差分析包括单因素方差分析和双因素方差分析差分析.现在学习的是第22页,共55页单因素方差分析单因素方差分析 如果在试验中只有一个因素在变化如果在试验中只有一个因素在变化,其其它可控制的条件不变它可控制的条件不变,称它为称它为单因素试验单因素试验;若;若试验中变化的因素多于一个试验中变化的因素多于一个,则称为则称为双因素以双因素以及多因素试验及多因素试验.单因素试验中单因素试验中,若只有两个水平若只有两个水平,就是以就是以前讲过的两个总体的比较问题前讲过的两个总体的比较问题.超过两个水超过两个水平的时候平的时候,也就是需要好多个总体进行
20、比较也就是需要好多个总体进行比较,这时这时,方差分析是一种有效的方法方差分析是一种有效的方法.单因素方差分析的假设前提、解题方法与单因素方差分析的假设前提、解题方法与步骤见步骤见P20-21 现在学习的是第23页,共55页 例例 为了考察为了考察6种不同的农药的杀虫率有无显著差种不同的农药的杀虫率有无显著差异异,做了做了18次试验次试验,得数据如下:得数据如下:农药农药 杀杀 虫虫 率率(%)(%)行平均值行平均值 1 87.4 85.0 80.2 84.201 87.4 85.0 80.2 84.20 2 90.5 88.5 87.3 94.7 90.26 2 90.5 88.5 87.3
21、94.7 90.26 3 56.2 62.4 59.30 3 56.2 62.4 59.30 4 55.0 48.2 51.60 4 55.0 48.2 51.60 5 92.0 99.2 95.3 91.5 94.50 5 92.0 99.2 95.3 91.5 94.50 6 76.2 72.3 81.3 76.27 6 76.2 72.3 81.3 76.27 要考察这要考察这6 6种不同的农药的杀虫率有无显著差异,需要建立种不同的农药的杀虫率有无显著差异,需要建立假设检验:假设检验:H0:1=2=6=.进一步进一步,自然希望找出最优的农药自然希望找出最优的农药,以便提高杀虫率以便提高杀
22、虫率.因因此要检验假设:此要检验假设:H1:2=5.现在学习的是第24页,共55页双因素方差分析双因素方差分析 进行双因素方差分析的目的进行双因素方差分析的目的,是要检验两是要检验两个因素对试验结果有无影响个因素对试验结果有无影响.在试验中在试验中,对每一因素的每一水平都可取一对每一因素的每一水平都可取一个容量为个容量为nij的样本的样本.按按nij=1(无重复试验无重复试验,不考虑两因素间的不考虑两因素间的交互作用交互作用)和和nij2(不等重复试验不等重复试验,考虑两因考虑两因素间的交互作用素间的交互作用)分为两种情形:无重复试验的分为两种情形:无重复试验的双因素方差分析和重复试验的双因素
23、方差分析双因素方差分析和重复试验的双因素方差分析.现在学习的是第25页,共55页 在重复试验的双因素方差分析中,就在重复试验的双因素方差分析中,就是要考察两个因素是要考察两个因素 A,B之间是否存在交互之间是否存在交互作用的影响作用的影响,需要对两个因素各种水平的需要对两个因素各种水平的组合组合(Ai,Bj)进行重复试验进行重复试验,假设每一个组假设每一个组合都重复试验合都重复试验 m(m1)次次(若是不等重复若是不等重复试验试验,残缺数据可按均值补齐以便于计算残缺数据可按均值补齐以便于计算).).无重复试验的双因素方差分析和重无重复试验的双因素方差分析和重复试验的双因素方差分析解题方法与步复
24、试验的双因素方差分析解题方法与步骤见骤见P22-24 P22-24 现在学习的是第26页,共55页 例例 设设4 4个工人操作个工人操作3 3台机器各一天台机器各一天,日产量日产量数据如下:数据如下:工人工人机器机器B1 B2B3B4行平均值行平均值 A15047475349.25A25354575855.5A35242414845.75列平均值列平均值 51.6747.6748.335350.17问是否真正存在机器或工人之间的差别?问是否真正存在机器或工人之间的差别?现在学习的是第27页,共55页2.5 2.5 回归分析回归分析 回归分析是考察两个变量之间统计联系的回归分析是考察两个变量之间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 方法
限制150内