参数估计与假设检验.pptx
一、概率论基础知识上页下页结束首页随机变量随机变量 随机试验的结果可以是数量性的,也可以是随机试验的结果可以是数量性的,也可以是非数量性的,都可以把结果数量化。非数量性的,都可以把结果数量化。把随机事件的结果用实数把随机事件的结果用实数X(w w)与之对应与之对应,且且对于任意实数对于任意实数x,事件,事件 w|X(w w)x 都有确定都有确定的概率,则称的概率,则称X(w w)为为随机变量随机变量,简记为,简记为X。第1页/共65页分布函数分布函数设设X是一个随机变量,是一个随机变量,x是任意实数,称函数是任意实数,称函数 F(x)=P X x,为随机变量为随机变量X 的分布函数。的分布函数。上页下页结束首页第2页/共65页离散型随机变量离散型随机变量称称X 是离散型随机变量,并称是离散型随机变量,并称pi=PX=xi,i=1,2,为为X 的分布律。的分布律。如果随机变量如果随机变量X 只取有限个或可列无穷多个数值:只取有限个或可列无穷多个数值:x1,x2,对任一对任一xi,有,有PX=xi =pi,且满足且满足 (1)pi 0;(2)pi=1。i=1我们常用表格表示分布律。我们常用表格表示分布律。Xx1x2xiP X=xi p1p2pi上页下页结束首页第3页/共65页连续型随机变量连续型随机变量离散型随机变量只能取离散型随机变量只能取有限个有限个或或可列无穷多个可列无穷多个数值,数值,另一类随机变量的取值却另一类随机变量的取值却充满某个有限区间充满某个有限区间或或无穷区间无穷区间.称称 X为连续型随机变量,为连续型随机变量,f(x)为为 X 的的概率密度概率密度Oxf(x)x上页下页结束首页第4页/共65页几种连续型分布几种连续型分布均匀分布均匀分布设连续型随机变量设连续型随机变量X具有概率密度具有概率密度则称则称X在区间在区间a,b上服从上服从均匀分布均匀分布,记为记为 XUa,b.上页下页结束首页第5页/共65页均匀分布的密度函数均匀分布的密度函数f(x)的图形的图形af(x)bOx均匀分布常用来描述随机到达的时刻、误差均匀分布常用来描述随机到达的时刻、误差分布、随机抽取的结果等分布、随机抽取的结果等.上页下页结束首页第6页/共65页设连续型随机变量设连续型随机变量X的概率密度为的概率密度为则称则称X服从参数为服从参数为l l的的指数分布指数分布.XE(l l)指数分布指数分布 指数分布常用来描述处于稳定工作状态的元指数分布常用来描述处于稳定工作状态的元件寿命件寿命.上页下页结束首页第7页/共65页正态分布正态分布(GAUSS 分布分布)设随机变量设随机变量X 的概率密度函数为的概率密度函数为其中其中m m,s s (s s 0)0)是常数,是常数,Rx f(x)=,e(x m m)-2 s s2 2221p ps s则称随机变量则称随机变量X 服从参数为服从参数为m m,s s2 的的正态分布正态分布(或高斯分布或高斯分布),记为,记为X N(m m,s s2 )。特别地特别地,当当m m=0,=0,s s=1=1时时,其概率密度函数为其概率密度函数为Rx ,j j(x )=f(x;0,1)=e x-2 221p p则称随机变量则称随机变量X 服从服从标准正态分布标准正态分布,即即X N(0,1)上页下页结束首页第8页/共65页正态分布概率密度曲线的特征正态分布概率密度曲线的特征曲线关于直线曲线关于直线x=m m 对称对称,即对任意实数即对任意实数x 有有 f(m m-x)=f(m m+x)曲线下直线两侧的面积各为曲线下直线两侧的面积各为1/2,并且,并且 P m m x X m m =P m m X m m+x)上页下页结束首页第9页/共65页 曲线在曲线在x=m m 处取得最大值处取得最大值 ,固定固定m m,s s2 2 越大,曲线越趋于平坦。越大,曲线越趋于平坦。21p ps s上页下页结束首页第10页/共65页随机变量的数字特征随机变量的数字特征设设 X是离散型随机变量是离散型随机变量,其分布律为其分布律为离散型随机变量的离散型随机变量的数学期望数学期望连续型随机变量的连续型随机变量的数学期望数学期望设连续型随机变量设连续型随机变量X的概率密度为的概率密度为f(x),上页下页结束首页第11页/共65页方差方差定义定义:设设 X是随机变量是随机变量,若若E X E(X)2存在,称存在,称 D(X)=E X E(X)2 为为X的的方差方差。称称 为为X的的标准差标准差或或均方差。均方差。注注:1)D(X)是随机变量是随机变量X的的函数的数学期望函数的数学期望。2)D(X)0常用计算公式:D D(X X)E E(X X2 2)-)-E E(X X)2 2上页下页结束首页第12页/共65页()()m ms sm m=XE,NX则2()2s s=XD数学期望刻划了随机变量数学期望刻划了随机变量X的的平均值!平均值!方差刻划了随机变量方差刻划了随机变量X围绕它的数围绕它的数学期望的偏离程度!学期望的偏离程度!上页下页结束首页第13页/共65页矩矩设设X为随机变量,若为随机变量,若E(|X|k)+,则称则称g gk=E(Xk)k=1,2,3.为为X的的k阶原点矩阶原点矩.称称a ak=E(|X|k)k=1,2,3.为为X的的k阶绝对原点矩阶绝对原点矩.设设X为随机变量,若为随机变量,若E|X-E(X)|k +,则称则称m mk=EX-E(X)k k=1,2,3.为为X的的k阶中心矩阶中心矩.称称 b bk=E|X-E(X)|k k=1,2,3.为为X 的的k阶绝对中心矩阶绝对中心矩.上页下页结束首页第14页/共65页三个重要分布三个重要分布记为分布1、都服从正态分布N(0,1),则称随机变量:分布是由正态分布派生出来的一种分布.上页下页结束首页第15页/共65页上页下页结束首页第16页/共65页2、t 分布上页下页结束首页第17页/共65页上页下页结束首页第18页/共65页3、F分布上页下页结束首页第19页/共65页F分布的分位数上页下页结束首页第20页/共65页二、参数估计上页下页结束首页参数估计是对已知参数估计是对已知总体的分布类型总体的分布类型,利利用样本用样本对其未知参数作出估计。对其未知参数作出估计。参数估计可作如下划分:参数估计可作如下划分:参数估计点 估 计区间估计第21页/共65页点估计点估计样本的均值样本的均值估计估计总体的均值总体的均值。样本的方差样本的方差估计估计总体的方差总体的方差。称为q q的估计量,称为q q的估计值。设q q是总体X分布中的未知参数,是相应的样本,是相应的样本值,上页下页结束首页第22页/共65页估计量的优良性准则估计量的优良性准则1.无偏性无偏性2.有效性有效性3.相合性相合性则称 为 的相合估计量相合估计量。上页下页结束首页第23页/共65页三、假设检验上页下页结束首页例例1 1.独立投掷一枚均匀硬币独立投掷一枚均匀硬币100100次,观察到正面向上为次,观察到正面向上为6161次,问该硬币是否均匀?次,问该硬币是否均匀?例例2 2.某盒装饼干厂,其包装广告上称每盒质量为某盒装饼干厂,其包装广告上称每盒质量为269g269g,但有顾客投诉该饼干质量不,但有顾客投诉该饼干质量不足,为此质检部门从准备出厂的一批饼干中随机抽取足,为此质检部门从准备出厂的一批饼干中随机抽取3030盒,发现其平均质量为盒,发现其平均质量为268g268g,问该产品的广告是否为虚假广告?,问该产品的广告是否为虚假广告?1.1.问题的提出问题的提出第24页/共65页例例3 3.某厂生产的产品,长期以来不合格率不超过某厂生产的产品,长期以来不合格率不超过0.010.01,某天开工后,为检验生产,某天开工后,为检验生产过程是否正常,随机抽取过程是否正常,随机抽取100100件产品,发现其中有件产品,发现其中有3 3件不合格,能否认为这天的件不合格,能否认为这天的生产过程是正常的?生产过程是正常的?上页下页结束首页 以上三例的共同特点是:在收集数据之前都以上三例的共同特点是:在收集数据之前都有一个有关问题的假设,要通过已获得的有一个有关问题的假设,要通过已获得的样本回答这个假设是否成立。这类问题称样本回答这个假设是否成立。这类问题称为为统计假设检验统计假设检验。第25页/共65页(1)原假设和备选假设:)原假设和备选假设:通过检验想要证明总体中有某种特定的效应或通过检验想要证明总体中有某种特定的效应或变异发生。变异发生。原假设原假设,H0,总体没有发生变异,用总体分布,总体没有发生变异,用总体分布参数等于某个特定值表示;参数等于某个特定值表示;备选假设备选假设,H1,总体发生了变异,用总体分布,总体发生了变异,用总体分布参数不等于(大于,或小于)某个特定值表示。参数不等于(大于,或小于)某个特定值表示。例例1:H0:p=0.5,H1:p0.5.例例2:H0:m=270,H1:m0.01.上页下页结束首页2.2.假设检验步骤假设检验步骤第26页/共65页(2)构造检验统计量)构造检验统计量 该统计量能度量基于样本观察数该统计量能度量基于样本观察数与原假设之下的期望数之间的差异程与原假设之下的期望数之间的差异程度。度。上页下页结束首页第27页/共65页(3 3)否定论证与实际推断原理)否定论证与实际推断原理上页下页结束首页否定论证否定论证:先假设原假设:先假设原假设H H0 0成立,如果基于成立,如果基于样本,从观察的数据以及原假设推出矛盾的结样本,从观察的数据以及原假设推出矛盾的结果,则拒绝原假设;反之,如果没有矛盾的结果,则拒绝原假设;反之,如果没有矛盾的结果,则接受原假设。果,则接受原假设。实际推断原理实际推断原理:小概率事件在一次试验中几乎:小概率事件在一次试验中几乎不可能发生。如果发生了,与实际推断矛盾,不可能发生。如果发生了,与实际推断矛盾,则拒绝原假设;否则,接受原假设。则拒绝原假设;否则,接受原假设。第28页/共65页(4)p值法(伴随概率)值法(伴随概率)上页下页结束首页检验统计量取得观测值的概率,称为检验统计量取得观测值的概率,称为p值。值。如果如果p值很小,表示在原假设下,出现这个观值很小,表示在原假设下,出现这个观测值的可能性很小,即小概率事件发生了,与测值的可能性很小,即小概率事件发生了,与实际推断矛盾,则拒绝原假设;实际推断矛盾,则拒绝原假设;如果如果p值较大,表示出现这个观测值的可能性值较大,表示出现这个观测值的可能性较大,属正常现象,接受原假设。较大,属正常现象,接受原假设。通常通常p值不超过值不超过0.05,认为是很小的,称结果,认为是很小的,称结果是统计显著的,即有明显的区别于原假设的是统计显著的,即有明显的区别于原假设的特异情况发生。特异情况发生。第29页/共65页v双样本平均差的双样本平均差的Z检验检验w用于两样本总体近似服从正态分布,方用于两样本总体近似服从正态分布,方差已知,检验两均值差是否等于某一值差已知,检验两均值差是否等于某一值上页下页结束首页H0:m m1 1-m m2=d0,H1:m m1 1-m m2d0 第30页/共65页m=m0 x拒绝域拒绝域上页下页结束首页第31页/共65页例例1:某铁厂的铁水含碳量服从:某铁厂的铁水含碳量服从N(4.55,0.1082),现随机抽查),现随机抽查5炉铁水,测得含炉铁水,测得含碳量分别如下,设方差不变,能否认为铁水平均含碳量仍为碳量分别如下,设方差不变,能否认为铁水平均含碳量仍为4.55?(?(a a=0.05)EXCEL:“工具工具”-“数据分析数据分析”-“Z-检验:检验:双样本平均差检验双样本平均差检验”含碳量4.28 4.40 4.42 4.35 4.50 先补充一个容先补充一个容量相同的样本,量相同的样本,所有值设为所有值设为m m0(4.55)补充样本4.554.554.554.554.55上页下页结束首页第32页/共65页上页下页结束首页第33页/共65页上页下页结束首页第34页/共65页统计决策:P(Z=z)双尾 0.0009410.05拒绝原假设,即不认为铁水平均含碳量仍为4.55上页下页结束首页第35页/共65页上页下页结束首页vt-检验:平均值的成对二样本分析检验:平均值的成对二样本分析w检验两组数据均值是否相等检验两组数据均值是否相等H0:m m1 1=m m2,H1:m m1 1m m2第36页/共65页m=m0 x拒绝域拒绝域上页下页结束首页第37页/共65页例例2:一卷烟厂向化验室送检:一卷烟厂向化验室送检A,B两种烟草,化验尼古丁的含量是否相同,从两种烟草,化验尼古丁的含量是否相同,从A,B中各随机抽取质量相同的五例进行化验,测得尼古丁的含量如下,据经验知,中各随机抽取质量相同的五例进行化验,测得尼古丁的含量如下,据经验知,尼古丁含量服从正态分布,问两种烟草的尼古丁含量是否有差异?(尼古丁含量服从正态分布,问两种烟草的尼古丁含量是否有差异?(a a=0.05)AB24272727262325312426上页下页结束首页第38页/共65页EXCEL:“工具工具”-“数据分析数据分析”-“t-检验:检验:平均值的成对二样本分析平均值的成对二样本分析”上页下页结束首页第39页/共65页上页下页结束首页第40页/共65页统计决策:P(T0.05接受原假设,即认为新两种烟草的尼古丁含量无差异上页下页结束首页第41页/共65页上页下页结束首页vt-检验:双样本等方差检验检验:双样本等方差检验w两样本的总体方差相等,检验两样本两样本的总体方差相等,检验两样本的均值是否相等的均值是否相等H0:m m1 1=m m2,H1:m m1 1m m2第42页/共65页m=m0 x拒绝域拒绝域上页下页结束首页第43页/共65页例例3:某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽一个样本进行硬度测试,其结果如下。据经验知,金铸件,现从两种铸件中各抽一个样本进行硬度测试,其结果如下。据经验知,硬度服从正态分布,且两个硬度的方差相等均为硬度服从正态分布,且两个硬度的方差相等均为2 2,问镍合金铸件的硬度有无显,问镍合金铸件的硬度有无显著性提高?著性提高?(a a=0.05)镍合金铜合金72.0 69.8 69.5 70.0 74.0 72.0 70.5 68.5 71.8 73.0 70.0 上页下页结束首页第44页/共65页EXCEL:“工具工具”-“数据分析数据分析”-“t-检验:检验:双样本等方差检验双样本等方差检验”上页下页结束首页第45页/共65页上页下页结束首页第46页/共65页统计决策:P(T0.05接受原假设,即认为镍合金铸件的硬度比铜合金的硬度显著性提高1 1个单位上页下页结束首页第47页/共65页上页下页结束首页vt-检验:双样本异方差检验检验:双样本异方差检验w两样本的总体方差未知且不等,检验两样本的总体方差未知且不等,检验两样本的均值是否相等两样本的均值是否相等H0:m m1 1=m m2,H1:m m1 1m m2第48页/共65页m=m0 x拒绝域拒绝域上页下页结束首页第49页/共65页例例4:用两种不同方法冶炼的某种金属材料,分别取样测定某种杂质的含量,所得用两种不同方法冶炼的某种金属材料,分别取样测定某种杂质的含量,所得数据如下(单位为万分率)。假设两种方法冶炼时杂质含量服从正态分布,问两数据如下(单位为万分率)。假设两种方法冶炼时杂质含量服从正态分布,问两种方法冶炼时杂质含量有无显著性差异?种方法冶炼时杂质含量有无显著性差异?(a a=0.05)A A26.926.925.725.722.322.326.826.827.227.224.524.522.822.8232324.224.226.426.430.530.529.529.525.125.1B B22.622.622.522.520.620.623.523.524.324.321.921.920.620.623.223.223.423.4上页下页结束首页第50页/共65页EXCEL:“工具工具”-“数据分析数据分析”-“t-检验:检验:双样本异方差检验双样本异方差检验”上页下页结束首页第51页/共65页上页下页结束首页第52页/共65页统计决策:P(T=t)单尾 0.007520.05拒绝原假设,即认为两种方法冶炼时杂质含量有显著性差异上页下页结束首页第53页/共65页上页下页结束首页vF-检验:双样本方差分析检验:双样本方差分析w检验两样本的方差是否相等检验两样本的方差是否相等第54页/共65页x拒绝域上页下页结束首页第55页/共65页例例5 欲比较两批黄连中小檗碱的含量,分别取欲比较两批黄连中小檗碱的含量,分别取出出4个个150g的样本,测得第一批的样本和第二批的样本,测得第一批的样本和第二批的样本值分别如下。假设两批黄连中小檗碱的的样本值分别如下。假设两批黄连中小檗碱的含量均服从正态分布,对含量均服从正态分布,对a a=0.05,检验第二批含,检验第二批含量是否高于第一批。量是否高于第一批。x1x1x2x215.236 15.675 14.235 15.325 15.428 14.853 14.895 15.214 上页下页结束首页第56页/共65页EXCEL:“工具工具”-“数据分析数据分析”-“F-检验:检验:双样本方差分析双样本方差分析”上页下页结束首页第57页/共65页上页下页结束首页第58页/共65页统计决策:P(F0.05接受原假设,即认为两批样本的方差没有有显著性差异上页下页结束首页第59页/共65页EXCEL:“工具工具”-“数据分析数据分析”-“t-检验:检验:双样本等方差检验双样本等方差检验”上页下页结束首页第60页/共65页上页下页结束首页第61页/共65页统计决策:P(T0.05接受原假设,即认为两批样本的均值没有有显著性差异综上,两批黄连中小檗碱的含量没有显著性差异上页下页结束首页第62页/共65页3.Excel中的假设检验中的假设检验上页下页结束首页双样本双样本t检验检验t检验:双样本等方差假设检验:双样本等方差假设假设两个数据集的分布有假设两个数据集的分布有相同相同方差,检验两个方差,检验两个样本的分布是否具有相同均值。样本的分布是否具有相同均值。t检验:双样本异方差假设检验:双样本异方差假设假设两个数据集的分布有假设两个数据集的分布有不同不同方差,检验两个方差,检验两个样本的分布是否具有相同均值。样本的分布是否具有相同均值。t检验:平均值的成对二样本分析检验:平均值的成对二样本分析当样本中存在自然配对的观察值时,用此检验当样本中存在自然配对的观察值时,用此检验成对的数据是否具有相同均值。成对的数据是否具有相同均值。第63页/共65页3.Excel中的假设检验中的假设检验上页下页结束首页F检验检验 双样本方差双样本方差检验两个样本的方差是否相同。检验两个样本的方差是否相同。Z检验检验 双样本均值分析双样本均值分析假设两个数据集的方差假设两个数据集的方差已知已知,检验两个样本的,检验两个样本的均值是否相同。均值是否相同。第64页/共65页感谢您的观看。第65页/共65页