《统计学基础知识》PPT课件.ppt

资源ID：77633423 资源大小：553.50KB 全文页数：134页
资源格式： PPT 下载积分：11.9金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要11.9金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

《统计学基础知识》PPT课件.ppt

第二章统计学基础知识回顾主要内容n第一节总体、样本和随机函数n第二节对总体的描述随机变量的数字特征n第三节对样本的描述样本分布的数字特征n第四节随机变量的分布总体和样本的连接点n第五节通过样本，估计总体（一）估计量的特征n第六节通过样本，估计总体（二）估计方法n第七节通过样本，估计总体（三）假设检验四个基本定义与统计学的逻辑结构n总体和个体n样本和样本容量n随机变量n统计量n统计学的逻辑结构总体（集合）和个体（构成集合的元素）n研究对象的全体称为总体或母体，组成总体的每个基本单位称为个体。（1）按组成总体个体的多寡分为：有限总体和无限总体；（2）总体具有同质性：每个个体具有共同的观察特征，而与其它总体相区别；（3）度量同一对象得到的数据也构成总体，数据之间的差异是绝对的，因为存在不可消除的随机测量误差；（4）个体表现为某个数值是随机的，但是，它们取得某个数值的机会是不同的，即它们按一定的规律取值，即它们的取值与确定的概率相对应。样本和样本容量n总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量，又称为样本的大小。n抽样是按随机原则选取的，即总体中每个个体有同样的机会被选入样本。随机变量n根据概率不同而取不同数值的变量称为随机变量（Random Variable）。n注意：（1）一个随机变量具有下列特性：RV可以取许多不同的数值，取这些数值的概率为p，p满足：0=p=1。（2）随机变量以一定的概率取到各种可能值，按其取值情况随机变量可分为两类：离散型随机变量和连续型随机变量。离散型随机变量的取值最多可列多个；连续型随机变量的取值充满整个数轴或者某个区间。离散型随机变量与连续型随机变量 10 20 30 40 50概率概率xx离散型随机变量连续型随机变量总体与随机变量的关系n表示总体状况的数量特征，在总体中是参差不齐的，往往以一定的概率取不同的数值，显然对于这样的数值我们采用一般的变量是无法加以描述的。但是。可以采用一种特殊的变量来表示它们。这个特殊变量就是随机变量。因为，根据随机变量的定义，随机变量以一定的概率取许多不同的值，而且概率p满足：0=p=1。n由于我们主要研究总体的数量特征，可以直接用随机变量来表示所研究的总体。总体、随机变量、样本间的联系n总体就是一个随机变量，所谓样本就是n个（样本容量n）相互独立且与总体有相同分布的随机变量X1，Xn。n每一次具体抽样所得的数据，就是n元随机变量的一个观察值，记为（X1，Xn）。n通过总体的分布可以把总体和样本连接起来。总体分布是总体和样本的连接点n所谓分布，它是从全局而言的。通俗地说，分布就是某个对象在什么地方，堆积了多少。n任何一个随机变量都有自己的分布，这个什么地方就是在数轴上取什么值，堆积多少就是在那里占有的比例是多少或者概率有多大。n总体可以表示为随机变量，并具有自身的分布。n样本则是相互独立与总体具有相同分布的n元随机变量。因此，总体分布是总体和样本的连接点。从而，可以通过对样本特征的研究达到对总体进行研究的目的。因为它们具有相同的分布。统计量n设（x1，x2，xn）为一组样本观察值，函数f（x1，x2，xn）若不含有未知参数，则称为统计量。n统计量一般是连续函数。由于样本是随机变量，因而它的函数也是随机变量，所以，统计量也是随机变量。n统计量一般用它来提取或压榨由样本带来的总体信息。样本与总体之间的关系样本是总体的一部分，是对总体随机抽样后得到的集合。对观察者而言，总体是不了解的，了解的只是样本的具体情况。我们所要做的就是通过对这些具体样本的情况的研究，来推知整个总体的情况。Xn+1XnX1样本总体统计学的逻辑结构（1）总体和样本引入一个随机变量来描述总体（2）对总体的描述：随机变量的数字特征（3）对样本的描述：样本分布的数字特征（4）总体与样本的连接点：随机变量的分布（5）如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数 a 估计量的优良性 b 估计方法 c 对估计量的检验假设检验a 估计量的优良性n1、无偏性n2、有效性n3、均方误最小n4、一致性b 估计方法矩法最大似然法最小二乘法总体分布未知正态总体一般总体（大样）已知方差方差未知一般总体（大样）正态总体估计期望单个总体两个总体估计方差（常用小样本下，正态总体估计其它参数）点估计区间估计c 对估计量的检验假设检验n1.对总体分布特征的假设检验（1）一个正态总体的假设检验a 检验均值：已知方差和未知方差b 检验方差：未知均值（双尾和单尾）（2）两个正态总体的假设检验a 检验均值：未知方差但可假设其相等b 检验方差：未知均值（双尾和单尾）（3）总体分布的假设检验a 总体为离散型分布b 总体为连续型分布n2.对各种系数、参数估计值的假设检验一、随机变量的分布（一）离散型随机变量的分布n定义：如果随机变量只取有限个或可列多个可能值，而且以确定的概率取这些值，则称为离散型随机变量。n通常用分布列表示离散型随机变量：n的概率分布也可用一系列等式表示：nP（=xi）=pi （i=1,2,）称为的概率函数。n显然满足概率的定义：n离散型随机变量的分布就是指它的分布列或概率函数。离散型随机变量举例1n例1 一批产品的废品率为5%，从中任取一个进行检验，以随机变量来描述这一试验并写出的分布。以X=0表示“产品为合格产品”，X=1表示“产品为废品”，那么分布列如下：其概率函数p（X=0），p（X=1），或p（X=i）=（）i（）1-i （i=0,1）离散型随机变量举例2n用随机变量X描述掷一颗骰子的试验。分布的概率函数为：P（X=i）=1/6（i=1，2，3，4，5，6）（二）随机变量的分布函数n定义：若X是一个随机变量（可以是离散的，也可以是非离散的），对任何实数x，令F（x）=P（X=x），称F（x）为随机变量X的分布函数。F（x），即事件“X=x”的概率，是一个实函数。对任意实数x1x2，有P（x1Xx2）=P（X=x2）-P（X=x1）=F（x2）-F（x1）x2x2F(x)F(x)Xx1x1分布函数F（x）的性质分布函数举例n例3 求例1中的分布函数n例4 求例2中的分布函数01F(x)x（三）连续型随机变量的分布n定义：对于任何实数x，如果随机变量X的分布函数 F（x）可以写成n概率分布密度函数的性质：连续型随机变量分布函数举例a x ba x bF(x)(x)二、二元随机变量nn元随机变量的定义：每次试验同时处理n个随机变量（X1，X2，Xn），它们的取值随试验的进行而变化。如果对任何一组实数（x1，x2，xn），事件“X1x1，X2x2，Xnxn”有着确定的概率，则称n个随机变量（X1，X2，Xn）总体为一个n元随机变量。nn元随机变量分布函数的定义：n元函数F（x1，x2，xn）=P(X1x1，X2x2，Xnxn)（x1，x2，xn）属Rn，为n元随机变量分布函数。离散二元随机变量的定义：如果二元随机变量（X,Y）所有可能取值为有限或可列多个，并且以确定的概率取各个不同数值，则称（X,Y）为二元随机变量。(X，Y)的联合分布表和联合分布函数n(X，Y)为离散型的二元随机变量，通常用联合分布函数与联合分布表表示。离散二元分布函数的示例n例6 同一品种的5个产品中，有2个正品，3个次品，每次从中抽取一个进行质量检查，不放回的抽取，连续两次。令“Xi=0”表示第i次抽取到正品，而“Xi=1”表示第i次抽取到次品，写出(X1,X2)的分布。解 p(X1=0,X2=0)=p(X1=0)P(X2=0)=(2/5)(1/4)=1/10 p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10 p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10 p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10连续二元随机变量的定义三、独立性n（一）事件的独立性n（二）随机变量的独立性（一）事件的独立性定义1.12 事件的独立性的定义如果事件A发生的可能性不受事件B发生与否的的影响，即P(AB)=P(A)，则称事件A对于事件B独立。显然，若事件A对于事件B独立，事件B对于事件A也一定独立，我们称事件A与事件B相互独立。A与B独立的充分必要条件是：P（AB）=P（A）P（B）（二）随机变量的独立性n定义1.13 边际分布的定义离散型二元随机变量(X,Y)中，分量X（或Y）的概率分布称为(X,Y)的关于X（或Y）的边际分布，边际分布又称边缘分布。n定义1.14 随机变量相互独立的定义对于任何实数x,y，如果二元随机变量(X,Y)的联合分布函数F(x,y)等于X和Y的边际分布的乘积，即 F(x,y)=FX(x).FY(y)则称X与Y相互独立。四、随机变量函数的概念和分布n定义1.15 随机变量函数的定义设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x，都有另一个随机变量Y的取值y=f(x)与之相对应，则称Y为X的函数，记作Y=f(X)。n 我们常常遇到一些随机变量，它们的分布往往难于直接得到（例如滚珠体积的测量值等），但与它们有关系的另一个随机变量的分布却是容易知道的（如滚珠直径的测量值）。因此，就要研究两个随机变量之间的关系，然后通过它们之间的关系，由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。第二节对总体的描述随机变量的数字特征一、数学期望二、方差三、数学期望与方差的图示一、数学期望n研究数字特征的必要性n两个最重要的数字特征（1）数学期望（2）方差研究数字特征的必要性n总体就是一个随机变量。对总体的描述就是对随机变量的描述。随机变量的分布就是对随机变量最完整的描述。但是，（1）求出总体的分布往往不是一件容易的事情；（2）而且，在很多情况下，我们并不需要全面考察随机变量的变化情况，只需要了解总体的一些综合指标。一般说来，常常需要了解总体的一般水平和它的离散程度；（3）如果了解总体的一般水平和离散程度，就已经对总体有了粗略的了解了；（4）在很多情况下，了解这两个数字特征还是深入求出总体分布的基础和关键。数学期望的定义n定义2.1 离散型随机变量数学期望的定义假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn，而p1,p2,pn是X取这些值相应的概率，则这个随机变量X的数学期望定义如下：数学期望描述的是随机变量（总体）的一般水平。n定义2.2 连续型随机变量数学期望的定义女儿期待父亲钓多少鱼回家？女儿期待父亲钓多少鱼回家？n数学期望是最容易发生的，因而是可以期待的。它反映数据集中的趋势。数学期望的性质（1）如果a、b为常数，则 E(aX+b)=aE(X)+b（2）如果X、Y为两个随机变量，则 E(X+Y)=E(X)+E(Y)（3）如果g(x)和f(x)分别为X的两个函数，则 Eg(X)+f(X)=Eg(X)+Ef(X)（4）如果X、Y是两个独立的随机变量，则 E(X.Y)=E(X).E(Y)求离散型随机变量数学期望举例n例1 甲、乙两射手在一次射击中的得分（分别用X、Y表示）的分布率如下：试比较两射手的射击技术水平，并计算如果二人各发一弹，他们得分和的估计值。解 EX=1 EXEY 乙射手射击水平比较高二人各发一弹，得分总和最可能在分左右（即4分或5分）二、方差n定义2.3 离均差的定义如果随机变量X的数学期望E(X)存在，称 X-E(X)为随机变量X的离均差。显然，随机变量离均差的数学期望是0，即 E X-E(X)=0n定义2.4 连续型随机变量的方差n定义2.5 随机变量离均差平方的数学期望，叫随机变量的方差，记作Var(x),或D(x)。方差的算术平方根叫标准差。方差的意义n（1）离均差和方差都是用来描述离散程度的，即描述X对于它的期望的偏离程度，这种偏差越大，表明变量的取值越分散。n（2）一般情况下，我们采用方差来描述离散程度。因为离均差的和为0，无法体现随机变量的总离散程度。事实上正偏差大亦或负偏差大，同样是离散程度大。方差中由于有平方，从而消除了正负号的影响，并易于加总，也易于强调大的偏离程度的突出作用。方差的性质（1）Var(c)=0（2）Var(c+x)=Var(x)（3）Var(cx)=c2Var(x)（4）x,y为相互独立的随机变量，则 Var(x+y)=Var(x)+Var(y)=Var(x-y)（5）Var(a+bx)=b2Var(x)（6）a,b为常数，x,y为两个相互独立的随机变量，则Var(ax+by)=a2Var(x)+b2Var(y)（7）Var(x)=E(x2)-(E(x)2例2 计算本节例1中甲射手的方差n例1 甲、乙两射手在一次射击中的得分（分别用X、Y表示）的分布率如下：Var(X)=（）2 0.4+（）2 2 三、数学期望与方差的图示n数学期望描述随机变量的集中程度，方差描述随机变量的分散程度。n1方差同、期望变大 2期望同、方差变小51055第三节对样本的描述样本分布的数字特征一、样本分布函数二、样本平均数三、样本方差一、样本分布函数样本分布函数举例二、样本平均数n总体的数字特征是一个固定不变的数，称为参数；样本的数字特征是随抽样而变化的数，是一个随机变量，称为统计量。n定义样本平均数的定义n样本平均数用来描述样本的平均水平（一般Common）水平。三、样本方差和标准差n定义3.2 样本方差和标准差的定义第四节随机变量的分布总体和样本的连接点n一、几种重要的分布n二、各种分布之间的联系n三、分布是总体和样本之间的连接点一、几种重要的分布n如果一个随机变量的分布已经确定，那么这个随机变量的一切性质对于我们便都是已知的。因为随机变量的分布是对随机变量最完整的描述。n例如X是广西十万大山中树木的高度，它的分布函数为F(x)=P(X 时，MSE()=0，亦即Var()=0和Bias()2=0，也就是随着样本加大，的方差变小；的偏差接近于0，这就是一致性描述的情况。n事实上一致性和MSE（）=0（当n=）这两条标准在计量经济学中往往是通用的。第六节通过样本，估计总体（二）估计方法一、点估计（1）矩法（2）最大似然法（3）最小二乘法二、区间估计（一）对总体期望值的估计（二）对总体方差的估计（三）关于区间估计的几点说明一、点估计n所谓点估计就是给出被估计参数的一个特定的估计值。n常用的点估计方法有三种：矩法、最大似然法、最小二乘法。n这三种方法分别建立在不同的原则上。n对同一样本根据三种方法估计同一参数，所获得的估计结果可能互不相同。n然而由于各种建立原则的合理性，所以三种方法在研究中都经常使用。（1）矩法n矩法是求估计量最古老的方法。具体作法是：一样本矩作为相应总体矩的估计量；以样本矩的函数作为相应的总体矩同样函数的估计量。n这种方法最常见的应用是用样本平均数估计总体数学期望。n矩法比较直观，求估计量时有时也比较直接，但它求出的估计量往往不够理想。矩法点估计的例题n例1某灯泡厂某天生产了一大批灯泡，从中抽取了10个进行寿命试验，获得数据如下（单位：小时），问该天生产的灯泡的平均寿命是多少？（2）最大似然法(Maximum Likelihood Estimation)1、一个重要的事实2、最大似然法的概念3、似然法函数4、最大似然法的定义5、最大似然法的示例n不同的总体会产生不同的样本，对于某一特定的样本，在不了解产生它的母体究竟为何物的观察者眼中，它来自一些母体的可能性要比来自另一些母体的可能性大，即一些母体更容易产生出我们所观察到的样本。n举例说，假定我们抽取到（x1,x2,x8）我们知道它来自正态总体，且总体的方差是了解的，但是总体的均值未知。如下图所示。x1 x2 x3 x4 x5 x6 x7 x8 分布B分布A概率x假定样本不是来自B就是来自A。如果样本来自B，观察到它的可能性非常小；真正的母体若是A，得到样本的可能性很大。显然我们宁愿承认样本来自A。是样本“替”我们“选择”了A。2、最大似然法的概念n上述事实诱导我们宁愿作出这样的抉择：将样本最容易来自的总体当作产生样本的总体。n现在要根据从总体中抽取得到的样本(x1,xn)对总体中的未知数进行估计。最大似然法是选择这样的估计量作为的估计值，以便使观察结果(x1,xn)出现的可能性（概率）最大。n对于离散型变量，就是要选择使p(x1)p(x2)p(xn)最大。（连乘表示一次独立地抽取各个样本观察值）n对于连续型变量，就是要选择使(x1)(x2).(xn)最大。注意(xi)是随机变量在xi附近取值的概率，相当于离散型的p(xi)。3、似然法函数4、最大似然法的定义5、最大似然法的估计方法n为了取得的最大似然估计，必须使似然函数L达到最大值，并且把此时的作为的估计量。由于对数函数是单增的，L达到最大亦即LnL达到最大。n这样使LnL达到最大来估计为计算带来了许多方便。n根据微分中的拉格朗日定理，对未知参数求条件极值，令LnL对的一阶导数等于0，即dLnL/d=0=得到似然方程，我们所求的就是似然方程中的解。5、最大似然法示例之一（3）最小二乘法(Least Square Estimation Method)最小二乘法是计量经济学中应用最广泛的一种估计方法。二、区间估计（一）对总体期望值的估计1、已知方差，对数学期望E进行区间估计（1）方差已知，估计总体数学期望（2）正态总体（3）一般总体大样本下数学期望的区间估计2、方差未知，对数学期望E进行区间估计（二）对总体方差的估计（三）关于区间估计的几点说明区间估计的概念n所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。n用点估计估计参数，即使是无偏有效的估计量，也会由于样本的随机性，使得由样本计算出的估计值并不恰恰是真值。而且即使等于真值，由于真值未知，我们也不能肯定这种相等。那么，究竟相差多少？于是问题等价为：在给定可靠程度下，指出被估计参数所在的可能值的范围，就是参数的区间估计问题。n具体作法是找出两个统计量1(x1,xn)与2(x1,xn)，使 P(1 2)=1-(1,2)称为置信区间，1-称为置信系数（置信水平），称为显著性水平，一般等于5%或1%。对区间估计的形象比喻n我们经常说某甲的成绩“大概80分左右”，可以看成一个区间估计问题。（某甲的成绩为被估计的参数）P(1 2)=大概的准确程度（1-）如：P(75 =30时，就可以把样本平均数近似地看作服从正态分布N(，2/n)。n所以，对于大样本仍可以按正态总体进行均值的区间估计。2、方差未知，对数学期望E进行区间估计（1）大样本下根据中心极限定理，V 可以用s2代替，所以仍按已知方差正态分布的方法进行的置信区间估计。（2）小样本下例8 新生儿体重的置信区间n假设新生儿（男）的体重服从正态分布。随机抽取12名新生儿，测得体重如下表，试以95%的置信度估计新生儿（男）的平均体重。（二）对总体方差的估计（只介绍小样本下的）总体方差区间估计的例题例9 在本节例8中，请对新生儿体重的方差进行区间估计（）。=0.05 n-1=11 ，查X2分布临界值表，得a=3.82 b=21.9 ，a、b满足：有上例知，s2=140900，所以(n-1)s2=1549000，则 2的置信区间为：1549000/21.9 2即 70700 2405000（三）关于区间估计的几点说明（1）区间估计在方法上是定理的应用。（2）在进行区间估计时，应针对不同的情况，采用不同的方法。例如分清分布的形式是已知或是未知；是大样本或是小样本；小样本（估计总体数学期望时）又分清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。（3）一般地，越大置信度越低，置信区间越小；反之，则反。第七节通过样本，估计总体（三）假设检验一、假设检验的概念二、两类错误三、假设检验与区间估计间的关系：置信区间法四、假设检验的应用（一）正态总体的假设检验（二）两个正态总体的假设检验（三）总体分布的假设检验五、“小概率原理”在假设检验中的应用一、假设检验的概念n定义：称对任何一个随机变量未知分布的假设为统计假设，简称假设。n一个仅涉及到随机变量分布中未知参数的假设称为参数假设。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为非参数假设。n提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。例1.检验一个硬币是否均匀n抛掷一个硬币100次，“正面”出现60次，问此硬币是否均匀？n分析：若用X描述抛掷硬币的试验，“X=1”和“X=0”分别表示“出现正面”和“出现反面”。上述问题就是检验X是否可以被认为服从的0-1分布。问题是分布形式已知，检验参数的假设检验。记作，H0:p=0.5 HA零假设与备择假设n在统计假设H0:p=0.5 HA中，H0称为零假设或原假设，是我们进行统计假设检验欲确定其是否成立的假设体现我们进行假设检验的目的，而且往往是希望否定这个假设，否定其成立所冒的风险为。nHA称为备择假设，统计假设检验是二择一的判断，当不成立时，不得不接受它。例2.检验1999年新生女婴体重是否等于某个既定值n从1999年出生的女婴中随机地抽取20名，测得平均体重=3160克，标准差=300克，根据已有的统计资料新生女婴的体重=3140克，问现在与过去新生女婴的体重是否有变化？分析：把1999年出生的女婴视为一个总体，用X描述，问题就是判断：H0:EX=3140 HA:EX 3140 因为通常可以假定经过量测得到的资料是服从正态分布的，无须检验总体的分布形式，显然这是一个关于参数的假设检验问题。二、两类错误n（1）两类错误的概念n（2）显著性水平（1）两类错误的概念n由于我们作出判断的依据是一组样本，结论却是对于总体的，即由局部全面，由特殊一般，由个别整体，因而假设检验的结果不可能绝对正确，它有可能是错误的。而且出现错误可能性的大小，也是以统计规律（小概率原理）为依据的。所可能犯的错误有两类：第一类弃真，原假设符合实际情况，而检验结果把它否定了。设犯这类错误的概率为，那么 =p(否定H0/H0实际上为真)。称为显著性水平第二类纳伪，原假设不符合实际情况，而检验结果却把它肯定下来。设犯这类错误的概率为，那么 =p(接受H0/H0实际上为不正确)。1-称为检验能力。（2）显著性水平n显著水平指的是犯“第一类错误”的可能性，即“冒险率”冒H0是真而我们抛弃了H0所犯错误的概率反之，而不接受H0，乃是因为客观事实与H0假设存在差异，且这种差异的程度已经太大了，在给定的小概率下，零假设几乎是不可能发生的，从而认为零假设H0是错的，必须抛弃它。所以，我们把犯弃真错误的概率也称为差异达到和超过了显著（太大）的水平，以至于达到显著水平后，我们不能接受H0，而不得不抛弃H0。同时，即使抛弃零假设H0，这时也只需冒的风险，抛弃H0的可靠性则为1-。n如果假设事关重大，譬如人命关载人的宇宙飞船升空或药品试验，则必须提高差异显著水平即减小，使我们不能轻易地拒绝H0。否则，则可以降低显著水平。三、假设检验与区间估计间的关系：置信区间法n（一）问题的提出n（二）假设检验的置信区间法n（三）假设检验与区间估计的联系与区别（一）问题的提出曾经提到“某甲成绩大概是80 分左右”可以看成一个区间估计问题。“大概80分左右”p(12)=大概的准确程度如：p(7585)=95%(75,85)是某甲成绩的估计区间，某甲成绩落在此区间的概率在95%以上。类似地，对这个问题，也可举出一个假设检验的问题在允许你犯5%以下的错误，即以95%的正确性来回答：“某甲的成绩是80，对吗？”假设检验同样的问题又是一个假设检验的问题。（二）假设检验的置信区间法的定义n对比区间估计和假设检验两种情况，我们发现区间估计实际上给出了一种进行假设检验的方法。n比如，当涉及“某甲成绩为80分”（=5%）后，首先对问题进行区间估计，得到成绩在7585之间的概率为95%。若原假设H0落在（75,85）内，显然应当接受H0，否则，则拒绝H0。n这种利用区间估计法来进行假设检验的方法称为区间估计法。通过求置信区间进行假设检验的例子n例3 根据长期经验和资料分析，某砖厂生产的砖的“抗断强度”服从正态分布，方差，今从该厂生产的砖中随机地抽取6块砖，测得强度如下（单位千克/cm2）：检验这批砖的平均抗断强度为千克/cm2是否成立（）？解：H0:=32.50 HA:首先求的置信区间：临界值法采用临界值法重作例31、提出零假设 H0：HA：2、根据抽样所得样本计算检验统计量3、确定显著水平（或）和相应的临界值4、将计算的与进行比较5、下结论：因为U=3.05 ，故小概率事件发生，则拒绝H0。不认为抗断强度为。6、依据统计结论，作出专业（经济学）上的解释假设检验的步骤1、提出零假设 H0：=0 HA：02、根据抽样所得样本计算检验统计量3、确定显著水平（或）和相应的临界值4、将计算的U与进行比较。如果H0真的成立，必有 0。5、下结论：若U ,P ，拒绝H0；若U ，接受H0；若U=,不能对H0下结论6、依据统计结论，作出专业（经济学）上的解释四、假设检验的应用n（一）正态总体的假设检验n（二）两个正态总体的假设检验n（三）总体分布的假设检验（一）正态总体的假设检验n设总体N（，2），对于其参数，2的假设检验，讨论4种情况：（1）已知方差2，检验假设H0：=0（2）未知方差2，检验假设H0：=0（3）未知期望，检验假设H0：2=20（4）未知期望，检验假设 H0：2临界值”的事件）居然发生了。出错了，那么，错在那里呢？n因为，在整个假设检验过程中，抽样是正确的、统计量的选择是正确的、根据显著水平确定的临界值是正确的、统计量的计算是正确的，统计量与临界值的比较也是正确的。因而，只能是提出的假设H0发生了错误，所以必须拒绝H0。本章的几点注意点：（1）统计学研究的核心问题是如何从样本来推断总体的性质。作为观察者，我们对总体的情况往往是不了解的，我们只能对总体进行随机抽样，获得一组样本，通过对一组样本的研究，进而估计总体的各种属性。所以，对总体的研究都是基于样本的。（2）为了描述总体引入了随机变量，只有随机变量这类特殊的变量，才能用以对总体进行全面描述。（3）总体就是一个随机变量。（4）我们通常遵循统计量三个优良性来构造各种统计量，而且利用假设检验来具体的评价关于总体参数的假设是否合理。（5）区间估计和假设检验是一个问题的两个方面。

注意事项

本文（《统计学基础知识》PPT课件.ppt）为本站会员（wuy****n92）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。