欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    参数估计与假设检验课件.ppt

    • 资源ID:92268253       资源大小:1.59MB        全文页数:119页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    参数估计与假设检验课件.ppt

    第五章第五章 参数估计与假设检验参数估计与假设检验样样样样本本本本总体总体总体总体样本统计量样本统计量如:样本均值、如:样本均值、比例、方差比例、方差总体均值、比总体均值、比例、方差等例、方差等6/2/20231 1统计推断统计推断(Statistical inference)统计推断统计推断就是根据随机样本的实际数据,就是根据随机样本的实际数据,对总体的数量特征作出具有一定可靠程度的估对总体的数量特征作出具有一定可靠程度的估计和判断。统计推断的计和判断。统计推断的基本内容基本内容有有参数估计参数估计和和假设检验假设检验两方面。概括地说,研究一个随机变两方面。概括地说,研究一个随机变量,推断它具有什么样的数量特征,按什么样量,推断它具有什么样的数量特征,按什么样的模式来变动,这属于估计理论的内容,而推的模式来变动,这属于估计理论的内容,而推测这些随机变量的数量特征和变动模式是否符测这些随机变量的数量特征和变动模式是否符合我们事先所作的假设,这属于检验理论的内合我们事先所作的假设,这属于检验理论的内容。参数估计和假设检验的共同点是它们都对容。参数估计和假设检验的共同点是它们都对总体无知或不很了解,都是利用样本观察值所总体无知或不很了解,都是利用样本观察值所提供的信息,对总体的数量特征作出估计和判提供的信息,对总体的数量特征作出估计和判断,但两者所要解决问题的着重点及所用方法断,但两者所要解决问题的着重点及所用方法有所不同。有所不同。6/2/20232 2主要内容主要内容5.1 参数估计的一般问题参数估计的一般问题 5.2 一个一个总体参数的区间估计总体参数的区间估计5.3 必要抽样数目的确定必要抽样数目的确定5.4 假设检验的基本问题假设检验的基本问题5.5 一个总体参数的假设检验一个总体参数的假设检验6/2/20233 35.1 5.1 参数估计的一般问题参数估计的一般问题 5.1.1 参数估计的含义参数估计的含义5.1.2 估计量与估计值估计量与估计值5.1.3 点估计与区间估计点估计与区间估计5.1.4 评价估计量的标准评价估计量的标准6/2/20234 4 所谓参数估计,就是以样本统计量(即样本数字特征)来估计未知的总体参数(或参数的函数)。实际工作中一般首先进行概率抽样得到随机样本,然后通过对样本单位的实际观察取得样本数据,最后计算样本统计量的取值对未知的总体参数进行估计。5.1.1 参数估计的含义参数估计的含义1、什么是参数估计、什么是参数估计6/2/20235 52、参数估计的特点和逻辑思想、参数估计的特点和逻辑思想(1)以随机样本为基础;(2)以分布理论为依据;(3)推断的只是一种可能的结果;(4)是归纳推理和演绎推理的结合。归纳推理 从样本 总体 大前提 小前提 (分布规律)(样本信息)结果演绎推理5.1.1 参数估计的含义参数估计的含义6/2/20236 63、参数估计的主要问题、参数估计的主要问题(1)如何得到总体参数的估计值?(解决估计方法问题)(2)如何在保证样本对总体具有充分代表性的前提下,使样本的调查成本最低?(解决样本容量问题)5.1.1 参数估计的含义参数估计的含义6/2/20237 7 1)估计量估计量:用于估计总体参数的统计量:用于估计总体参数的统计量如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量 2)参数用)参数用 表示,估计量表示,估计量用用 表示表示 3)估估计计值值:估估计计参参数数时时计计算算出出来来的的估估计计量量的的具具体数值体数值如果样本均值如果样本均值 x=80,则,则80就是就是 的估计值的估计值1、什么是估计量与估计值、什么是估计量与估计值(estimator&estimated value)5.1.2 估计量与估计值估计量与估计值6/2/20238 82、统计估计的基本过程、统计估计的基本过程1)首先对所要研究的总体进行概率抽样,通过首先对所要研究的总体进行概率抽样,通过随机样本获取相关统计量,然后利用这些随机样本获取相关统计量,然后利用这些统计量统计量与总体参数之间的联系与总体参数之间的联系(获得统计量的分布),(获得统计量的分布),利用有关统计方法计算估计量,估计总体参数。利用有关统计方法计算估计量,估计总体参数。2)由此可以看出,统计量与总体参数、估计量由此可以看出,统计量与总体参数、估计量的不同:总体的不同:总体参数参数通常是未知的通常是未知的常数常数,是待估计是待估计的量的量;统计量统计量是根据样本计算的函数,通常是随是根据样本计算的函数,通常是随机变量(对于总体而言);机变量(对于总体而言);估计量估计量是是用来对总体用来对总体参数进行估计的统计量。参数进行估计的统计量。5.1.2 估计量与估计值估计量与估计值6/2/20239 91、参数估计的方法、参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计5.1.3 点估计量与区间估计点估计量与区间估计6/2/202310102、点估计、点估计(point estimate)1)用用样样本本统统计计量量的的某某个个取取值值直直接接作作为为总总体体参参数数的估计值的估计值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例例如如:用用两两个个样样本本均均值值之之差差直直接接作作为为总总体体均均值值之差的估计之差的估计2)没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息3)点点估估计计的的方方法法有有矩矩估估计计法法、顺顺序序统统计计量量法法、最大似然法、最小二乘法等最大似然法、最小二乘法等5.1.3 点估计量与区间估计点估计量与区间估计6/2/202311113、区间估计、区间估计(interval estimate)(1)有关概念有关概念l点估计是通过样本估计量的某一次估计值来推断总体参数的可能取值;l区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。l人们在得到点估计值的同时,自然希望知道 与到底相差多少?这就引出了区间估计问题。即希望对的取值估计出一个范围,并希望知道这个范围包含 的可靠程度。即 P =1-其中 是置信区间;是置信区间下、上限;1-是置信水平、置信度或置信系数;是估计不准的概率,通常取=0.05,或0.01。l由上式可知,要想求出被估计参数的置信区间,必须找到一个和被估计参数相关联的统计量,并知其概率分布。5.1.3 点估计量与区间估计点估计量与区间估计6/2/20231212(2)置信区间的构造)置信区间的构造当总体服从正态分布N(,2)时(2已知),来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n)0 0 0临界值临界值临界值-z-z-z值值值 /2/2 /2/2/2 统计量统计量统计量1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计6/2/20231313(3)区间估计的图示)区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计6/2/20231414 2)1-可以认为是用样本估计值 代替总体真值时误差在某一范围内的“可能性”,则 可认为是用 代替时误差超过这一范围的“可能性”。3)用一个具体的样本所构造的区间是一个特定的区间用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。总体参数以一定的概率落在这一区间的表述是错误的。总体参数以一定的概率落在这一区间的表述是错误的。1)置信区间的直观意义为:n次抽样形成的n个置信区间中,有n(1-)个区间包含总体参数真值。5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计注意:注意:(3)区间估计的图示)区间估计的图示6/2/20231515 5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计(3)区间估计的图示)区间估计的图示6/2/20231616(4)影响区间宽度的因素)影响区间宽度的因素1.总体数据的离散程度,总体数据的离散程度,用用 来测度来测度2.样本容量样本容量 n 3.置信水平置信水平(1-),影响,影响 z /2的大小的大小4.抽样方法抽样方法5.抽样的组织方式抽样的组织方式5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计6/2/20231717置信区间与置信水平(置信区间与置信水平(1-)的关系)的关系70%80%90%95%99%置信区间宽度5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计(4)影响区间宽度的因素)影响区间宽度的因素Neyman原则:原则:即在保证置信度的前提下,尽可能提高估计的精确度。即在保证置信度的前提下,尽可能提高估计的精确度。6/2/202318181、点估计、点估计以样本指标直接估计总体参数。以样本指标直接估计总体参数。评价准则评价准则的数学期望的数学期望等于总体参等于总体参数,即数,即该估计量称该估计量称为无偏估计。为无偏估计。无偏性无偏性有效性有效性 当当 为为 的的无偏估计时,无偏估计时,方差方差 越越小,无偏估计小,无偏估计越有效。越有效。一致性一致性对于无限总体,对于无限总体,如果对如果对任意任意 ,则称则称的一致估计。的一致估计。是是充分性充分性估计量如估计量如能包含样能包含样本中关于本中关于未知参数未知参数的全部信的全部信息,即为息,即为充分量。充分量。估计量估计量5.1.4 评价估计量的标准评价估计量的标准6/2/202319192、区间估计、区间估计估计未知参数所在的可能区间。估计未知参数所在的可能区间。评价准则评价准则随机区间随机区间置信度置信度精确度精确度随机区间随机区间包含包含(即可靠程度即可靠程度)越大越好。越大越好。的概率的概率的平均长度的平均长度(误差范围误差范围)越小越好。越小越好。5.1.4 评价估计量的标准评价估计量的标准6/2/20232020 5.2 一个总体参数的区间估计 5.2.1 一个总体均值的区间估计一个总体均值的区间估计5.2.2 一个总体比例的区间估计一个总体比例的区间估计5.2.3 一个总体方差的区间估计一个总体方差的区间估计6/2/202321211、有关符号、有关符号总体参数总体参数样本统计量样本统计量均均值值比例比例方差方差5.2.1 一个总体均值的区间估计一个总体均值的区间估计6/2/20232222(1)总体服从正态分布总体服从正态分布,且且方差方差()已知已知;或者总体不是正或者总体不是正态分布但大样本态分布但大样本(n 30)时总体均值的区间估计时总体均值的区间估计 该条件下使用标准正态分布统计量 z下面通过标准正态分布构造总体均值的置信区间5.2.1 一个总体均值的区间估计一个总体均值的区间估计2、一个总体均值的置信区间、一个总体均值的置信区间6/2/20232323 给定置信度1-,可由标准正态分布表查得临界值Z/2,使得从而可得置信度为1-时总体均值的置信区间:在大样本(n30)条件下,不论总体分布形式如何,均可用上述方法进行总体均值的区间估计。如果总体方差未知,则直接用样本方差代替。注意:注意:5.2.1 一个总体均值的区间估计一个总体均值的区间估计6/2/20232424 (2)小样本下小样本下总体方差未知总体方差未知时,正态分布总体均时,正态分布总体均值的区间估计值的区间估计 如果是小样本,但总体为正态分布,在总体方差未知如果是小样本,但总体为正态分布,在总体方差未知而需用样本方差代替时,则下式而需用样本方差代替时,则下式服从自由度为服从自由度为n-1n-1的的t t分布分布。5.2.1 一个总体均值的区间估计一个总体均值的区间估计2、一个总体均值的置信区间、一个总体均值的置信区间6/2/202325 注意:注意:如果小样本下总体分布非正态,则无法进行区间估计,唯一的解决方法就是增大样本。从而可得置信度为1-时总体均值的置信区间:于是,给定置信度为1-,可由t分布表查得临界值t/2(n-1),使得5.2.1 一个总体均值的区间估计一个总体均值的区间估计6/2/202326指在指在指在指在一定的置信水平下,抽样误差不允许超过的最一定的置信水平下,抽样误差不允许超过的最一定的置信水平下,抽样误差不允许超过的最一定的置信水平下,抽样误差不允许超过的最大给定范围,也称作大给定范围,也称作大给定范围,也称作大给定范围,也称作允许误差、误差范围允许误差、误差范围允许误差、误差范围允许误差、误差范围等。等。等。等。5.2.1 一个总体均值的区间估计一个总体均值的区间估计3、极限误差(、极限误差(允许误差)允许误差)允许误差)允许误差)(1)含义)含义(大样本条件下)(大样本条件下)(2)极限误差的计算公式极限误差的计算公式样本平均数的极限样本平均数的极限样本平均数的极限样本平均数的极限误差:误差:误差:误差:边际误差边际误差样本成数的极限样本成数的极限样本成数的极限样本成数的极限 误差:误差:误差:误差:6/2/20232727 Z与相应的置信水平存在一一对应关系,与相应的置信水平存在一一对应关系,常用常用的置信水平及相应的的置信水平及相应的Z值如下:值如下:z值值 置信水平置信水平1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.99735.2.1 一个总体均值的区间估计一个总体均值的区间估计3、极限误差、极限误差6/2/20232828计算计算样本样本统计量统计量确定样确定样本统计本统计量分布量分布由置信由置信水平求水平求临界值临界值确定确定置信置信区间区间4、区间估计步骤、区间估计步骤 (以大样本下估计(以大样本下估计 为例)为例)其中:其中:5.2.1 一个总体均值的区间估计一个总体均值的区间估计6/2/20232929【例例】某企业生产某种产品的工人某企业生产某种产品的工人有有10001000人,某日采用不重复抽样从人,某日采用不重复抽样从中随机抽取中随机抽取100100人调查他们的当日人调查他们的当日产量(数据见下张幻灯片),要求产量(数据见下张幻灯片),要求在在9595的置信水平下,的置信水平下,估计该厂全估计该厂全部工人的日平均产量和日总产量的部工人的日平均产量和日总产量的置信区间置信区间。5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析6/2/20233030按按 日产量分组日产量分组(件)(件)工人数工人数(人)(人)组中值(件)组中值(件)11011411411811812212212612613013013413413813814237182321186411211612012412813213614033681221602852268823768165605887006489284648600784合计合计100126004144100100名工人的日产量分组资料名工人的日产量分组资料5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析6/2/202331315.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析6/2/20233232即在即在即在即在95959595置信水平下置信水平下置信水平下置信水平下,该企业工人人均产量在,该企业工人人均产量在,该企业工人人均产量在,该企业工人人均产量在124.80124.80124.80124.80至至至至127.20127.20127.20127.20件之间,其日总产量在件之间,其日总产量在件之间,其日总产量在件之间,其日总产量在124797124797124797124797至至至至127303127303127303127303件之间。件之间。件之间。件之间。则该厂全部工人日平均产量和日总产量的置信区间分别为则该厂全部工人日平均产量和日总产量的置信区间分别为则该厂全部工人日平均产量和日总产量的置信区间分别为则该厂全部工人日平均产量和日总产量的置信区间分别为5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析6/2/20233333例:由例:由532名名商业周刊商业周刊订阅者订阅者组成的样本表明,其每周使用因特网的组成的样本表明,其每周使用因特网的平均时间为平均时间为6.7小时。如果总体标准差为小时。如果总体标准差为5.8小时,求该周刊订阅者总体每周平均小时,求该周刊订阅者总体每周平均花费在因特网上时间的花费在因特网上时间的95置信区间。置信区间。则该置信区间为:则该置信区间为:5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析6/2/202334345、例题分析、例题分析8.2.1 一个总体均值的区间估计一个总体均值的区间估计 从某证券市场抽取一个由从某证券市场抽取一个由10只股只股票组成的样本,其市盈率分别为:票组成的样本,其市盈率分别为:5 7 9 10 14 23 20 15 3 26试求该市场全部股票平均市盈率试求该市场全部股票平均市盈率的置信度为的置信度为95的置信区间(假定的置信区间(假定股票市盈率近似服从正态分布)。股票市盈率近似服从正态分布)。查表查表总体均值总体均值95置信区间为:置信区间为:即:即:6/2/20233535n是否为大样本是否为大样本 是否已知是否已知是否正态总体是否正态总体 是否已知是否已知用用S 估估计计 用用S 估估计计 增大样本增大样本容量到容量到30以上以上是是是是是是是是否否否否否否否否5.2.1 一个总体均值的区间估计一个总体均值的区间估计6、小结、小结6/2/202336361 1)假定条件)假定条件n n总体服从二项分布总体服从二项分布n n当样本容量很大时,可以由正态分布来近似当样本容量很大时,可以由正态分布来近似2)2)使用正态分布统计量使用正态分布统计量 z z3 3 3)总体比例)总体比例)总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为5.2.2 一个总体比例(成数)的区间估计一个总体比例(成数)的区间估计1、一个总体比例(成数)的置信区间、一个总体比例(成数)的置信区间6/2/20233737 【例例】某城市想要估计职工中女性所占的比例,随机地抽取了100名职工,其中65人为女性职工。试以95%的置信水平估计该城市职工中女性比例的置信区间。该该城城市市职职工工中中女女性性比比例例的的置置信信区区间间为为55.65%74.35%55.65%74.35%解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.965.2.2 一个总体比例的区间估计一个总体比例的区间估计2、例题分析、例题分析6/2/202338381)估计一个总体的方差或标准差2)假设总体服从正态分布3)总体方差 2 2 的点估计量为S2 2,且4)总体方差在1-置信水平下的置信区间为1、一个总体方差的置信区间、一个总体方差的置信区间5.2.3 一个总体方差的区间估计一个总体方差的区间估计6/2/20233939 1-1-1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 分布分布分布分布2、一个总体方差置信区间图示、一个总体方差置信区间图示5.2.3 一个总体方差的区间估计一个总体方差的区间估计6/2/20234040【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,以以95%95%的置信水平建立该种食品重量标准差的置信区间。的置信水平建立该种食品重量标准差的置信区间。25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.33、例题分析、例题分析5.2.3 一个总体方差的区间估计一个总体方差的区间估计6/2/20234141解解解解:已知已知n n2525,1-1-95%,95%,根据样本数据计算得根据样本数据计算得 s s2 2=93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该种食品总体重量标准差的置信区间为该种食品总体重量标准差的置信区间为7.54 13.43g 7.54 13.43g 3、例题分析、例题分析5.2.3 一个总体方差的区间估计一个总体方差的区间估计6/2/20234242一、从某一总体中随机抽取一个容量为100的样本,其均值为81,标准差为12。要求:1、构造总体均值95%置信水平下的置信区间;2、构造总体均值99%置信水平下的置信区间。二、一个容量为400的随机样本取自均值和标 准差均未知的总体。已经计算出下列值:=38532 要求:1、构造总体均值95.45%置信水平下的置信区间;2、构造总体均值99.73%置信水平下的置信区间。4、区间估计练习、区间估计练习5.2.3 一个总体方差的区间估计一个总体方差的区间估计6/2/202343435.3 必要抽样数目的确定 5.3.15.3.1确定样本容量的意义确定样本容量的意义5.3.5.3.推断总体均值所需的样本容量推断总体均值所需的样本容量5.3.35.3.3推断总体成数所需的样本容量推断总体成数所需的样本容量5.3.45.3.4必要样本容量的影响因素必要样本容量的影响因素6/2/20234444样本容量样本容量调查误差调查误差调查费用调查费用小样本容量节小样本容量节小样本容量节小样本容量节省费用但调查省费用但调查省费用但调查省费用但调查误差大误差大误差大误差大大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大找出在规定误差范围找出在规定误差范围内的最小样本容量内的最小样本容量找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量5.3.1 确定样本容量的意义确定样本容量的意义6/2/20234545确确定定方方法法 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。通常未知。一般按以通常未知。一般按以下方法确定其估计值下方法确定其估计值:过去的经验数据;过去的经验数据;试验调查样本的试验调查样本的S S。计算结果通常向上进位计算结果通常向上进位5.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量6/2/20234646 不重复抽样条件下:不重复抽样条件下:确确定定方方法法5.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量6/2/20234747【例例】某食品厂要检验本月生产的某食品厂要检验本月生产的1000010000袋某种产品的重量,根据上袋某种产品的重量,根据上月资料,这种产品每袋重量的标准月资料,这种产品每袋重量的标准差为差为2525克。要求在克。要求在95.4595.45的置信的置信水平下,平均每袋重量的误差范围水平下,平均每袋重量的误差范围不超过不超过5 5克,应抽查多少袋产品?克,应抽查多少袋产品?5.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量例题分析例题分析例题分析例题分析6/2/202348485.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量例题分析例题分析例题分析例题分析6/2/20234949确确定定方方法法 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.250.25。5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量6/2/20235050 不重复抽样条件下:不重复抽样条件下:确确定定方方法法5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量6/2/20235151【例例】某某企业对一批总数为企业对一批总数为5000件的产品进件的产品进行质量检查,过去几次同类调查所得的产品行质量检查,过去几次同类调查所得的产品合格率分别为合格率分别为93、95、96,为了使合格,为了使合格率的允许误差不超过率的允许误差不超过3,在,在99.73 的置信水的置信水平下,应抽查多少件产品?平下,应抽查多少件产品?【分析分析】因为共有三个过去的合格率的因为共有三个过去的合格率的资料,为保证推断的把握程度,应选择资料,为保证推断的把握程度,应选择其中方差最大者,即其中方差最大者,即P=93。例题分析例题分析5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量6/2/20235252例题分析例题分析5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量6/2/20235353q总体方差的大小;总体方差的大小;q极限误差的大小;极限误差的大小;q置信水平;置信水平;q抽样方法;抽样方法;q抽样的组织方式。抽样的组织方式。重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:5.3.4 必要样本容量的影响因素必要样本容量的影响因素6/2/20235454n一、假设检验假设检验假设检验假设检验(Hypothesis Testing)(Hypothesis Testing)问题的提出问题的提出问题的提出问题的提出n二、二、假设检验的基本思想假设检验的基本思想假设检验的基本思想假设检验的基本思想n三、三、有关概念有关概念有关概念有关概念n四、四、两类错误与显著性水平两类错误与显著性水平两类错误与显著性水平两类错误与显著性水平n五、五、检验统计量与拒绝域检验统计量与拒绝域检验统计量与拒绝域检验统计量与拒绝域n六、六、利用利用利用利用P P值进行决策值进行决策值进行决策值进行决策 n七、七、假设检验的步骤假设检验的步骤假设检验的步骤假设检验的步骤5.4 假设检验的基本问题假设检验的基本问题6/2/202355 有许多实际问题,需要通过部分信息量,对某有许多实际问题,需要通过部分信息量,对某种看法进行判定或估计。种看法进行判定或估计。例例1、某企业生产一种零件,以往的资料显示零某企业生产一种零件,以往的资料显示零件平均长度为件平均长度为4cm,标准差为标准差为0.1cm。工艺改革后工艺改革后,抽查抽查100个零件发现其平均长度为个零件发现其平均长度为3.94cm。问:工问:工艺改革后零件长度是否发生了显著变化艺改革后零件长度是否发生了显著变化?例例2、某厂有一天共生某厂有一天共生产产了了2000件产品,按国家件产品,按国家标准,次品率不得超过标准,次品率不得超过3%才能出厂。现从该批产品才能出厂。现从该批产品中随机抽取中随机抽取100件,发现其中有件,发现其中有2件次品,件次品,问这批产问这批产品能否出厂品能否出厂。一、假设检验一、假设检验(Hypothesis Testing)问题的提出问题的提出6/2/202356 例1要判明判明工艺改革后零件平均长度是否仍为4cm;例2要判明判明该批产品的次品率是否低于3%。进行这种判断的信息来自所抽取的样本这两个例子中都是要对某种对某种“陈述陈述”做出判做出判断断:所谓假设检验假设检验,就是事先对总体参数或总体分就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否拒绝原假设。有显著差异,从而决定是否拒绝原假设。假设检验假设检验分两类分两类:(1)参数假设检验;(2)非参数检验或自由分布检验。一、假设检验一、假设检验(Hypothesis Testing)问题的提出问题的提出6/2/202357 通过提出假设,利用通过提出假设,利用“小概率原理小概率原理”和和“概率概率反证法反证法”,论证假设真伪的一种统计分析方法。,论证假设真伪的一种统计分析方法。1、小概率原理:小概率原理:也就是实际推断原理,它认也就是实际推断原理,它认为在一次实验中,概率很小的事件,实际上几乎为在一次实验中,概率很小的事件,实际上几乎是不可能发生的。是不可能发生的。2、概率反证法:概率反证法:如果在其他因素给定的前提如果在其他因素给定的前提下,要证明某一事实(比如对总体参数的假定)下,要证明某一事实(比如对总体参数的假定)是否成立,是否成立,首先假设该事实成立,然后在该事实首先假设该事实成立,然后在该事实成立的前提下,计算由该事实和样本构造的统计成立的前提下,计算由该事实和样本构造的统计量的取值,再根据该统计量的分布,判断已经观量的取值,再根据该统计量的分布,判断已经观测到的样本信息出现的概率是否为小概率,以此测到的样本信息出现的概率是否为小概率,以此来证明该事实是否成立。来证明该事实是否成立。二、假设检验的基本思想二、假设检验的基本思想6/2/202358 因此,置信度大小的不同,有可能做出不同的判断。3、假设检验是基于样本资料来推断总体特征假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信度下进行的,的,而这种推断是在一定概率置信度下进行的,而而非严格的逻辑证明非严格的逻辑证明。在例例1中,要判断判断工艺改革后零件平均长度是否仍为4cm,可先假设先假设仍为4cm,根据样本平均数的抽样分布理论,则样本点应以较大的可能性(置信度)落在以4为中心的某一范围内。二、假设检验的基本思想二、假设检验的基本思想6/2/202359 在给定置信度在给定置信度1-下下(比如比如99%):):其中:其中:0为所要检验的假设(这里为为所要检验的假设(这里为4cm)为总体标准差(这里为为总体标准差(这里为0.1cm)n为样本容量为样本容量(这里为(这里为100)Z/2为置信度为置信度1-下,标准正态分布对应的右尾临界值下,标准正态分布对应的右尾临界值二、假设检验的基本思想二、假设检验的基本思想6/2/202360 如果取置信度为0.99,则显著性水平=0.01,对应的临界值为Z/2=2.58 换言之,如果原假设为真,则样本测算值将以99%的可能性落在-2.58,2.58区间内。通过一组(实际)样本计算得:说明小概率事件小概率事件(标准化后的样本均值只有1%的可能性落在-2.58,2.58区间外)发生了发生了。这是不合理的,应拒绝原假设这是不合理的,应拒绝原假设。二、假设检验的基本思想二、假设检验的基本思想6/2/202361(一)原假设(一)原假设(null hypothesis)1.研研究者想收集证据究者想收集证据予以反对予以反对的假设的假设2.又称“零假设”3.总是有符号 ,或 4.表示为 H0nH0:=某一数值 n指定为符号=,或 n例如,H0:10cm三、有关概念三、有关概念6/2/2023621.研究研究者想收集证据者想收集证据予以支持予以支持的假设的假设2.也称“研究假设”3.总是有符号 ,或 4.表示为 H1nH1:某一数值,或 某一数值n例如,H1:10cm,或 10cm(二)备择假设(二)备择假设(alternative hypothesis)三、有关概念三、有关概念6/2/2023631.原原假假设设和和备备择择假假设设是是一一个个完完备备事事件件组组,而而且且相互对立相互对立n在在一一项项假假设设检检验验中中,原原假假设设和和备备择择假假设设必必有有一一个成立,而且只有一个成立个成立,而且只有一个成立2.先确定备择假设,再确定原假设先确定备择假设,再确定原假设 3.含有等号含有等号“=”的符号总是放在原假设上的符号总是放在原假设上 4.因因研研究究目目的的不不同同,对对同同一一问问题题可可能能提提出出不不同同的假设的假设如何提出假设如何提出假设三、有关概念三、有关概念6/2/202364n【例例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设如何提出假设如何提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中的陈述中的陈述中的陈述 。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500”或或“”的假设检验,称为的假设检验,称为单侧检验单侧检验或单尾检验或单尾检验(one-tailed test)n备择假设的方向为备择假设的方向为“”,称为,称为右侧检右侧检验验(三)双侧检验与单侧检验(三)双侧检验与单侧检验三、有关概念三、有关概念6/2/202367注:研究者感兴趣的是备择假设,单侧假设的方研究者感兴趣的是备择假设,单侧假设的方向是按向是按备侧假设的方向备侧假设的方向来说的来说的。假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0(三)双侧检验与单侧检验(三)双侧检验与单侧检验三、有关概念三、有关概念6/2/202368 由于假设检验是根据有限的随机样本信息来推断总体特征,而样本的随机性可能致使判断出错。1、第、第I类错误类错误 当原假设为真时,而拒绝原假设所犯的错误,称称为为第第I类错误类错误或弃真错误弃真错误。易知犯第I类错误的概率就是显著性水平:2、第、第II类错误类错误 当原假设为假时,不拒绝原假设所犯的错误,称为称为第第II类错误类错误或采伪错误采伪错误。犯第II类错误的概率常用表示:四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平6/2/2023691)犯第I类错误与犯第II类错误的概率存在此消彼长的关系;2)若要同时减少 与 ,须增大样本容量n;3)通常的作法是通常的作法是,取较小显著性水平,即控制犯第I类错误的概率在较小的范围内;4)在犯第II类错误的概率不好控制时,将“接受原假设”更倾向于说成“不拒绝原假设”。注意:注意:四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平6/2/2023703、假设检验中的四种可能情况、假设检验中的四种可能情况 H0为真 H0不真 不拒绝H0 Good Bad/Type II error 拒绝H0 Bad/Type I error Good4、影响、影响 错误的因素错误的

    注意事项

    本文(参数估计与假设检验课件.ppt)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开