第4章 推断统计(参数估计与假设检验).ppt
《第4章 推断统计(参数估计与假设检验).ppt》由会员分享,可在线阅读,更多相关《第4章 推断统计(参数估计与假设检验).ppt(109页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学应用统计学Applied StatisticsApplied Statistics4-12011年8月重庆工商大学重庆工商大学应用应用统计统计应应 用用 统统 计计 学学Applied StatisticsApplied Statistics应用统计学应用统计学Applied StatisticsApplied Statistics4-2不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。Gudmund R.Iversen统计名言统计名言应用统计学应用统计学Applied StatisticsApplied Statistics4-3怎样解决下面的问题?怎样解
2、决下面的问题?l一个水库里有多少鱼?l一片原始森林里的木材储蓄量有多少?l一批灯泡的平均使用寿命是多少?l一批产品的合格率是多少?l怎样才能知道这些问题的答案?你不可能把一个水库里的水抽干去称鱼的重量,不可能把森林伐完去量木材有多少,不可能把一批灯泡都用完去计算它的平均寿命,也不可能把每一件产品都检测完才知道它的合格率第第 4 章章 推断统计推断统计4.1 怎样进行推断?怎样进行推断?4.2 估计总体参数估计总体参数4.3 检验总体假设检验总体假设4.1 怎样进行推断?怎样进行推断?4.1.1 用估计量估计总体参数用估计量估计总体参数 4.1.2 用什么方法进行估计?用什么方法进行估计?4.1
3、.3 用什么样的估计量去估计?用什么样的估计量去估计?第第 4 章章 推断统计推断统计4.1.1 用估计量估计总体参数用估计量估计总体参数4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied StatisticsApplied Statistics4-72008年5月关心总体的哪些参数?关心总体的哪些参数?一个总体一个总体两个总体两个总体参数参数符号符号估计量估计量参数参数符号符号估计量估计量均均值值均均值值差差比例比例比例差比例差方差方差方差比方差比应用统计学应用统计学Applied StatisticsApplied Statistics4-81.估计量:用于估计总体参数
4、的随机变量n如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等n例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样本均值如果样本均值 x x =80=80,则,则8080就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimator&estimated value)4.1.2 用什么方法进行估计?用什么方法进行估计?4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied StatisticsApplied Statistics4-10点估计点
5、估计(point estimate)1.用样本的估计量的某个取值直接作为总体参数的估计值 例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息n n虽虽然然在在重重复复抽抽样样条条件件下下,点点估估计计的的均均值值可可望望等等于于总总体体真真值值,但但由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值n n一一个个点点估估计计量量的的可可靠靠性性是是由由它它的的
6、抽抽样样标标准准误误差差来来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 应用统计学应用统计学Applied StatisticsApplied Statistics4-11区间估计区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围,该区间由样本统计量加减估计误差而得到围,该区间由样本统计量加减估计误差而得到2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体体参数的接近程度给出一个概
7、率度量参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限应用统计学应用统计学Applied StatisticsApplied Statistics4-122008年5月区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的
8、样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x应用统计学应用统计学Applied StatisticsApplied Statistics4-131.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-n 为是总体参数未在区间内的比例3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平置信水平(confidence level)应用统计学应用统计学Applied St
9、atisticsApplied Statistics4-141.由样本统计量所构造的总体参数的估计区间称为由样本统计量所构造的总体参数的估计区间称为置信区间置信区间2.统计学家在某种程度上确信这个区间会包含真正统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包间,我们无法知道这个样本所产生的区间是否包含总体参数的真值含总体参数的真值n n我们只能是希望这个区间是大量包含总体参数真值的我们只能是希望这个区间
10、是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个值的区间中的一个n n总体参数以一定的概率落在这一区间的表述是错误的总体参数以一定的概率落在这一区间的表述是错误的置信区间置信区间(confidence interval)应用统计学应用统计学Applied StatisticsApplied Statistics4-152008年5月置信区间置信区间(95%的置信区的置信区间间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值我没
11、有抓住参数!我没有抓住参数!应用统计学应用统计学Applied StatisticsApplied Statistics4-162008年5月置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2/2 24.1.3 用什么样的估计量去估计?用什么样的估计量去估计?4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied StatisticsApplied Statistics4-18无偏性无偏性(unbiasedn
12、ess)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数P P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏应用统计学应用统计学Applied StatisticsApplied Statistics4-19有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()应用统计学应用统计学Applied StatisticsApplied Statistics4-20一致性一致性(consistency)一致
13、性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()4.2 估计总体参数估计总体参数 4.2.1 总体均值的估计总体均值的估计 4.2.2 总体比例的估计总体比例的估计 4.2.3 总体方差的估计总体方差的估计第第 4 章章 推断统计推断统计4.2.1 总体均值的估计总体均值的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied StatisticsApplied Statistics4-23一个总体均值的区间估计一个总体均值的区间估
14、计总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间置信区间1.大样本大样本(n n 30)30)2.小样本小样本(n n 30)30),总体方差,总体方差()未未知知样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差应用统计学应用统计学Applied StatisticsApplied Statistics4-24一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析大样本大样本)【例例例例】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(单单位位:周周岁岁)数数据据
15、如如下表。试建立投保人年龄下表。试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532应用统计学应用统计学Applied StatisticsApplied Statistics4-25一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析大样本大样本)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样
16、本本数数据据计算得:计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁 统计函数统计函数统计函数统计函数CONFIDENCECONFIDENCE应用统计学应用统计学Applied StatisticsApplied Statistics4-26一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析小样本小样本)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使
17、使用用寿寿命命(单单位位:小小时时)如下。建立该批灯泡平均使用寿命如下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470应用统计学应用统计学Applied StatisticsApplied Statistics4-27一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析小样本小样本)解:解:解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=95%=
18、95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时应用统计学应用统计学Applied StatisticsApplied Statistics4-28两个总体均值之差的区间估计两个总体均值之差的区间估计(独立大样本独立大样本)1 1-2 2在在1-1-置信水平下的置信水平下的置信区间置信区间l独立大样本独立大样本(n n1 1 30 30,n n2 2 3
19、0)30)(x1 -x2)分位数值分位数值(x1 -x2)的标准误差的标准误差应用统计学应用统计学Applied StatisticsApplied Statistics4-29两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本:1 1 )l两个两个正态总体,方差正态总体,方差未知但相等:未知但相等:1 1=2 2 两个独立小样本两个独立小样本(n n1 1 3030和和n n2 2 30)30)估计估计量量 x x1 1-x x2 2的标准化的标准化总体方差的合并估计量总体方差的合并估计量应用统计学应用统计学Applied StatisticsApplied Stat
20、istics4-30两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本:1 1 )l两个两个正态总体,方差正态总体,方差未知且不等:未知且不等:1 1 2 2 两个独立小样本两个独立小样本(n n1 1 3030和和n n2 2 30)30)估计估计量量 x x1 1-x x2 2的标准化的标准化自由度自由度应用统计学应用统计学Applied StatisticsApplied Statistics4-31两个总体均值之差的区间估计两个总体均值之差的区间估计(匹配样本匹配样本)l两个匹配大样本(n1 30和n2 30)d 分位数值分位数值 d 的标准误差的标准误差 d
21、d=(=(1 1-2 2)在在1-1-置信水平下的置信水平下的置信区间置信区间l两个匹配小样本(n1 30和n2 30)应用统计学应用统计学Applied StatisticsApplied Statistics4-322008年5月两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)【例例例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212名名工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(单单位位:分分钟钟)下下如如表表。假假定定两
22、两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需平均时间差值的置信区间需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1应用统计学应用统计学Applied Statis
23、ticsApplied Statistics4-33两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)解解解解:根据样本数据计算得根据样本数据计算得 合并估计量为合并估计量为两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟应用统计学应用统计学Applied StatisticsApplied Statistics4-34两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析匹配样本匹配样本)【例例例例】由由 1010名名学学 生生 组组 成成 一一 个个随随 机机
24、样样 本本,让让他他们们分分别别采采用用A A和和B B两两套套试试卷卷进进行行 测测 试试,结结 果果如如下下表表 。试试建建立立 两两 种种 试试 卷卷 分分数数 之之 差差 d d=1 1-2 2 95%95%的的置置信信区间区间 1010名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试试卷卷B差差值值d17871726344193726111489845691741754951-27685513876601698577810553916应用统计学应用统计学Applied StatisticsApplied Statistic
25、s4-35两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析匹配样本匹配样本)解解解解:根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.36.3分分15.715.7分分4.2.2 总体比例的估计总体比例的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied StatisticsApplied Statistics4-37一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)1.1.设设总总体体服服从从二二项项分分布布,即即X X(n n,p p),P P为为n n次次独独立立伯伯努努利利试验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第4章 推断统计参数估计与假设检验 推断 统计 参数估计 假设检验
限制150内