统计学05第五章抽样推断.pptx
《统计学05第五章抽样推断.pptx》由会员分享,可在线阅读,更多相关《统计学05第五章抽样推断.pptx(116页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章抽抽 样样 推推 断断 第第一一节节 抽样推断及其特点抽样推断及其特点 第第二二节节 总体参数估计总体参数估计 第第三三节节 假设检验概述假设检验概述4/24/20221第第一一节节抽样推断及其特点抽样推断及其特点1.1 抽样推断的特点抽样推断的特点1.2 总体参数和样本统计量总体参数和样本统计量1.3 抽样推断的基本条件抽样推断的基本条件1.4 抽样推断的误差抽样推断的误差4/24/202221.1 抽样推断及其特点抽样推断及其特点抽样推断抽样推断(统计推断统计推断) 按随机原则从总体中抽取部分单位构成按随机原则从总体中抽取部分单位构成样本,在一定的可靠程度下,根据样本的数样本,
2、在一定的可靠程度下,根据样本的数量特征对总体的数量特征加以推断的方法。量特征对总体的数量特征加以推断的方法。抽样推断的方法抽样推断的方法: :总体参数的估计总体参数的估计总体参数的假设检验。总体参数的假设检验。4/24/202231.1 抽样推断及其特点抽样推断及其特点抽样推断的特点抽样推断的特点1. 抽样推断必须遵循随机原则。抽样推断必须遵循随机原则。2. 对抽样误差可以事先加以计算和控制。对抽样误差可以事先加以计算和控制。3. 具有经济性、时效性,应用广泛的特点。具有经济性、时效性,应用广泛的特点。4. 可对全面调查的结果进行检验和修正。可对全面调查的结果进行检验和修正。4/24/2022
3、4 利用样本统计量推断总体参数利用样本统计量推断总体参数目目 的的特特 点点易易 求求 未未 知知 不唯一、随机变量不唯一、随机变量 唯一、常量唯一、常量性性 质质 样本的指标样本的指标 总体的指标总体的指标含含 义义1.2 总体参数和样本统计量总体参数和样本统计量常常 见见 XPX 、 xSpx、样样 本本 统统 计计 量量总总 体体 参参 数数总体参数与样本统计量的比较总体参数与样本统计量的比较4/24/20225 NXXX 2 2xxx S 1 n1.2 总体参数和样本统计量总体参数和样本统计量NXXXXN 21nxxxxn 21NN P1 nn p1 P PP 1 p pp 1 nxx
4、 x 2 样样 本本 统统 计计 量量总体参数和样本统计量的计算公式总体参数和样本统计量的计算公式 总总 体体 参参 数数4/24/202261.3 抽样推断的基本条件抽样推断的基本条件 抽样推断的基本条件抽样推断的基本条件 1. 选择统计量选择统计量优良估计量优良估计量。2. 合适的允许误差合适的允许误差精确性精确性。3. 可接受的置信度可接受的置信度可靠性可靠性。精确性和可靠性是一对矛盾。要根据问精确性和可靠性是一对矛盾。要根据问题的性质和研究的需要在二者间权衡。题的性质和研究的需要在二者间权衡。4/24/202271.4 抽样推断的误差抽样推断的误差 统统 计计 误误 差差登记性误差登记
5、性误差代表性误差代表性误差系统误差系统误差抽样误差抽样误差可消除可消除可消除可消除可控制可控制统计误差的分类统计误差的分类4/24/202281.4 抽样推断的误差抽样推断的误差 抽样误差抽样误差1. 抽样实际误差:抽样实际误差:对某一样本而言,由随机因素引起的对某一样本而言,由随机因素引起的样本统计量与总体参数在数量上的差异样本统计量与总体参数在数量上的差异就是抽样实际误差。就是抽样实际误差。xX 4/24/202291.4 抽样推断的误差抽样推断的误差 2. 抽样平均(标准)误差抽样平均(标准)误差:抽样平均误差是抽样平均数的标准差,它抽样平均误差是抽样平均数的标准差,它反映样本平均数(样
6、本成数)与总体平均数反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均差异程度。(总体成数)之间的平均差异程度。 nnpx 1 X PP4/24/2022101.4 抽样推断的误差抽样推断的误差 总体标准差和成数的确定:总体标准差和成数的确定:总体变化不大,采用过去总体指标数值总体变化不大,采用过去总体指标数值做做代替代替;用样本标准差用样本标准差(x) 或样本成数或样本成数 p 替代;替代;对于成数,可取对于成数,可取 P = 0.5;如果有多个;如果有多个 P 值,值,取其最接近取其最接近 0.5 的的P 做替代。做替代。4/24/2022111.4 抽样推断的误差抽样推断的误差
7、 3. 抽样极限(允许)误差抽样极限(允许)误差是样本统计量与被估计的总体参数之是样本统计量与被估计的总体参数之绝对离差的最大允许值,常用绝对离差的最大允许值,常用表示,表示,可简称为可简称为极限误差极限误差或或允许误差允许误差。pxPpXx ;4/24/2022121.4 抽样推断的误差抽样推断的误差 和和的关系:的关系: ZZZ 概率度,概率度,Z 表示表示以抽样平均误差为标以抽样平均误差为标准单位对极限误差的度量值。由准单位对极限误差的度量值。由Z 确定的概确定的概率保证程度率保证程度F( (Z)置信度。置信度。4/24/202213极限误差标准化的意义:极限误差标准化的意义:ZN (
8、0, 1 ) Z Z Z0 S X X X 2 , X Nx1.4 抽样推断的误差抽样推断的误差 4/24/202214第二节第二节总体参数的估计总体参数的估计2.1 总体参数估计概述总体参数估计概述2.2 点估计点估计2.3 区间估计区间估计2.4 样本容量的确定样本容量的确定4/24/2022152.1 总体参数估计概述总体参数估计概述 总体参数估计就是以样本统计量来估总体参数估计就是以样本统计量来估计总体参数。计总体参数。参数估计要求:参数估计要求:1. 精确性精确性适当的极限误差范围;适当的极限误差范围;2. 可靠性可靠性估计结果正确的概率。估计结果正确的概率。参数估计参数估计点估计点
9、估计和和区间估计区间估计。4/24/2022162.2 点估计点估计点估计点估计就是根据总体参数与样本统计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量量之间的内在联系,直接以样本统计量作为相应总体参数的估计值,点估计又作为相应总体参数的估计值,点估计又称为称为定值估计定值估计。常用的点估计量有:常用的点估计量有:222()1xxXxPpSn 4/24/202217优良估计量的三个标准:优良估计量的三个标准: X x x E 样样本本平平均均数数 P p p E 样样本本成成数数E (统计量统计量) 总体参数总体参数1.无偏性:无偏性:2.2 点估计点估计4/24/2022182
10、.一致性:一致性: 1 Xx P limn1 P limn 参参数数总总体体统统计计量量本本样样 优良估计量的三个标准:优良估计量的三个标准:2.2 点估计点估计4/24/202219 n X x xXX优良估计量的三个标准:优良估计量的三个标准:2.2 点估计点估计4/24/2022203. 有效性:有效性: 其其他他估估计计量量优优良良估估计计量量22 c x 22 优良估计量的三个标准:优良估计量的三个标准:2.2 点估计点估计4/24/202221x Xp P X2 122 nxxxS p p p P 122 优良估计量优良估计量总体参数总体参数2.2 点估计点估计4/24/20222
11、2推断总体推断总体反映样本的反映样本的离散程度离散程度作用作用公式公式符号符号样样 本本 方方 差差 nxx 2 12 nxx x2 xS22.2 点估计点估计4/24/202223x XPp 总体参数的点估计总体参数的点估计:原则原则:总体参数估计值总体参数估计值就取就取统统计量的值计量的值作用:作用:区间估计的基础。区间估计的基础。优优 点点 :1.简简 单单 明明 了了 ;2.能能 提提 供供 具具 体体 估估 计计 值值 。缺缺 点点 :1.无无 法法 提提 供供 误误 差差 情情 况况 ;2.估估 计计 的的 可可 靠靠 程程 度度 无无从从 知知 晓晓 。2.2 点估计点估计4/2
12、4/2022242.3 区间估计区间估计 一一 区间估计的含义:区间估计的含义:概率概率 P1?区间大小区间大小 估计的精确性;估计的精确性;概率高低概率高低 估计的准确性。估计的准确性。总体参数总体参数1 24/24/202225 1. 区间的确定:区间的确定: 1.区间的中心区间的中心 2. 统计量的值,如:统计量的值,如:2.区间的半径区间的半径 3. 允许(极限)误差允许(极限)误差。x x xpx、2.3 区间估计区间估计4/24/202226 2. 概率的确定:概率的确定: X x x 的的分分布布Xxx x xx x xx x x2.3 区间估计区间估计4/24/202227只要
13、只要样本平均数样本平均数 在以在以总体总体平均数平均数 为中心、以为中心、以 为半径的为半径的区间内,则区间内,则总体平均数总体平均数 就会就会落在以落在以样本平均数样本平均数 为中心、为中心、以以 为半径的区间内。为半径的区间内。XXxx 2. 概率的确定:概率的确定:2.3 区间估计区间估计4/24/202228 XxXP 1 xXxP 1的的分分布布 x SXXx x xx2.3 区间估计区间估计4/24/202229S XN x 2 , XXXZ Z0 Z Z 和和 极限误差的标准化:极限误差的标准化: Xx Z NZ 10,S 2.3 区间估计区间估计4/24/202230标准化的意
14、义:标准化的意义:ZN ( 0, 1 ) Z Z Z0 S X X X 2 , X Nx2.3 区间估计区间估计4/24/202231二二 总体平均数的区间估计:总体平均数的区间估计: x x 1Z F: X , ZF ZF Z Zx2.3 区间估计区间估计4/24/2022322.3 区间估计区间估计(1)抽抽样样,计计算算 x区区间间的的中中心心(2)计算抽样平均误差:计算抽样平均误差: nX (3) 查查表表根根据据ZFZ(4)计计算算极极限限误误差差: Z估估计计区区间间半半径径(5)写出估计区间写出估计区间 xxX,:内内 容容步骤步骤 总体平均数的估计:总体平均数的估计:已知已知给
15、定给定,. 1XZF 4/24/202233 【例例 5-2】某地区电视台委托调查公司估计某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随该地区居民平均每日看电视时间。调查公司随机抽取了机抽取了100名居民进行调查,样本数据显示名居民进行调查,样本数据显示平均每人每天看电视时间为平均每人每天看电视时间为 4 小时。如果已知小时。如果已知总体的标准差总体的标准差 = 1.5 小时。试求该地区内居小时。试求该地区内居民每天看电视的平均时间的置信区间。民每天看电视的平均时间的置信区间。(置信度是(置信度是 95%)2.3 区间估计区间估计4/24/202234 小时小时【解】【解
16、】15. 01005 . 1 n X %9541005 . 1 ZF x n X小时小时小时小时已知:已知: 96. 1%95 ZZF由由 小时小时29. 015. 096. 1 Z 小时小时29. 4,71. 329. 04,29. 04: X2.3 区间估计区间估计4/24/2022352.3 区间估计区间估计(1)抽抽样样,计计算算 x区区间间的的中中心心(2)计算抽样平均误差:计算抽样平均误差: nX (3) 查查表表计计算算 Z ZF(4):和和根根据据 x xxX,:内内 容容步骤步骤 总体平均数的估计:总体平均数的估计:已知已知给定给定,. 2X 4/24/202236 【例例
17、5-3】某地区电视台委托调查公司估计某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随该地区居民平均每日看电视时间。调查公司随机抽取了机抽取了100名居民进行调查,样本数据显示名居民进行调查,样本数据显示平均每人每天看电视时间为平均每人每天看电视时间为 4 小时。如果已知小时。如果已知总体的标准差总体的标准差 = 1.5 小时。试求该地区内居小时。试求该地区内居民每天看电视的平均时间的置信区间。民每天看电视的平均时间的置信区间。(要求估计误差不超过(要求估计误差不超过27分钟分钟)2.3 区间估计区间估计4/24/202237 小时小时【解】【解】15. 01005 . 1
18、n X 小时小时分钟分钟小时小时小时小时已知:已知:45. 02741005 . 1 x n X 315. 045. 0 Z 小时小时45. 4,55. 345. 04,45. 04: X %73.99 ZF2.3 区间估计区间估计4/24/202238 xxX,:2.3 区间估计区间估计3总体方差未知,总体平均数的估计总体方差未知,总体平均数的估计总体方差未知,可用样本标准差总体方差未知,可用样本标准差 S 代替总代替总体标准差体标准差,计算抽样平均误差,计算抽样平均误差。分布分布nXxXx xSt 12 nt t4/24/202239 N t x S n 10,分布分布大大自由度自由度大,
19、大,当当 正态分布与正态分布与 t 分布的比较分布的比较0 , N 10 , t 202.3 区间估计区间估计4/24/202240 【例例 5-4】 从某校学生中随机抽取从某校学生中随机抽取25人,调查到他们平均每天参加体育人,调查到他们平均每天参加体育锻炼的时间为锻炼的时间为25分钟,标准差为分钟,标准差为8分分钟。试以钟。试以95%的置信水平估计该校学的置信水平估计该校学生平均每天参加体育锻炼的时间。生平均每天参加体育锻炼的时间。2.3 区间估计区间估计4/24/202241 分钟分钟【解】【解】6 . 1258 n xS %9582525 ZF xS x n分钟分钟分钟分钟已知:已知:
20、 %95 tF由由 分钟分钟3 .28, 7 .213 . 325, 3 . 325: X 06421252050.t. 2.3 区间估计区间估计 分钟分钟30. 36 . 1064. 2 t4/24/202242三三 总体成数的区间估计总体成数的区间估计成数是一个特殊的平均数,它是交成数是一个特殊的平均数,它是交替标志的平均数。替标志的平均数。可以应用总体平均数的估计方法来可以应用总体平均数的估计方法来对总体成数进行估计。对总体成数进行估计。2.3 区间估计区间估计4/24/202243抽样,计算抽样,计算 估计区间的中心估计区间的中心(1)p计算计算(2) nppp 1 根据根据(3) 查
21、表查表ZFZ计算计算(4) Z写出:写出:(5) ppP,:2.3 区间估计区间估计内内 容容给定给定F( Z ),总体成数,总体成数P 的区间估计:的区间估计:步骤步骤4/24/202244【例例5-5】某工厂要估计一批总数某工厂要估计一批总数5 000件的产品的废品率,于是随机件的产品的废品率,于是随机抽出抽出 400 件产品进行检测,发现有件产品进行检测,发现有32 件废品。在置信度为件废品。在置信度为 90% 的要求的要求下,试给出该批产品的废品率的区下,试给出该批产品的废品率的区间估计。间估计。2.3 区间估计区间估计4/24/202245%840032 p样样本本废废品品率率【解解
22、】 %9032,4001 ZFn n 件件,件件已已知知:2.3 区间估计区间估计 npp 1 %36. 140008. 0108. 0 645. 1%90 ZZF由由%24. 2%36. 1645. 1 Z %24.10%,76. 5%24. 28%,24. 2%8: P4/24/2022462.3 区间估计区间估计抽样,计算抽样,计算 估计区间的中心估计区间的中心(1)p计算计算(2) nppp 1 写出:写出:(4) ppP,:计算计算(3)ppZ ZF查表查表内内 容容给定给定,总体成数,总体成数P 的区间估计:的区间估计:步骤步骤4/24/202247【例例5-6】某商场经理想了解顾
23、某商场经理想了解顾客对他们服务的满意度,随机抽客对他们服务的满意度,随机抽取取100名顾客进行调查,知名顾客进行调查,知90人满人满意他们的服务。要求估计误差范意他们的服务。要求估计误差范围不超过围不超过6%,试进行区间估计。,试进行区间估计。 2.3 区间估计区间估计4/24/202248% n n 6901001 人人人人已知已知% nnp90100901 【解】【解】 nPP 1 %31009 . 019 . 0 2%3%6 Z %45.95 ZF %96%,84%6%90%,6%90: P2.3 区间估计区间估计4/24/2022492.4 样本容量的确定样本容量的确定样本必要单位数的
24、确定:样本必要单位数的确定:重重置置抽抽样样下下样样本本平平均均数数 222 Zn解方程:解方程: Z n Z n4/24/20225022222 ZNZN x 样本必要单位数的确定:样本必要单位数的确定: Z x222 221P P PZ P PZ N P PZNP 11222222xZ N N22 Z 2.4 样本容量的确定样本容量的确定重重 置置不不 重重 置置样本样本平均数平均数样本样本成数成数4/24/2022512.4 样本容量的确定样本容量的确定应注意的问题应注意的问题 1. 2或或P 往往未知,要用替代值:往往未知,要用替代值:用历史资料代替;用历史资料代替;用试验性调查中方差
25、最大值代替;用试验性调查中方差最大值代替;对成数,用对成数,用2 = 0.25 代替。代替。4/24/2022522.4 样本容量的确定样本容量的确定2. 对多主题问题,可取各问题样本对多主题问题,可取各问题样本容量的最大值进行调查,这样既能满容量的最大值进行调查,这样既能满足各方面的需要,还能简化抽样工作。足各方面的需要,还能简化抽样工作。3. 样本单位数是整数,如计算结果样本单位数是整数,如计算结果为小数,不采用为小数,不采用“四舍五入法四舍五入法”,而,而采用采用“过剩近似法过剩近似法”取整。取整。4/24/202253【例例5-7】某企业生产的电子元件,近年来某企业生产的电子元件,近年
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 05 第五 抽样 推断
限制150内