计算机数据库(经济会计类)抽样分布随堂讲义剖析讲解学习.ppt
-
资源ID:62815578
资源大小:1.30MB
全文页数:37页
- 资源格式: PPT
下载积分:20金币
快捷下载

会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
计算机数据库(经济会计类)抽样分布随堂讲义剖析讲解学习.ppt
计算机数据算机数据库(经济会会计类)抽抽样分布随堂分布随堂讲义剖析剖析一、抽样调查的概念及应用(一)抽样的概念抽样是从所研究的总体中随机地抽取其中一部分总体单位的过程。抽得的部分总体单位称为样本。其基本要求是要保证所抽取的样本对总体具有充分的代表性。抽样的目的是从被抽取的样本出发,分析推断总体的特征。(二)抽样的应用 1.当不能采用全面调查了解总体的信息时,可以采用抽样做出对总体特征的推断。2.当某些场合没有必要采用全面调查时,可以利用抽样调查做出推断。3.抽样调查可以辅助检验普查获得的结果的准确程度。2022/11/222 2二、抽样的有关概念(一)总体和样本 1.总体:是指所研究对象的全体,是由许多客观存在的具有某种共同性质的单位构成。2.样本:是从总体中抽取部分总体单位构成的集合,是总体的一部分。(二)参数和统计量 1.参数:也称总体参数,是反映总体数量特征的指标。2.统计量:也称样本统计量,是不含任何总体参数的样本函数。2022/11/223 3二、抽样的有关概念(三)抽样方法 (四)抽样方法 随机误差是指在抽样中遵循了随机原则,样本指标与相应的待推断的总体实际指标之间的偏差。也称抽样误差。误差的平均值:抽样方法不重复抽样重复抽样从总体中抽取一个样本单位,记录其标志值后,又将其放回总体中并继续参加下一轮样本单位抽取,如此反复,直至抽足样本所需的所有样本单位数目为止。每次从总体中抽取一个样本单位,记录其标志值并且不放回总体参加下一轮样本单位抽样,直至抽足样本所需的所有样本单位数目为止。2022/11/224 4第二节 抽样分布第五章 抽样分布2022/11/225 5一、抽样分布的概念 抽样分布即指样本统计量的分布。从一个总体中可以抽取许多个样本,统计量是关于样本的函数,所以统计量是随样本变化而变化的随机变量,样本统计量的全部可能取值及其相应的概率分布就是(统计量的)抽样分布。常用的抽样分布有样本平均数的抽样分布、样本比例的抽样分布、样本方差的抽样分布。2022/11/226 6二、样本平均数的抽样分布 样本平均数的抽样分布即由总体中全部样本平均数的可能取值及与之对应的概率组成。图图5-4 5-4 样本均值抽样分布的形成过程样本均值抽样分布的形成过程2022/11/227 7二、样本平均数的抽样分布 (一)的数学期望 即所有可能 的平均值 (二)的方差 (三)抽样分布的形态 样本容量越大,的抽样分布与正态分布近似程度越高。(四)的抽样平均误差2022/11/228 8二、样本平均数的抽样分布 (五)修正系数 如果是有限总体且不重复抽样,那么样本方差和平均数 的抽样平均误差公式要做一定的修正,修正系数为 。(六)标准化变换 标 准 正 态 分 布 的 分 布 函 数 记 为 ,即:三个性质:1.2.3.2022/11/229 9二、样本平均数的抽样分布总体的分布的抽样分布(n=30)的抽样分布(n=5)的的抽样分布 (n=2)不同样本容量下的抽样分布 2022/11/2210 10二、样本平均数的抽样分布 【例5-3】2013年我国汽车行业持续发展,政府为了调查北京某一地区私家车市场情况,从该地区的车主中随机抽取200人做样本。(1)假设该地区私家车平均价格为18.5万元,总体标准差等于4万元,试描述 的抽样分布,并计算其抽样平均误差;(2)大于18万元且小于19万元的概率是多少?(3)如果总体方差未知,那么 的抽样分布是怎样的?2022/11/2211 11二、样本平均数的抽样分布 解:已知 ,(1)根据中心极限定理,大样本且总体方 差 已 知 时,的 抽 样 分 布 是 正 态 分 布,且 ,故 抽样平均误差 (2)(3)如果总体方差未知,则 的抽样分布将服从t分布。2022/11/2212 12二、样本平均数的抽样分布 【例5-4】我国第一艘航母“辽宁号”航母标准排水量55000吨。假设在某次任务中规定某型号舰载机载20架,总重量不得超过700吨,同时假定每架舰载机的重量服从正态分布,平均重量32吨,标准差为5吨,问随机停放在航母上20架该型号舰载机,超重的概率为多少?2022/11/2213 13二、样本平均数的抽样分布 解:已知 ,因为规定中要求最大载重量为700吨,限 载 20架。所 以,如 果 样 本 平 均 数 则会超重。由于总体服从正态分布,总体方差已知,当小样本时,根据中心极限定理,的抽样分布仍服从正态分布。即 ,则随机停放20架该型号舰载机超重的概率是 因此,超重的概率不超过0.4%。2022/11/2214 14三、样本比例p 的抽样分布 由概率论知识我们有以下结论:当样本容量足够大时,样本比率p的抽样分布近似服从正态分布。其大样本的标准是:同时满足 或 的n 为大样本标准,如果总体比率P 未知,可用样本比率p 代替。(一)p 的数学期望和方差 (二)p 的抽样分布的形态 (三)p 的抽样平均误差 (四)修正系数 (五)标准化变换 2022/11/2215 15三、样本比例p 的抽样分布 【例5-5】根据以往的经验,某科目学生考试通过率为90%。现从该科目的考生中随机抽取200人进行检验,问样本通过率不低于85%的概率是多少?解:解:已知P=90%,n=200 根据中心极限定理有 样本合格率不低于85%的概率,即求 的概率。样本通过率不低于85%的概率约为99.1%。2022/11/2216 16四、样本方差 的抽样分布 由概率论知识可以证明,关于样本方差 的统计量:分布的特点是,随机变量 的取值范围是 ,其分布的形态是一个非对称分布,并依赖于自由度。我们可以通过查 分布表,求出给定的自由度下某一设定的上侧面积对应的临界值,或通过计算机得到相关的结果。2022/11/2217 17第三节 一些重要的结论第五章 抽样分布2022/11/2218 18一、大数定律 两种主要的表述形式:2022/11/2219 19二、正态分布的再生定理 如果 都是服从 的独立随机变量,那么其线性组合 也服从正态分布 其均值为 方差为 即 2022/11/222020三、中心极限定理的推广 【例5-6】为了比较2013年7月份北京和沈阳两市城区新建住宅价格情况,独立地从两市城区抽取的样本容量分别为:北京100套,沈阳120套。假设两市城区新建住宅价格服从正态分布,且北京市城区新建住宅价格为3万元/平方米,标准差为0.8万元;沈阳市城区新建住宅价格为1.2万元/平方米,标准差为0.6万元。(1)描述两个样本平均数之差的抽样分布;(2)两个样本平均数之差在 1.52万元之间的概率。2022/11/2221 21三、中心极限定理的推广 解:已知 (1)设 分别表示两个样本的平均数,则有即 即两个样本平均数之差的抽样分布服从正态分布。(2)两个样本平均数之差在 1.52万元之间的概率 2022/11/222222第四节第四节 几种常用的抽样组织方式几种常用的抽样组织方式第五章 抽样分布2022/11/222323一、类型抽样 (一)平均数的抽样平均误差 1.重复抽样式中,为第i组平均数的平均组内方差。平均组内方差的计算公式为式中,为第i 组的组内方差.2.不重复抽样准确的抽样误差公式是2022/11/222424一、类型抽样 【例5-7】某制造企业有生产部、销售部、技术部和物流部四个主要部门,现对这四个部门员工的月收入进行抽样调查,按20%的比例总共抽取50户进行调查,结果如表5-5所示。计算样本平均月收入及其标准差。部门部门员工总数员工总数抽样人数抽样人数抽抽样样平平均均月月收收入入(元)(元)平平均均月月收收入入方方差(元差(元2)生产部生产部15030350050销售部销售部60123800100技术部技术部102300020物流部物流部306290040总计总计25050表表5-5 5-5 各部门员工月收入表各部门员工月收入表2022/11/222525一、类型抽样 解:样本平均数和方差分别是因此,抽样样本平均数的标准差为2022/11/222626一、类型抽样 (二)比率的抽样平均误差 1.重复抽样式中,为比例的平均组内方差。比例的平均组内方差的计算公式为式中,为第i组比例各组的组内方差。2.不重复抽样 同平均数的不重复抽样误差一样,首先要对各个组的组内方差进行修正,然后计算抽样误差。公式为2022/11/222727二、等距抽样 (一)无关标志排序1.平均数抽样平均误差重复抽样时,公式如下:不重复抽样时,公式如下:2.比例抽烟平均误差 重复抽样时,公式如下:不重复抽样时,公式如下:(二)有关标志排序法 按照与调查项目的数量多少有关系的标志排序。2022/11/222828二、等距抽样 【例5-8】某西部地区为继续加快经济发展方式转变,现在调查该地,对该地区20万居民采用按街区每隔1000户抽取1户的等距抽样方法进行抽样,共调查了200户,得到如下资料。试计算样本平均年收入及标准差。解:样本平均年收入样本的标准差 样本平均的标准差人均年收入(万元)3以下3557799以上户数1040806010表表5-6 5-6 居民人均年收入情况居民人均年收入情况2022/11/222929三、整群抽样 首先将总体分为若干群,然后一群一群地抽选,每一群中包含若干个总体单位。整群抽样的抽样误差受三个因素的影响:第一,抽出的群数多少。显然抽出的群数越多,抽样误差越小。第二,群间方差。要注意,在整群抽样时,无论群内方差多大,都不影响抽样误差。因为对每一个群来说,进行的是全面调查,不发生抽样误差问题。当然群间方差的大小是会影响抽样误差的,显然,群间方差越大,抽样误差也越大。第三,抽样方法。整群抽样采用的是不重复抽样方法。因此,在计算抽样误差时要对系数做相应的调整。2022/11/223030三、整群抽样 设总体的全部N个单位被划分为R 群,现在从总体r 群中随机抽取 群组成样本,样本容量是n。(一)平均数的抽样误差 平均数的抽样误差的计算公式为式中,为平均数的群间方差:其中,为总体中各群的平均数;为总体的总平均数。总体的群间方差有时是没有的,必要时可以用样本的群间方差的资料来代替,即 2022/11/2231 31三、整群抽样 (二)比例的抽样误差 比例的抽样误差的计算公式为 式中,为平均数的群间方差:其中,为总体中各群的比例;为总体的比率。总体的群间方差有时是没有的,必要时可以用样本的群间方差的资料来代替,即:2022/11/223232三、整群抽样 【例5-9】2012年我国民间固定资产投资总额约为22.4万亿元,现在从S市2012年500个民间固定投资项目中随机抽取12个项目,得到每个项目平均投资额如下(见表5-7),计算样本平均数(平均每个项目投资额)以及样本平均数的标准差。样本群编号样本群编号平均每个项目投资额(万元)平均每个项目投资额(万元)与样本平均数的离差与样本平均数的离差离差平方离差平方116-1832423511320-14196426-864532-24640636730-41685622484924-10100104511121113400125016256合计合计4081602表表5-7 5-7 投资额情况表投资额情况表2022/11/223333三、整群抽样 解:样本平均数(平均每个项目投资额)用样本群间方差代替总体群间方差 所求的样本平均数的标准差为(万元)2022/11/223434四、抽样组织方式选择 (一)必须遵从随机原则。抽取样本都要求满足“随机性”。(二)抽样误差的大小。在可能的情况下,尽量选用抽样误差小的抽样组织方式。(三)对调查对象的了解程度。2022/11/223535The End2022/11/223636此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢