统计复习.学习.pptx
《统计复习.学习.pptx》由会员分享,可在线阅读,更多相关《统计复习.学习.pptx(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1页/共48页随机抽样 1.在抽取样本中,考虑的最主要的原则是什么?样本的代表性:每个个体有同样的机会被抽中第2页/共48页随机抽样 2.本章介绍的三种随机抽样方法,它们有什么联系与区别?它们各自的特点和适用范围是什么?第3页/共48页 探究?比较简单随机抽样、系统抽样、分比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围层抽样的优点、缺点及适用范围类 别 简 单随 机抽 样 系 统抽 样 分 层抽 样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样 共同点 各自特点 从总体中逐个抽取 将总体均分成几部分,按预先制定的规则在各部分抽取 将总体分
2、成几层,分层进行抽取 联 系 在起始部分样时采用简随机抽样 分层抽样时采用简单随机抽样或系统抽样 适 用范 围 总体个数较少 总体个数较多 总体由差异明显的几部分组成 第4页/共48页例例1 1 1.1.从从 N N 个编号中抽取个编号中抽取 n n 个号码入样,用系个号码入样,用系统抽样的方法抽样,则抽样的间隔为统抽样的方法抽样,则抽样的间隔为_,每个个体入样的可能性为,每个个体入样的可能性为_。2.2.一个公司共有一个公司共有N N名员工,下设一些部门,要名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样采用等比例分层抽样的方法从全体员工中抽取样本容量为本容量为n n的样本
3、,已知某部门有的样本,已知某部门有m m名员工,那么名员工,那么从该部门抽取的员工人数是从该部门抽取的员工人数是_。第5页/共48页用样本估计总体用样本估计总体(两种):一种是:用样本的频率分布估计总体的分布。另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。第6页/共48页用样本的频率分布估计总体分布用样本的频率分布估计总体分布一一 频率分布表和频率分布直方图频率分布表和频率分布直方图二二频率分布折线图和总体密度曲线频率分布折线图和总体密度曲线三三 茎叶图(茎叶图(stem-and-leaf display)第7页/共48页用样本估计总体 1.作样本频率分布直方图的步骤:(1
4、1)求极差;)求极差;(2 2)决定组距与组数)决定组距与组数;(;(组数极差组数极差/组距组距)(3 3)将数据分组;)将数据分组;(4 4)列频率分布表(分组,频数,频率);)列频率分布表(分组,频数,频率);(5 5)画频率分布直方图。)画频率分布直方图。第8页/共48页表表21 100位居民的月均用水量位居民的月均用水量 (单位(单位:t )3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.
5、8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2第9页/共48页步骤:1.求极差(一组数据中最大值与最小值的
6、差)。4.30.2=4.1(t)2.决定组距与组数(样本容量不超过100时,组数常分成512组)。3.将数据分组(9组)。0,0.5),0.5,1),4,4.5)4.列频率分布表。5.画频率分布直方图。第10页/共48页 表22 100位居民月均用水量的 频率分布表 分组 频数累计 频数 频率 0,0.5)4 0.04 0.5,1)8 0.08 1,1.5)15 0.15 1.5,2)22 0.22 2,2.5)25 0.25 2.5,3)14 0.14 3,3.5)6 0.06 3.5,4)4 0.04 4,4.5)2 0.02 合计 100 1.00第11页/共48页00.511.522.
7、53 3.5 4 4.50.500.400.300.200.10频率频率/组距组距月均用水量月均用水量/t注:小长方形的面积组距频率/组距频率 各长方形的面积总和等于1。第12页/共48页0.511.522.53 3.5 44.50.20频率频率/组距组距0月均用水量月均用水量/t0.500.400.300.10图图2.22 100位居民的月均用水量的频率分位居民的月均用水量的频率分布折线图布折线图第13页/共48页月均用水量月均用水量/t频率组距0ab总体密度曲线能够很好的反映总体在各个范围内的百分比,能构提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出
8、来。?思考一下图中阴影部分的面积表示什么?第14页/共48页 甲 乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的个位数。第15页/共48页 小结 图形 优点 缺点频率分布 1)易表示大量数据 丢失一些直方图 2)直观地表明分布地 情况 信息 1)无信息损失 只能处理样本 茎页图 2)随时记录方便记录和表示 容量较小数据第16页/共48页 2.通过对全国所有高一年级学生的身高进行随机抽样,获得的样本频率分布与相应的总体分布有差别吗?样本频率分布总体分布当样
9、本容量增大当样本容量增大组距无限缩小组距无限缩小频率分布折线图总体密度曲线用样本估计总体第17页/共48页例例2 2 对于样本频率分布折线图与总体密度曲线对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是的关系,下列说法正确的是 ()A.A.频率分布折线图与总体密度曲线无关;频率分布折线图与总体密度曲线无关;B.B.频率分布折线图就是总体密度曲线;频率分布折线图就是总体密度曲线;C.C.样本容量很大的频率分布折线图就是总体密样本容量很大的频率分布折线图就是总体密度曲线;度曲线;D.D.如果样本容量无限增大,分组组距无限缩小,如果样本容量无限增大,分组组距无限缩小,那么频率分布折线图就
10、会无限接近于一条光滑那么频率分布折线图就会无限接近于一条光滑曲线曲线总体密度曲线。总体密度曲线。第18页/共48页3.平均数 设样本数据为x1,x2,x3,xn 那么样本平均数为X=(x1+x2+xn)/n 平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平第19页/共48页1.众数 在一组数据中,出现次数最多的数据叫做这一组数据的众数。在频率分布直方图中,就是最高矩形的中点所对应的数据。注注:若有几个两个或几个数据出现的最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数。样本数据不一定有众数,有众数则不一定只有一个
11、第20页/共48页从频率分布直方图中可以看出月均用水量的众数是2.25t(最高矩形的中点)第21页/共48页2、中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。而在频率分布直方图中的中位数左右两侧的直方图面积应该相等,因而可以确定估计其近似值。第22页/共48页二、思考:如何从频率分布直方图中估计中位数?第23页/共48页3.平均数 设样本数据为x1,x2,x3,xn 那么样本平均数为X=(x1+x2+xn)/n 平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平第24页/共48页二、用样本的标准差估计总体的标准差二、用样本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 复习 学习
限制150内