学年高中数学 第二章 统计复习回顾 新人教A必修3.ppt
第二章第二章 统计统计本本 章章 回回 顾顾2021/8/8 星期日1知知 识 结 构构2021/8/8 星期日22021/8/8 星期日3重点知重点知识回回顾2021/8/8 星期日41.要点归纳要点归纳(1)理解简单随机抽样理解简单随机抽样 系统抽样系统抽样 分层抽样的概念分层抽样的概念,搞清它们搞清它们各自的特点及步骤各自的特点及步骤.(2)会用简单随机抽样会用简单随机抽样 系统抽样系统抽样 分层抽样等常用的抽样方分层抽样等常用的抽样方法法从总体中抽取样本从总体中抽取样本.(3)会用样本频率分布估计总体分布会用样本频率分布估计总体分布.(4)会用样本数字特征估计总体数字特征会用样本数字特征估计总体数字特征.(5)掌握掌握 利用散点图和线性回归方程利用散点图和线性回归方程,分析变量间的相关关分析变量间的相关关系系.2021/8/8 星期日52.热点透视热点透视(1)根据简单随机抽样根据简单随机抽样 系统抽样系统抽样 分层抽样这三种方法的共分层抽样这三种方法的共同同点点 适用范围和各自特点适用范围和各自特点,恰当选取抽样方法从总体中抽取样恰当选取抽样方法从总体中抽取样本本.在选取样本时在选取样本时,要按照各种抽样方法的步骤抽取个体要按照各种抽样方法的步骤抽取个体.三三种种抽样方法的比较如下表抽样方法的比较如下表:2021/8/8 星期日6类别共同点共同点相互相互联系系适用范适用范围各自特点各自特点简单随随机抽机抽样(1)(1)抽抽样过程程中每个个体中每个个体被抽到的机被抽到的机会相等会相等(2)(2)抽抽样过程程都是不放回都是不放回的抽的抽样总体中的体中的个数个数较少少从从总体中体中逐个抽取逐个抽取系系统抽抽样在起始部在起始部分抽分抽样时采用采用简单随机抽随机抽样总体中的体中的个数个数较多多将将总体均体均分成几部分成几部分分,按事按事先确定的先确定的规则在各在各部分抽取部分抽取分分层抽抽样每每层抽抽样时采用采用简单随机抽随机抽样或系或系统抽抽样总体由差体由差异明异明显的的几部分几部分组成成将将总体分体分成几成几层,按一定的按一定的比例比例进行行抽取抽取2021/8/8 星期日7(2)用用样本估本估计总体一般分成两种体一般分成两种:一种是用一种是用样本的本的频率分布率分布估估计总体的分布体的分布;另一种是用另一种是用样本的数字特征本的数字特征(如平均数如平均数标准准差等差等)估估计总体的数字特征体的数字特征.所所谓第一种就是利用第一种就是利用样本的本的频率分布表和率分布表和频率分布直方率分布直方图对总体情况作出估体情况作出估计,有有时也利用也利用频率分布折率分布折线图和茎叶和茎叶图对总体估体估计.直方直方图能能够很容易地表示大量数据很容易地表示大量数据,非常直非常直观地表地表明分布的形状明分布的形状,使我使我们能能够看到在分布表中看不清楚的数据看到在分布表中看不清楚的数据模式模式,这样根据根据样本的本的频率分布率分布,我我们可以大致估可以大致估计出出总体的体的分布分布.2021/8/8 星期日8但是但是,当总体的个体数较多时当总体的个体数较多时,所需抽样的样本容量也不能太所需抽样的样本容量也不能太小小,随着样本容量的增加随着样本容量的增加,频率分布折线图会越来越接近于一频率分布折线图会越来越接近于一条光滑曲线条光滑曲线,统计中称这条曲线为总体密度曲线统计中称这条曲线为总体密度曲线,它能给我们它能给我们提供更加精细的信息提供更加精细的信息.在样本数据较少时在样本数据较少时,用茎叶图表示数据用茎叶图表示数据的效果较好的效果较好,它不但可以保留所有信息它不但可以保留所有信息,而且可以随时记录而且可以随时记录,这这对数据的记录和表示都能带来方便对数据的记录和表示都能带来方便.2021/8/8 星期日9所所谓第二种就是第二种就是为了从整体上更好地把握了从整体上更好地把握总体的体的规律律,我我们还可以通可以通过样本数据的众数中位数平均数和本数据的众数中位数平均数和标准差等数字准差等数字特征特征对总体的数字特征作出估体的数字特征作出估计.众数就是众数就是样本数据中出本数据中出现最多的数据最多的数据;中位数就是把中位数就是把样本数据分成相同数目的两部分本数据分成相同数目的两部分,其中一部分比其中一部分比这个数小个数小,另一部分比另一部分比这个数大的那个数个数大的那个数;平均平均数就是所有数就是所有样本数据的平均本数据的平均值,用用 表示表示;标准差是反映准差是反映样本本数据分散程度大小的最常用数据分散程度大小的最常用统计量量,其其计算公式如下算公式如下:2021/8/8 星期日10有有时也用也用标准差的平方准差的平方s2方差来代替方差来代替标准差准差,实质一一样.2021/8/8 星期日11(3)分析两个变量的相关关系时分析两个变量的相关关系时,我们可以根据样本数据散点我们可以根据样本数据散点图确定两个变量之间是否存在相关关系图确定两个变量之间是否存在相关关系,还可利用最小二乘还可利用最小二乘法估计求出回归直线方程法估计求出回归直线方程.把样本数据表示的点在直角坐标把样本数据表示的点在直角坐标系中作出系中作出,构成的图叫做散点图构成的图叫做散点图.从散点图上从散点图上,我们可以分析我们可以分析两两个变量是否存在相关关系个变量是否存在相关关系:如果这些点大致分布在通过散点如果这些点大致分布在通过散点图中心的一条直线附近图中心的一条直线附近,那么就说这两个变量之间具有线性那么就说这两个变量之间具有线性相关关系相关关系,这条直线叫做回归直线这条直线叫做回归直线,直线方程叫做回归直线的直线方程叫做回归直线的方程方程.2021/8/8 星期日12(4)求回归直线方程的步骤求回归直线方程的步骤:2021/8/8 星期日13(5)画画样本本频率分布直方率分布直方图的步的步骤:求极差求极差决定决定组距与距与组数数分分组列列频率分布表率分布表画画频率分布直方率分布直方图.2021/8/8 星期日14专 题 探探 究究2021/8/8 星期日15专题一专题一 三种抽样方法的应用三种抽样方法的应用例例1:大大 中中 小三个盒子中分别装有同一产品小三个盒子中分别装有同一产品120个个,60个个,20个个,现在需从这三个盒子中抽取一个容量为现在需从这三个盒子中抽取一个容量为25的样本的样本,较为恰较为恰当的抽样方法是当的抽样方法是()A.分层抽样分层抽样 B.系统抽样系统抽样C.简单随机抽样简单随机抽样 D.以上三种均可以上三种均可解析解析:总体无明显差异总体无明显差异,但总体中个体数较多但总体中个体数较多,故可采用系统故可采用系统抽抽样较恰当样较恰当.答案答案:B2021/8/8 星期日16例例2:某企某企业三月中旬生三月中旬生产A B C三种三种产品共品共3000件件,根据分根据分层抽抽样的的结果果,企企业统计员制作了如下的表格制作了如下的表格:由于不小心由于不小心,表格中表格中A C产品的有关数据已被品的有关数据已被污染看不清楚染看不清楚,统计员记得得A产品的品的样本容量比本容量比C产品的品的样本容量多本容量多10,根据根据以上信息以上信息,可得可得C的的产品数量是品数量是_件件.产品品类别A AB BC C产品数量品数量(件件)13001300样本容量本容量(件件)1301308002021/8/8 星期日172021/8/8 星期日18例例3:(2009天津高考天津高考)某学院的某学院的A,B,C三个三个专业共有共有1200名名学生学生,为了了调查这些学生勤工些学生勤工俭学的情况学的情况,拟采用分采用分层抽抽样的的方法抽取一个容量方法抽取一个容量为120的的样本本.已知已知该学院的学院的A专业有有380名学生名学生,B专业有有420名学生名学生,则在在该学院的学院的C专业应抽取抽取_名学生名学生.402021/8/8 星期日19专题二专题二 用样本估计总体用样本估计总体例例4:(2008山东高考山东高考)从某项综合能力测试中抽取从某项综合能力测试中抽取100人的成人的成绩绩,统计如表统计如表,则这则这100人成绩的标准差为人成绩的标准差为()分数分数5 54 43 32 21 1人数人数202010103030303010102021/8/8 星期日20答案答案:B2021/8/8 星期日21例例5:甲甲 乙两种冬小麦试验品连续乙两种冬小麦试验品连续5年平均单位面积产量如下年平均单位面积产量如下(单位单位:t/hm2):则其中其中产量比量比较稳定的小麦是哪种定的小麦是哪种?第一年第一年第二年第二年第三年第三年第四年第四年第五年第五年甲甲9.89.89.99.910.110.1101010.210.2乙乙9.49.410.310.310.810.89.79.79.89.82021/8/8 星期日22分析分析:画出甲画出甲 乙产品的茎叶图乙产品的茎叶图,由茎叶图可分析出甲由茎叶图可分析出甲 乙产品乙产品的稳定性的稳定性.解解:茎叶图如下图所示茎叶图如下图所示.从这个茎叶图中可以看出甲产品产量从这个茎叶图中可以看出甲产品产量大致是对称的大致是对称的,中位数是中位数是10,乙产品产量也是大致对称的乙产品产量也是大致对称的,中位中位数是数是9.8,因此甲产品产量比较稳定因此甲产品产量比较稳定.2021/8/8 星期日23例例6:(2010山东济南山东济南)从高三学生中抽取从高三学生中抽取50名同学参加数学竞名同学参加数学竞赛赛,成绩的分组及各组的频数如下成绩的分组及各组的频数如下:(单位单位:分分)40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100),8.(1)列出列出样本的本的频率分布表率分布表;(2)画出画出频率分布直方率分布直方图和和频率分布折率分布折线图;(3)估估计成成绩在在60,90)分的学生比例分的学生比例;(4)估估计成成绩在在85分以下的学生比例分以下的学生比例.2021/8/8 星期日24解解:(1)频率分布表如下率分布表如下:成成绩分分组频数数频率率频率率/组距距40,50)40,50)2 20.040.040.0040.00450,60)50,60)3 30.060.060.0060.00660,70)60,70)10100.20.20.020.0270,80)70,80)15150.30.30.030.0380,90)80,90)12120.240.240.0240.02490,100)90,100)8 80.160.160.0160.016合合计50501 10.10.12021/8/8 星期日25(2)频率分布直方图和折线图为频率分布直方图和折线图为:2021/8/8 星期日26(3)成绩在成绩在60,90)分的学生比例为分的学生比例为0.2+0.3+0.24=0.74=74%.(4)成绩在成绩在85分以下的学生比例为分以下的学生比例为1-(0.12+0.16)=1-0.28=0.72=72%.2021/8/8 星期日27专题三专题三 变量间的相关关系变量间的相关关系例例7:在下列各图中在下列各图中,两个变量具有线性相关关系的是两个变量具有线性相关关系的是()2021/8/8 星期日28解析解析:A具有函数关系具有函数关系,B具有线性相关关系具有线性相关关系,C具有相关关系具有相关关系,但不是线性相关关系但不是线性相关关系,D不具有相关关系不具有相关关系.答案答案:B2021/8/8 星期日29例例8:假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用y(万万元元)有如下的统计资料有如下的统计资料:若由若由资料知料知y对x呈呈线性相关关系性相关关系.试求求:(1)线性回性回归方程方程 的回的回归系数系数a b;(2)估估计使用年限使用年限为10年年时,维修修费用是多少用是多少?使用年限使用年限x x2 23 34 45 56 6维修修费用用y y2.22.23.83.85.55.56.56.57.07.02021/8/8 星期日30分析分析:因因为y对x呈呈线性相关关系性相关关系,所以可以用所以可以用线性相关的方法性相关的方法解决解决问题.(2)获得得线性回性回归方程后方程后,取取x=10,即得所求即得所求.2021/8/8 星期日31解解:(1)制表制表:i i1 12 23 34 45 5合合计x xi i2 23 34 45 56 62020y yi i2.22.23.83.85.55.56.56.57.07.02525x xi iy yi i4.44.411.411.422.022.032.532.542.042.0112.3112.34 49 916162525363690902021/8/8 星期日322021/8/8 星期日332021/8/8 星期日34