2023年新高考复习讲练必备第31讲统计与统计模型(讲义).pdf
《2023年新高考复习讲练必备第31讲统计与统计模型(讲义).pdf》由会员分享,可在线阅读,更多相关《2023年新高考复习讲练必备第31讲统计与统计模型(讲义).pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023年新高考复习讲练必备第3 1讲统计与统计模型一、知识梳理数据的收集与直观表示1.总体、个体、样本与样本容量考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.2.普查与抽样调查(1)普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).(2)抽样调查:只抽取样本进行考察的方法称为抽样调查.3.简单随机抽样(1)定义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.(2)两种常用方法:抽签法,随机数表法.4.分层抽样一般地,如果相对于要考察的问题来
2、说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).5.数据的直观表示(1)常见的统计图表有柱形图、折线图、扇形图、茎叶图、频数分布直方图、频率分布直方图等.(2)频率分布直方图作频率分布直方图的步骤(i)找出最值,计算极差:即一组数据中最大值与最小值的差;(ii)合理分组,确定区间:根据数据的多少,一般分59 组;(适)整理数据:逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组是闭区间;(iv)作出有
3、关图示:根据上述整理后的数据,可以作出频率分布直方图,如图所示.频率分布直图的纵坐标是频率麻,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分布直方图中,所有矩形的面积之和为1.0.050.040.030.020.015055 60 65 70 75 8()85 90 9510()频率分布折线图作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.不难看出,虽然作频率分布直方图过程中,原有数据被“压缩”了,从这两种图中也得不到所有原始数据.但是,由这两种图可以清楚
4、地看出数据分布的总体态势,而且也可以得出有关数字特征的大致情况.比如,估计出平均数、中位数、百分位数、方差.当然,利用直方图估计出的这些数字特征与利用原始数据求出的数字特征一般会有差异.数据的数字特征、用样本估计总体1.数据的数字特征最值一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.(2)平均数定义:如果给定的一组数是汨,尤2,,Xn,则这组数的平均数为尤=,X|+X 2+%).这一公式在数学中常简记为X 产性质:一般地,利用平均数的计算公式可知,如果汨,X2,,X”的平均数为X,且。为常数,则的axi+b,的平均数为生片土.(3)中位数有奇数个数,且按照从小到大排
5、列后为XI,X2,,X2+l,则称皿1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为XI,X2,,垃”,则称皿蓝T为这组数的中位数.(4)百分位数定义:一组数的p%g e(0,1 0 0)分位数指的是满足下列条件的一个数值:至少有P%的数据不大于该值,且至少有(1 0 0 p)%的数据不小于该值.确定方法:设一组数按照从小到大排列后为XI,X2,,X,计算,=叩的值,如果,不是整数,设 i o为大于i 的最小整数,取 也 为 P%分位数;如果,是整数,取 与 皂 为 2 分位数.(5)众数一组数据中,出现次数量多的数据称为这组数据的众数.(6)极差、方差与标准差极差:一组数的极
6、差指的是这组数的最大值减去最小值所得的差,描述了这组数的离散程度.方差定义:如果XI,X2,,X”的平均数为X,则方差可用求和符号表示为S 2=5*二)2 =g斤一X 2.性质:如果。为常数,则 必+/?,axi+b,,函+/?的方差为国S标准差定义:方差的算术平方根称为标准差.一般用S 表 示,即 样 本 数 据;X2,,%的标准差为S=l次(X L X)2.性质:如果。,。为常数,则 i+匕,axi+b,%+/?的标准差为|a|s.2.用样本的数字特征估计总体的数字特征一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只需直接算出桂生对应的数字特征即可.统计模型1 .变量
7、的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:如果变量x 与变量丫之间的关系可以近似地用一次函数来刻画,则称x 与y 线性相关.2 .相关系数 (X L x)(9一y)(l)r=尸=、(Xi-X)2E (j,J)2i=l i=lXiyi-n_ i=l 人)_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _I n 二 n*A/(Lx?i x2)(Lj?zi j2)Y j=i i=i(2)当r0时,成对样本数据正相关;当/0时,成对样本数据负相关.(3)
8、HI;当m越接近1时,成对样本数据的线性相关程度越强;当m越接近o时,成对样本数据的线性相关程度越爨.3.一元线性回归模型我们将=源+1称为y关于x的回归直线方程,其中r n _ _ n Cxi x)(9 y)Xiyin 丫”A_Z=I_i=i”,b=n Z =-n Z-,(X|-x)2 Lx?-n x2=i/=iA A A 一a=y-b x.(2)残差:观测值减去预测值,称为残差.4.2X 2列联表和三如果随机事件A与B的样本数据的2 X2列联表如下.AA总计Baba+bBcdc+d总计a+cb+da+b+c+d记 n=a+b+c+d,则,_ n(adbe)2 _/(+/),5.独立性检验统
9、计学中,常用的显著性水平a以及对应的分位数%如下表所示.a=P2k)0.10.050.010.0050.001K要推断“A与8有关系”可按下面的步骤 作2 X 2列联表.(2)根据2 X 2列联表计算亡的值.(3)查对分位数k,作出判断.如果根据样本数据算出z2的值后,发现/2 2女成立,就称在犯错误的概率不超过a的前提下,可以认为A与8不独立(也称为A与8有关);或说有1a的把握认为4与8有关.若/%成立,就称不能得到前述结论.这一过程通常称为独立性检验.2.7063.8416.6357.87910.828二、考点和典型例题1、数据的收集与直观表示【典 例 1-1】北京2022年冬奥会期间,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 新高 复习 必备 31 统计 模型 讲义
限制150内