2023年新高考复习讲练必备第31讲统计与统计模型(讲义).docx
《2023年新高考复习讲练必备第31讲统计与统计模型(讲义).docx》由会员分享,可在线阅读,更多相关《2023年新高考复习讲练必备第31讲统计与统计模型(讲义).docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023年新高考复习讲练必备第31班统计与统计模型一、知识梳理数据的收集与直观表示1 .总体、个体、样本与样本容量考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的局部对象组成总体的一 个样本,一个样本中包含的个体数目是样本容量.2 .普查与抽样调查(1)普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).(2)抽样调查:只抽取样本进行考察的方法称为抽样调查.3 .简单随机抽样(1)定义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排 队等,完全随机地抽取个体.(2)两种常用方法:抽签法,随机数表法.4 .分层抽样一般地,如果相对于要考
2、察的问题来说,总体可以分成有明显差异的、互不重叠的几局部 时,每一局部可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随 机抽样(简称为分层抽样).5 .数据的直观表示常见的统计图表有柱形图、折线图、扇形图、茎叶图、频数分布直方图、频率分布直方 图等.(2)频率分布直方图作频率分布直方图的步骤(i)找出最值,计算极差:即一组数据中最大值与最小值的差;(ii)合理分组,确定区间:根据数据的多少,一般分59组;(iii)整理数据:逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频数与数据个 数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组是闭区间
3、;(iv)作出有关图示:根据上述整理后的数据,可以作出频率分布直方图,如下图.频率分布直图的纵坐标是频率而帚,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分布直方图中,所有矩形的面积之和为1.频率频率分布折线图作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图,折线图都画 成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.不难看出,虽然作频率分布直方图过程中,原有数据被“压缩” 了,从这两种图中也得不 到所有原始数据.但是,由这两种图可以清楚地看出数据分布的总体态势,而且也可以得出 有关数字特征的大致情况.比方,估计出
4、平均数、中位数、百分位数、方差.当然,利用直方 图估计出的这些数字特征与利用原始数据求出的数字特征一般会有差异.数据的数字特征、用样本估计总体.数据的数字特征最值一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.平均数定义:如果给定的一组数是%2,,Xn,那么这组数的平均数为F%”).I V这一公式在数学中常简记为1 =小,性质:一般地,利用平均数的计算公式可知,如果1, %2,, 的平均数为,且。,人为常数,那么ax2b,,公”+Z?的平均数为4才士也.(3)中位数有奇数个数,且按照从小到大排列后为m,2,,2+1,那么称加土l为这组数的中位数;如 果一组数有偶数个数
5、,且按照从小到大排列后为XI, X2,,X2,那么称当苧单为这组数的 中位数.(4)百分位数定义:一组数的p%(pE(O, 100)分位数指的是满足以下条件的一个数值:至少有的 数据不大于该值,且至少有(10。一P)%的数据不小于该值.确定方法:设一组数按照从小到大排列后为用,X2,%,计算,=秋的值,如果,不是整数,设io为大于i的最小整数,取 也为分位数;如果i是整数,取皂为P%分 位数.(5)众数一组数据中,出现次数量多的数据称为这组数据的众数.极差、方差与标准差极差:一组数的极差指的是这组数的最大值减去最小值所得的差,描述了这组数的离散 程度.方差定义:如果XI, %2,,我的平均数为
6、,那么方差可用求和符号表示为=(整=)2=5g%7 X 2.性质:如果”,。为常数,那么6ZX1+,axi-b, ,的方差为昌S 标准差定义:方差的算术平方根称为标准差.一般用S表示,即样本数据1,尤2,,财的标准差为性质:如果a, b为常数,那么公i+/?, ax?.-b,,的?+/?的标准差为s.1 .用样本的数字特征估计总体的数字特征一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只需直接算 出样本对应的数字特征即可.统计模型.变量的相关关系相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程 度,这种关系称为相关关系.相关关系的分类:正相关和
7、负相关.(3)线性相关:如果变量与变量y之间的关系可以近似地用一次函数来刻画,那么称尤与y线 性相关.1 .相关系数 (x/ x ) (j/ y ) (x/ x ) (j/ y )2% yn一(Lx?Al X 2)i=l(Lj?nj2) z=i当少。时丁 成对样本数据正相关;当厂0时,成对样本数据负相关.(3)|r|l;当|厂|越接近1时,成对样本数据的线性相关程度越强;当仍越接近0时,成对样本数据的线性相关程度越弱.3 .一元线性回归模型我们将於源+1称为y关于x的回归直线方程,其中 n_nX (X/ x ) (j/ y )孙一正,a =ii=i“ yb= n -= nZZ-9 (X/ x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023年新高考复习讲练必备第31讲 统计与统计模型讲义 2023 新高 复习 必备 31 统计 模型 讲义
限制150内