2022年高考统计知识点总结 .pdf
名师总结优秀知识点第二章:统计1、抽样方法:简单随机抽样(总体个数较少)系统抽样(总体个数较多)分层抽样(总体中差异明显)注意:在 N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为Nn。2、总体分布的估计:一表二图:频率分布表数据详实频率分布直方图分布直观频率分布折线图便于观察总体分布趋势注:总体分布的密度曲线与横轴围成的面积为1。茎叶图:茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。3、总体特征数的估计:平均数:nxxxxxn321;取值为nxxx,21的频率分别为nppp,21,则其平均数为nnpxpxpx2211;注意:频率分布表计算平均数要取组中值。方差与标准差:一组样本数据nxxx,21方差:212)(1niixxns;标准差:21)(1niixxns注:方差与标准差越小,说明样本数据越稳定。平均数反映数据总体水平;方差与标准差反映数据的稳定水平。线性回归方程变量之间的两类关系:函数关系与相关关系;制作散点图,判断线性相关关系线性回归方程:abxy(最小二乘法)1221niiiniix ynx ybxnxaybx注意:线性回归直线经过定点),(yx。第三章:概率1、随机事件及其概率:事件:试验的每一种可能的结果,用大写英文字母表示;必然事件、不可能事件、随机事件的特点;随机事件A 的概率:1)(0,)(APnmAP. 2、古典概型:基本事件:一次试验中可能出现的每一个基本结果;古典概型的特点:所有的基本事件只有有限个;每个基本事件都是等可能发生。古典概型概率计算公式:一次试验的等可能基本事件共有n 个,事件A 包含了其中的m 个基本事件,则事件 A 发生的概率nmAP)(. 3、几何概型:几何概型的特点:所有的基本事件是无限个;每个基本事件都是等可能发生。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 5 页名师总结优秀知识点几何概型概率计算公式:的测度的测度DdAP)(;其中测度根据题目确定,一般为线段、角度、面积、体积等。4、互斥事件:不可能同时发生的两个事件称为互斥事件;如果事件nAAA,21任意两个都是互斥事件,则称事件nAAA,21彼此互斥。如果事件A,B 互斥,那么事件A+B 发生的概率,等于事件A,B 发生的概率的和,即:)()()(BPAPBAP如果事件nAAA,21彼此互斥,则有:)()()()(2121nnAPAPAPAAAP对立事件:两个互斥事件中必有一个要发生,则称这两个事件为对立事件。事件A的对立事件记作A)(1)(, 1)()(APAPAPAP对立事件一定是互斥事件,互斥事件未必是对立事件。1、基本概念互斥事件:不可能同时发生的两个事件. 如果事件ABC、 、,其中任何两个都是互斥事件,则说事件ABC、 、彼此互斥 . 当AB、是互斥事件时,那么事件AB发生(即AB、中有一个发生)的概率,等于事件AB、分别发生的概率的和,即()()(PABPAPB. 对立事件:其中必有一个发生的两个互斥事件.事件A的对立事件通常记着A. 对立事件的概率和等于1. ()1( )P AP A. 特别提醒: “互斥事件”与“对立事件”都是就两个事件而言的,互斥事件是不可能同时发生的两个事件,而对立事件是其中必有一个发生的互斥事件,因此,对立事件必然是互斥事件,但互斥事件不一定是对立事件 ,也就是说“互斥”是“对立”的必要但不充分的条件. 相互独立事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响,(即其中一个事件是否发生对另一个事件发生的概率没有影响). 这样的两个事件叫做相互独立事件. 当AB、是相互独立事件时,那么事件A B发生(即AB、同时发生)的概率,等于事件AB、分别发生的概率的积. 即()()( )P A BP AP B.若 A、B两事件相互独立,则A与B、A与 B、A与B也都是相互独立的. 独立重复试验一般地,在相同条件下重复做的n次试验称为n次独立重复试验. 独立重复试验的概率公式如果在 1 次试验中某事件发生的概率是p,那么在n次独立重复试验中这个试验恰好发生k次的概率()( 1)0 , 1 2 , .,kknknnPknkC pp条件概率:对任意事件A 和事件 B,在已知事件A 发生的条件下事件B 发生的概率,叫做条件概率.记作 P(B|A) ,读作 A 发生的条件下B 发生的概率 .公式:()(),()0.()P ABP B AP AP A2、离散型随机变量随机变量: 如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用字母, ,X Y等表示 . 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 5 页名师总结优秀知识点离散型随机变量: 对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量 . 连续型随机变量: 对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量 . 离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出. 若X是随机变量,( ,YaXb a b是常数)则Y也是随机变量并且不改变其属性 (离散型、 连续型). 3、离散型随机变量的分布列概率分布(分布列)设离散型随机变量X可能取的不同值为12,x x,ix,nx,X的每一个值ix(1,2,in)的概率()iiP Xxp,则称表X1x2xixnxP1p2pipnp为随机变量X的概率分布,简称X的分布列 .性质:0,1,2,. ;ipin11.niip两点分布如果随机变量X的分布列为则称X服从 两点分布 ,并称(1)pP X为成功概率 . 二项分布如果在一次试验中某事件发生的概率是p,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是()(1).kkn knP XkC pp其中0,1,2,.,1knqp,于是得到随机变量X的概率分布如下:X0 1 knP00nnC p q111nnC p qkknknC p q0nnnC p q我们称这样的随机变量X服从 二项分布 ,记作pnBX,,并称 p 为成功概率 . 判断一个随机变量是否服从二项分布,关键有三点:对立性: 即一次试验中事件发生与否二者必居其一;重复性: 即试验是独立重复地进行了n次; 等概率性:在每次试验中事件发生的概率均相等. 注: 二项分布的模型是有放回抽样;二项分布中的参数是, , .p k n超几何分布一般地 , 在含有M件次品的N件产品中,任取n件, 其中恰有X件次品数 , 则事件Xk发生的概率为()(0,1,2,)kn kMNMnNC CP XkkmC, 于是得到随机变量X的概率分布如下:X0 1 P1pp精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 5 页名师总结优秀知识点其中min,mM n,*, ,nN MN n M NN. 我们称这样的随机变量X的分布列为超几何分布列,且称随机变量X服从 超几何分布 .注: 超几何分布的模型是不放回抽样;超几何分布中的参数是, .MN n其意义分别是总体中的个体总数、N中一类的总数、样本容量. 4、离散型随机变量的均值与方差离散型随机变量的均值一般地,若离散型随机变量X的分布列为X1x2xixnxP1p2pipnp则称1122iinnE Xx px px px p为离散型随机变量X的均值或数学期望(简称期望).它反映了离散型随机变量取值的平均水平.性质:()().E aXbaE Xb若X服从两点分布,则().E Xp若pnBX,,则().E Xnp离散型随机变量的方差一般地,若离散型随机变量X的分布列为X1x2xixnxP1p2pipnp则称21()()niiiD XxE Xp为离散型随机变量X的方差, 并称其算术平方根()D X为 随机变量X的标准差 .它反映了离散型随机变量取值的稳定与波动,集中与离散的程度. ()D X越小,X的稳定性越高,波动越小,取值越集中;()D X越大,X的稳定性越差,波动越大,取值越分散.性质:2()().D aXba D X若X服从两点分布,则()(1).D XpP若pnBX,,则()(1).D XnpP5、正态分布正态变量概率密度曲线函数表达式:Rxexfx,21222,其中,是参数,且X0 1 mP00nMNMnNC CC11nMNMnNC CCmn mMNMnNC CC精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 5 页名师总结优秀知识点,0.记作2( ,).N如下图:专题八:统计案例1、回归分析回归直线方程bxay ?,其中1122211nniiiiiinniiiixxyyx ynx ybxxxnxaybx相关系数:12211niiinniiiixxyyrxxyy1222211niiinniiiix ynxyxnxyny2、独立性检验假设有两个分类变量X和 Y,它们的值域分另为x1, x2和y1, y2,其样本频数22 列联表为:y1y2总计x1a b a+b x2c d c+d 总计a+c b+d a+b+c+d 若要推断的论述为H1:“X 与 Y有关系”, 可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度. 具体的做法是,由表中的数据算出随机变量2K的值22()()()()()n adbcKab cdac bd,其中nabcd为样本容量,K2的值越大,说明“X与 Y有关系”成立的可能性越大. 随机变量2K越大,说明两个分类变量,关系越强;反之,越弱。23.841K时,X与 Y无关;23.841K时, X与 Y有 95% 可能性有关;26.635K时 X与 Y有 99%可能性有关 . 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 5 页