2022年题-高考数学概率与统计知识点,推荐文档 .pdf
高考数学第18 题(概率与统计)1、求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识: (1) 等可能性事件(古典概型 ) 的概率: P(A) )()(IcardAcardnm; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n; 设所求事件A,并计算事件A包含的基本事件的个数m; 依公式()mP An求值 ; 答,即给问题一个明确的答复. (2) 互斥事件有一个发生的概率:P(AB)P(A)P(B); 特例:对立事件的概率:P(A) P(A) P(AA) 1. (3) 相互独立事件同时发生的概率:P(AB)P(A) P(B); 特例:独立重复试验的概率:Pn(k) knkknppC)1 (. 其中 P为事件 A在一次试验中发生的概率,此式为二项式(1-P)+Pn展开的第k+1 项. (4) 解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质等可能事件 互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1)kknknnmP AnP ABPAP BP A BPAP BPkCpp等可能事件 : 互斥事件:独立事件:n次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复. 2. 离散型随机变量的分布列1. 随机变量及相关概念随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母、等表示. 随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. 随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2. 离散型随机变量的分布列离散型随机变量的分布列的概念和性质一般地,设离散型随机变量可能取的值为1x,2x,ix,取每一个值ix(i1,2,)的概率 P(ix)=iP,则称下表 . 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 5 页 - - - - - - - - - 的概率分布,简称的分布列 . 为随机变量由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质:(1)0iP,i1,2, ; (2)21PP=1. 常见的离散型随机变量的分布列:(1)二项分布n次独立重复试验中,事件A 发生的次数是一个随机变量,其所有可能的取值为0,1,2, n,并且knkknkqpCkPP)(,其中nk0,pq1,随机变量的分布列如下:0 1 P 称这样随机变量服从二项分布,记作),(pnB,其中n、p为参数,并记:),;(pnkbqpCknkkn . (2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数是一个取值为正整数的离散型随机变量,“k”表示在第k 次独立重复试验时事件第一次发生. 随机变量的概率分布为:1 2 3 k P p qp 3. 离散型随机变量的期望与方差随机变量的数学期望和方差(1) 离散型随机变量的数学期望:2211pxpxE;期望反映随机变量取值的平均水平. 离散型随机变量的方差:222121)()(pExpExDnnpEx2)(;方差反映随机变量取值的稳定与波动,集中与离散的程度. 基本性质:baEbaE)(;DabaD2)(. (4) 若B(n,p) ,则npE ; D =npq (这里 q=1-p ) ; 如果随机变量服从几何分布,),()(pkgkP,则pE1,D =2pq其中 q=1-p. 4. 抽样方法与总体分布的估计抽样方法1简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法. 2系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取 1 个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样). 3分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确 . P P1 P2 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 5 页 - - - - - - - - - 总体分布:总体取值的概率分布规律通常称为总体分布. 当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图 . 当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布. 总体密度曲线: 当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 5. 正态分布与线性回归1. 正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量的概率密度函数为222)(21)(xexf,xR其中、为常数,并且0,则称服从正态分布,记为 N(,2). (2)期望 E = ,方差2D. (3)正态分布的性质正态曲线具有下列性质: 曲线在x 轴上方,并且关于直线x对称 . 曲线在x=时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低. 曲线的对称轴位置由确定;曲线的形状由确定,越大,曲线越“矮胖” ;反之越“高瘦”. 三 原则即为数值分布在( , +) 中的概率为0.6526 数值分布在( 2, +2) 中的概率为0.9544 数值分布在( 3, +3) 中的概率为0.9974 (4)标准正态分布当=0,=1 时服从标准的正态分布,记作 N(0,1)(5)两个重要的公式()1( )xx, ()( )( )P abba. (6)2( ,)N与(0,1)N二者联系 . 若2(,)N,则(0,1)N ; 若2(,)N,则()()()baP ab. 6. 线性回归1. 简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法. 变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系. 不确定性的两个变量之间往往仍有规律可循. 回归分析就是处理变量之间的相关关系的一种数量统计方法. 它可以提供变量之间相关关系的经验公式 . 具 体 说 来 , 对n 个 样本 数 据 (11,xy) , (22,xy) , , (,nnxy) , 其 回 归 直 线 方程:axby?, 其 中名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 5 页 - - - - - - - - - niiniiiniiniiixnxyxnyxxxyyxxb1221121?xbya?,yx,称为样本中心点 , 因而回归直线过样本中心点. 当0r时, 表明两变量正相关 ; 当0r, 表明两变量负相关 .r 越接近 1, 表明两变量的线性相关性越强 ;r 越接近 0, 表明两变量的线性相关关系几乎不存在, 通常当75.0r时, 认为两个变量有很强的线性相关关系 .7. 独立性检验的概念一般地 , 假设有两个分类变量X 和Y , 它们的值域分别为21, xx和21, yy, 其样本频数列联表( 称为22列联表 ) 为: 总计总计我们利用随机变量dbcadcbabcadnK22来确定在多大程度上可以认为“两个分类变量有关系” , 这种方法称为两个分类变量的独立性检验. (二)独立性检验的基本思想独立性检验的基本思想类似于反证法. 要确认“两个分类变量有关系”这一结论成立的可信程度, 首先假设该结论不成立 , 即假设结论“两个分类变量没有关系”成立. 在该假设下我们构造的随机变量2K 应该很小 , 如果由观测数据计算得到的2K的观测值 k 很大 , 则在一定程度上说明假设不合理. 具体比较如下表 : 反证法原理与独立性检验原理的比较反证法原理在假设0H下, 如果推出一个矛盾 , 就证明了0H不成立 . 独立性检验原理在假设0H下, 如果出现一个与0H矛盾的小概率事件 , 就推断0H不成立 , 且该推断犯错误的概率不超过这个小概率. (三)独立性检验的方法假设1H: “ X 与Y 有关系” , 可按如下步骤判断结论1H成立的可能性 : (xn,yn) ,则变量间线性相关系数r 的计算公式如下:2. 相关系数 r :假设两个随机变量的取值分别是(x1,y1) , (x2,y2) ,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 5 页 - - - - - - - - - 1. 通过等高条形图 , 可以粗略地判断两个分类变量是否有关系, 但是这种判断无法精确地给出所得结论的可靠程度 . 2. 利用独立性检验来考查两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度, 具体做法是 : (1) 根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a, 然后通过下表确定临界值0k. 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 (2)由公式dbcadcbabcadnK22, 计算2K 的观测值 k . (3)如果0kk, 就推断“ X 与 Y 有关系” . 这种推断犯错误的概率不超过a; 否则, 就认为在犯错误的概率不超过a的前提下不能推断“X 与Y 有关系” , 或者在样本数据中没有足够证据支持结论“ X 与Y 有关系”.理解总结根据独立性检验的基本思想, 可知对于2K 的观测值 k , 存在一个正数0k为判断规则的临界值 ,当0kk, 就认为“两个分类变量之间有关系”; 否则就认为“两个分类变量没有关系”. 在实际应用中, 我们把0kk解释为有%100102kKP的 把 握 认 为 “ 两 个 分 类 变 量 之 间 有 关 系 ”; 把0kk解 释 为 不 能 以%100102kKP的把握认为“两个分类变量之间有关系”, 或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据.名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 5 页 - - - - - - - - -