概率统计复习专题.doc





《概率统计复习专题.doc》由会员分享,可在线阅读,更多相关《概率统计复习专题.doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上 概率统计【重点知识回顾】概率(1)事件与基本事件:基本事件:试验中不能再分的最简单的“单位”随机事件;一次试验等可能的产生一个基本事件;任意两个基本事件都是互斥的;试验中的任意事件都可以用基本事件或其和的形式来表示(2)频率与概率:随机事件的频率是指此事件发生的次数与试验总次数的比值频率往往在概率附近摆动,且随着试验次数的不断增加而变化,摆动幅度会越来越小随机事件的概率是一个常数,不随具体的实验次数的变化而变化(3)互斥事件与对立事件:事件定义集合角度理解关系互斥事件事件与不可能同时发生两事件交集为空事件与对立,则与必为互斥事件;事件与互斥,但不一是对立事件对立事件
2、事件与不可能同时发生,且必有一个发生两事件互补(4)古典概型与几何概型:古典概型:具有“等可能发生的有限个基本事件”的概率模型几何概型:每个事件发生的概率只与构成事件区域的长度(面积或体积)成比例两种概型中每个基本事件出现的可能性都是相等的,但古典概型问题中所有可能出现的基本事件只有有限个,而几何概型问题中所有可能出现的基本事件有无限个(5)古典概型与几何概型的概率计算公式:古典概型的概率计算公式:几何概型的概率计算公式:两种概型概率的求法都是“求比例”,但具体公式中的分子、分母不同(6)概率基本性质与公式事件的概率的范围为:互斥事件与的概率加法公式:对立事件与的概率加法公式:(7) 如果事件
3、A在一次试验中发生的概率是p,则它在n次独立重复试验中恰好发生k次的概率是pn(k) = Cpk(1p)nk.实际上,它就是二项式(1p)+pn的展开式的第k+1项.(8)独立重复试验与二项分布一般地,在相同条件下重复做的n次试验称为n次独立重复试验注意这里强调了三点:(1)相同条件;(2)多次重复;(3)各次之间相互独立;二项分布的概念:一般地,在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为此时称随机变量服从二项分布,记作,并称为成功概率统计(1)三种抽样方法简单随机抽样简单随机抽样是一种最简单、最基本的抽
4、样方法抽样中选取个体的方法有两种:放回和不放回我们在抽样调查中用的是不放回抽取简单随机抽样的特点:被抽取样本的总体个数有限从总体中逐个进行抽取,使抽样便于在实践中操作它是不放回抽取,这使其具有广泛应用性每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性实施抽样的方法:抽签法:方法简单,易于理解随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,9这十个数字的数表随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性系统抽样系统抽样适用于总体中的个体数较多的情况系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个
5、体均分后的每一段中进行抽样时,采用的是简单随机抽样系统抽样的操作步骤:第一步,利用随机的方式将总体中的个体编号;第二步,将总体的编号分段,要确定分段间隔,当(为总体中的个体数,n为样本容量)是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的个体个数能被n整除,这时;第三步,在第一段用简单随机抽样确定起始个体编号,再按事先确定的规则抽取样本通常是将加上间隔k得到第2个编号,将加上k,得到第3个编号,这样继续下去,直到获取整个样本分层抽样当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比
6、例进行简单随机抽样分层抽样的过程可分为四步:第一步,确定样本容量与总体个数的比;第二步,计算出各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步,将各层中抽取的个体合在一起,就是所要抽取的样本(2)用样本估计总体样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理作频率分布表与频率分布直方图时要注意方法步骤画样本频率分布直方图的步骤:求全距决定组
7、距与组数分组列频率分布表画频率分布直方图茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为 有时也用标准差的平方方差来代替标准差,两者实质上是一样的(3)两个变量之间的关系变量与变量之间的关系,除了确定性的函数关系外,还存在大量因变量的取值带有一定随机性的相关关系在本章中,我们学习了一元线性相关关系,通过建立回归直线方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存
8、在相关关系,还可利用最小二乘估计求出回归直线方程通常我们使用散点图,首先把样本数据表示的点在直角坐标系中作出,形成散点图然后从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,其对应的方程叫做回归直线方程在本节要经常与数据打交道,计算量大,因此同学们要学会应用科学计算器(4)求回归直线方程的步骤:第一步:先把数据制成表,从表中计算出;第二步:计算回归系数的a,b,公式为第三步:写出回归直线方程(4)独立性检验列联表:列出的两个分类变量和,它们的取值分别为和的样本频数表称为列联表1分类
9、12总计12总计 构造随机变量(其中)得到的观察值常与以下几个临界值加以比较:如果,就有的把握因为两分类变量和是有关系;如果就有的把握因为两分类变量和是有关系;如果就有的把握因为两分类变量和是有关系;如果低于,就认为没有充分的证据说明变量和是有关系 常用的统计图表(1)频率分布直方图 小长方形的面积组距频率;各小长方形的面积之和等于1;小长方形的高,所有小长方形的高的和为.(2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好3 用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小
10、依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)方差:s2(x1)2(x2)2(xn)2标准差:s.【典型例题】考点:概率【内容解读】概率试题主要考查基本概念和基本公式,对等可能性事件的概率、互斥事件的概率、独立事件的概率、事件在n次独立重复试验中恰发生k次的概率、离散型随机变量分布列和数学期望等内容都进行了考查。掌握古典概型和几何概型的概率求法。例1、在平面直角坐标系中,设D是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E是到原点的距离
11、不大于1的点构成的区域,向D中随意投一点,则落入E中的概率为 。例2某公交公司对某线路客源情况统计显示,公交车从每个停靠点出发后,车上的乘客人数及频率如下表:人数0671213181924253031人以上频率0.10.150.250.200.200.1(I)从每个停靠点出发后,乘客人数不超过24人的概率约是多少?(II)全线途经10个停靠点,若有2个以上(含2个)停靠点出发后,车上乘客人数超过18人的概率大于0.9,公交公司就要考虑在该线路增加一个班次,请问该线路需要增加班次吗?考点:统计【内容解读】理解简单随机抽样、系统抽样、分层抽样的概念,了解它们各自的特点及步骤会用三种抽样方法从总体中
12、抽取样本会用样本频率分布估计总体分布会用样本数字特征估计总体数字特征会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。例3(1) 一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为 .(2)设矩形的长为,宽为,其比满足,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样
13、本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同 D.两个批次总体平均数与标准值接近程度不能确定例4下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测
14、生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:325+43+54+645=66.5)例5、为了研究某高校大学新生学生的视力情况,随机地抽查了该校100名进校学生的视力情况,得到频率分布直方图,如图.已知前4组的频数从左到右依次是等比数列的前四项,后6组的频数从左到右依次是等差数列的前六项()求等比数列的通项公式;()求等差数列的通项公式;()若规定视力低于5.0的学生属于近视学生,试估计该校新生的近视率的大小.视力4.3 4.4 4.54.64.74.84.95.05.15.20.10.3例6、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医
15、院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日 期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(C)1011131286就诊人数y(个)222529261612 该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. ()求选取的2组数据恰好是相邻两个月的概率;(5分) ()若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程;(6分) ()若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 复习 专题

限制150内