《概率统计复习专题(共19页).doc》由会员分享,可在线阅读,更多相关《概率统计复习专题(共19页).doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上 概率统计【重点知识回顾】概率(1)事件与基本事件:基本事件:试验中不能再分的最简单的“单位”随机事件;一次试验等可能的产生一个基本事件;任意两个基本事件都是互斥的;试验中的任意事件都可以用基本事件或其和的形式来表示(2)频率与概率:随机事件的频率是指此事件发生的次数与试验总次数的比值频率往往在概率附近摆动,且随着试验次数的不断增加而变化,摆动幅度会越来越小随机事件的概率是一个常数,不随具体的实验次数的变化而变化(3)互斥事件与对立事件:事件定义集合角度理解关系互斥事件事件与不可能同时发生两事件交集为空事件与对立,则与必为互斥事件;事件与互斥,但不一是对立事件对立事件
2、事件与不可能同时发生,且必有一个发生两事件互补(4)古典概型与几何概型:古典概型:具有“等可能发生的有限个基本事件”的概率模型几何概型:每个事件发生的概率只与构成事件区域的长度(面积或体积)成比例两种概型中每个基本事件出现的可能性都是相等的,但古典概型问题中所有可能出现的基本事件只有有限个,而几何概型问题中所有可能出现的基本事件有无限个(5)古典概型与几何概型的概率计算公式:古典概型的概率计算公式:几何概型的概率计算公式:两种概型概率的求法都是“求比例”,但具体公式中的分子、分母不同(6)概率基本性质与公式事件的概率的范围为:互斥事件与的概率加法公式:对立事件与的概率加法公式:(7) 如果事件
3、A在一次试验中发生的概率是p,则它在n次独立重复试验中恰好发生k次的概率是pn(k) = Cpk(1p)nk.实际上,它就是二项式(1p)+pn的展开式的第k+1项.(8)独立重复试验与二项分布一般地,在相同条件下重复做的n次试验称为n次独立重复试验注意这里强调了三点:(1)相同条件;(2)多次重复;(3)各次之间相互独立;二项分布的概念:一般地,在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为此时称随机变量服从二项分布,记作,并称为成功概率统计(1)三种抽样方法简单随机抽样简单随机抽样是一种最简单、最基本的抽
4、样方法抽样中选取个体的方法有两种:放回和不放回我们在抽样调查中用的是不放回抽取简单随机抽样的特点:被抽取样本的总体个数有限从总体中逐个进行抽取,使抽样便于在实践中操作它是不放回抽取,这使其具有广泛应用性每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性实施抽样的方法:抽签法:方法简单,易于理解随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,9这十个数字的数表随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性系统抽样系统抽样适用于总体中的个体数较多的情况系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个
5、体均分后的每一段中进行抽样时,采用的是简单随机抽样系统抽样的操作步骤:第一步,利用随机的方式将总体中的个体编号;第二步,将总体的编号分段,要确定分段间隔,当(为总体中的个体数,n为样本容量)是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的个体个数能被n整除,这时;第三步,在第一段用简单随机抽样确定起始个体编号,再按事先确定的规则抽取样本通常是将加上间隔k得到第2个编号,将加上k,得到第3个编号,这样继续下去,直到获取整个样本分层抽样当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比
6、例进行简单随机抽样分层抽样的过程可分为四步:第一步,确定样本容量与总体个数的比;第二步,计算出各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步,将各层中抽取的个体合在一起,就是所要抽取的样本(2)用样本估计总体样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理作频率分布表与频率分布直方图时要注意方法步骤画样本频率分布直方图的步骤:求全距决定组
7、距与组数分组列频率分布表画频率分布直方图茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为 有时也用标准差的平方方差来代替标准差,两者实质上是一样的(3)两个变量之间的关系变量与变量之间的关系,除了确定性的函数关系外,还存在大量因变量的取值带有一定随机性的相关关系在本章中,我们学习了一元线性相关关系,通过建立回归直线方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存
8、在相关关系,还可利用最小二乘估计求出回归直线方程通常我们使用散点图,首先把样本数据表示的点在直角坐标系中作出,形成散点图然后从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,其对应的方程叫做回归直线方程在本节要经常与数据打交道,计算量大,因此同学们要学会应用科学计算器(4)求回归直线方程的步骤:第一步:先把数据制成表,从表中计算出;第二步:计算回归系数的a,b,公式为第三步:写出回归直线方程(4)独立性检验列联表:列出的两个分类变量和,它们的取值分别为和的样本频数表称为列联表1分类
9、12总计12总计 构造随机变量(其中)得到的观察值常与以下几个临界值加以比较:如果,就有的把握因为两分类变量和是有关系;如果就有的把握因为两分类变量和是有关系;如果就有的把握因为两分类变量和是有关系;如果低于,就认为没有充分的证据说明变量和是有关系 常用的统计图表(1)频率分布直方图 小长方形的面积组距频率;各小长方形的面积之和等于1;小长方形的高,所有小长方形的高的和为.(2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好3 用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小
10、依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)方差:s2(x1)2(x2)2(xn)2标准差:s.【典型例题】考点:概率【内容解读】概率试题主要考查基本概念和基本公式,对等可能性事件的概率、互斥事件的概率、独立事件的概率、事件在n次独立重复试验中恰发生k次的概率、离散型随机变量分布列和数学期望等内容都进行了考查。掌握古典概型和几何概型的概率求法。例1、在平面直角坐标系中,设D是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E是到原点的距离
11、不大于1的点构成的区域,向D中随意投一点,则落入E中的概率为 。例2某公交公司对某线路客源情况统计显示,公交车从每个停靠点出发后,车上的乘客人数及频率如下表:人数0671213181924253031人以上频率0.10.150.250.200.200.1(I)从每个停靠点出发后,乘客人数不超过24人的概率约是多少?(II)全线途经10个停靠点,若有2个以上(含2个)停靠点出发后,车上乘客人数超过18人的概率大于0.9,公交公司就要考虑在该线路增加一个班次,请问该线路需要增加班次吗?考点:统计【内容解读】理解简单随机抽样、系统抽样、分层抽样的概念,了解它们各自的特点及步骤会用三种抽样方法从总体中
12、抽取样本会用样本频率分布估计总体分布会用样本数字特征估计总体数字特征会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。例3(1) 一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为 .(2)设矩形的长为,宽为,其比满足,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样
13、本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同 D.两个批次总体平均数与标准值接近程度不能确定例4下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测
14、生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:325+43+54+645=66.5)例5、为了研究某高校大学新生学生的视力情况,随机地抽查了该校100名进校学生的视力情况,得到频率分布直方图,如图.已知前4组的频数从左到右依次是等比数列的前四项,后6组的频数从左到右依次是等差数列的前六项()求等比数列的通项公式;()求等差数列的通项公式;()若规定视力低于5.0的学生属于近视学生,试估计该校新生的近视率的大小.视力4.3 4.4 4.54.64.74.84.95.05.15.20.10.3例6、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医
15、院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日 期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(C)1011131286就诊人数y(个)222529261612 该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. ()求选取的2组数据恰好是相邻两个月的概率;(5分) ()若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程;(6分) ()若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,
16、试问该小组所得线性回归方程是否理想?(3分) (参考公式: )考点:考查几何概型例8 (面积类型)有如图几何图形,图中A、B两个圆的圆心连线过C圆的圆心且大小相等,则在图中随机取一点,此点来自阴影部分的概率是多少? (例8)例9 (时间类型1)已知经过某公交站236路公交车每15分钟一班,小洪同学已经在此公交站等了3分钟,现有一辆公交车进站,刚好是小洪要乘的236路公交车的概率是多少?例10 (时间类型2)已知某十字路口交通灯红灯为27秒,黄灯3秒,绿灯30秒,请问小洪同学到达十字路口即能过马路的概率是多少?例11 (长度类型)已知某段长16米的输电线有三处出现绝缘层老化,三处绝缘老化分别长2
17、.2米、1.9米、3.9米,维修员用检测笔第一次检测即能发现绝缘层老化的线路的概率是多少?例12 (数轴类型)已知,则函数的图象对称轴在区间之间的概率是多少?练习1 有已装满5L水的大水杯,小洪同学发现其水杯中有一只虫子,受惊之下小洪同学将杯子里的水杯倒了2L,问:虫子没被倒掉的概率是多少?练习2 20平米的小型游泳池的池底有一个半径为40厘米的铁球,小洪同学不小心失足掉到池里刚好碰到铁球的概率是多少?考点:与统计结合考查例13 某班在期中测试中数学成绩统计如下表:60分以下6080分80100分100115分115130分130分以上男 生(人数)48943x女 生(人数)37721y(1)
18、若6080分数段人数占班上总人数的百分之三十,且该班男生比女生多9名,求.(2)若从115分以上的学生抽取两人,这两人均为女生的概率是多少?解析:本题第一问要求用统计知识解出,且第二问的解答必须是第一问正确的情况下才能得到正确答案.考点:独立性检验例14 某班学生进行了一项关于“学习效率提高是否与服用补脑液有关”的调查,随机抽取20名学生进行调查得到如下联表:学习效率未提高学习效率提高总 计服用过补脑液358未服用补脑液21012总 计51520 表1.1:0.050.010.0050.0013.8416.6357.87910.828 公式: .(1)能否在犯错误率不超过0.01的前提下认为学
19、习效率提高与服用补脑液有关.典例精析题型一 频率分布问题【例1】为了估计某种产品的使用寿命的分布,对产品进行跟踪调查对200个产品跟踪调查的记录如下:寿命(h)100200200300300400400 500500600数量 (个)2030804030(1)列出频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)估计产品寿命在300 h以上的概率;(4)估计总体的平均值题型二 茎叶图的应用【例2】某班甲乙两同学的高考备考成绩如下:甲:512,554,528,549,536,556,534,541,522,538;乙:515,558,521,543,532,559,536,548,52
20、7,531.(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均数题型三 线性回归方程应用问题【例3】下表提供某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y(吨)标准煤的几组对照数据 x3456y2.5344.5 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=a+bx.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【例题4】在某种产品表面进行酸性腐蚀刻线试验,得到腐蚀深度y(微米)与腐蚀时间x
21、(秒)的一组数据如下所示:x(秒)510152030405060y(微米)610111316171923 (1)画出数据的散点图;(2)根据散点图你能得出什么结论;(3)求回归直线方程练习:某厂节能降耗技术改造后,在生产过程中记录了产量x(吨)与相应的生产能耗y(吨)的几组对应数据如右表所示,根据右表提供的数据,求出y关于x的线性回归方程为,那么a的值等于( )A0.35B3.15C3.5D0.4题型四 独立性检验的应用问题【例题5】某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末考
22、试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”。 (I )在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(II)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.0.250.150.100.050.025k1.3232.0722. 7063. 8415. 024甲班(A方式)乙班(B方式) 总计成绩优秀成绩不优秀总计例6.在中学生综合素质评价某个维度的测评中,分“优秀、合格、尚待改进”三个等级进行学生互评某校高一年级有男生500人,女生40
23、0人,为了了解性别对该维度测评结果的影响,采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下:表一:男生 表二:女生等级优秀合格尚待改进等级优秀合格尚待改进频数15 5频数 15 3 ()计算的值;()从表二的非优秀学生中随机选取2人交谈,求所选2人中恰有1人测评等级为合格的概率;()由表中统计数据填写下边22列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”参考数据与公式: ,其中临界值表:()0.100.050.0102.7063.8416.635男生女生总计优秀 非优秀总计例7某学校为调查高三年学生的身高情况,按随机抽样的方法抽取80名学生,得到男生身
24、高情况的频率分布直方图(图(1)和女生身高情况的频率分布直方图(图(2).已知图(1)中身高在170 175cm的男生人数有16人图(1) 图(2)()试问在抽取的学生中,男、女生各有多少人?()根据频率分布直方图,完成下列的22列联表,并判断能有多大(百分几)的把握认为“身高与性别有关”?170cm170cm总计男生身高女生身高总计()在上述80名学生中,从身高在170175cm之间的学生中按男、女性别分层抽样的方法,抽出5人,从这5人中选派3人当旗手,求3人中恰好有一名女生的概率 参考公式: 参考数据:0.0250.0100.0050.0015.0246.6357.87910.828变式训
25、练:3.已知事件“三位中国选手均进入亚运会体操决赛”,事件“三位中国选手均未进入亚运会体操决赛”,那么事件和是()等可能性事件不互斥事件互斥但不是对立事件对立事件4若对于变量与的组统计数据的回归模型中,相关指数,又知残差平方和为,那么的值为( )。A B. C. D. .5. 既然抛掷硬币出现正面的概率为0.5,那么连续两次抛掷一枚质地均匀的硬币,一定是一次正面朝上,一次反面朝上;如果某种彩票的中奖概率为,那么买1000张这种彩票一定能中奖;在乒乓球、排球等比赛中,裁判通过让运动员猜上抛均匀塑料圆板着地是正面还是反面来决定哪一方先发球,这样做不公平;一个骰子掷一次得到2的概率是,这说明一个骰子
26、掷6次会出现一次2.其中不正确的说法是( )A B C D 6.若,则方程有实根的概率为( )A B. C. D. 78954467428.下图是2010年渥太华冬奥会上,七位评委为某冰舞运动员打出的分数的茎叶统计图,去掉一个最低分和一个最高分后,所剩数据的平均数和方差分别为( )A,B,C,D,9某高校调查询问了56名男女大学生,在课余时间是否参加运动,得到下表所示的数据.从表中数据分析,有以上的把握认为性别与是否参加运动有关;在100个参加运动的大学生中有95个男生;认为性别与是否参加运动有关出错的可能性小于;在100个参加运动的大学生中有5个女生;其中正确命题的个数为( ).A1B2C3
27、D4 11. 2010年3月“十一届全国人大三次会议及十一届全国政协三次会议”在北京隆重召开,针对中国的中学教育现状,现场的2500名人大代表对其进行了综合评分,得到如下“频率分布直方图”(如图),试根据频率分布直方图,估计平均分为( ).A B C D 60708090100分数0.0160.0240.0280.03213半径为10cm的圆周上有两只蚂蚁,它们分别从两个不同的点A、B出发,沿劣弧相向而行,速度分别为10mm/s与8mm/s,则这两只蚂蚁在5s内相遇的概率为 .14((专题七文科第14题))15.已知现有编号为的5个图形,它们分别是两个直角边长为3、3的直角三角形;两个边长为3
28、的正方形;一个半径为3的圆.则以这些图形中的三个图形为一个立体图形的三视图的概率为 .16.随着经济的发展,电脑进入了越来越多的家庭,为了解电脑对生活的影响,就平均每天看电脑的时间,一个社会调查机构对某地居民调查了10000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10000人中再用分层柚样方法抽出100人做进一步调查,则在(小时)时间段内应抽出的人数是 .17.输血是重要的抢救生命的措施之一,但是要注意同种血型的人可以输血,O型血可以输给任一种血型的人,任何人的血都可以输给AB型血的人,其他不同血型的人不能互
29、相输血黄种人群中各种血型的人所占的比如下表所示:血型ABABO该血型的人所占比/%28298352010年4月14日玉树地震,小王不幸被建筑物压在下面,失血过多,需要输血,已知小王是B型血,问:(1)任找一个人,其血可以输给小王的概率是多少?(2)任找一个人,其血不能输给小王的概率是多少?18.某研究机构为了研究人的体重与身高之间的关系,随机抽测了20人,得到如下数据:序 号12345678910身高x(厘米)182164170176177159171166182166体重y(公斤)76606176775862607857序 号11121314151617181920身高x(厘米)169178
30、167174168179165170162170体重y(公斤)76746877637859756473 (1)若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”;“体重大于75(公斤)”的为“胖子”,“体重小于等于75(公斤)”的为“非胖子”.请根据上表数据完成下面的联列表: 高 个非高个合 计胖 子非胖子12合 计20(2)根据题(1)中表格的数据,若按99%的可靠性要求,能否认为体重与身高之间有关系? 19.为从甲乙两运动员中选拔一人,参加2010年广州亚运会体操项目,对甲、乙两运动员进行培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得出茎叶图
31、如下: (1)现要从中选拔一人参加亚运会,从平均成绩及发挥稳定性的角度考虑,你认为选派哪位学生参加合适?(2)从甲运动员预赛成绩中任取一次记为,从乙运动员预赛成绩中任取一次记为,求的概率.20.设,在线段上任取两点(端点除外),将线段分成了三条线段,(1)若分成的三条线段的长度均为正整数,求这三条线段可以构成三角形的概率;(2)若分成的三条线段的长度均为正实数,求这三条线段可以构成三角形的概率21.下表抄录了2010年1至4月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日 期1月10日2月10日3月10日4月10日昼夜温差x(C)1113128就诊人数y(个)25292616 (1)已知两变量、具有线性相关关系,求出关于的线性回归方程;(2)通过相关指数判断回归方程拟合效果.22.为选拔学生做亚运会志愿者,对某班50名学生进行了一次体育测试,成绩全部介于50与100之间,将测试结果按如下方式分成五组:每一组,第二组 ,第五组下图是按上述分组方法得到的频率分布直方图. (I)若成绩大于或等于60且小于80,认为合格,求该班在这次数学测试中成绩合格的人数;(II)从测试成绩在内的所有学生中随机抽取两名同学,设其测试成绩分别为、,求事件“”的概率.专心-专注-专业
限制150内