概率与统计,无答案.docx
概率与统计,无答案概率与统计 1随机抽样 (1)简洁随机抽样:一般地,设一个总体含有 N 个个体,从中 逐个不放回地抽取 n 个个体作为样本(n≤N),假如每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简洁随机抽样 (2)系统抽样:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后根据事先定出的规则,从每一部分抽取一个个体得到所须要的样本,这种抽样方法叫做系统抽样 (3)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后根据肯定的比例,从各层独立地抽取肯定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 三种抽样方法的共同点和联系:(1)抽样过程中每个个体被抽取的机会均等 (2)系统抽样中在起始部分抽样时采纳简洁随机抽样;分层抽样中各层抽样时采纳简洁随机抽样或系统抽样 2用样本的频率分布估计总体分布 (1)在频率分布直方图中, 纵轴表示 频率/ 组距,数据落在各小组内的 频率用各小长方形的面积表示 各小长于 方形的面积总和等于 1.(2)频率分布折线图和总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图; 总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线 (3)茎叶图 茎是指中间的一列数,叶是从茎的旁边生长出来的数 思维升华 (1)通过扇形统计图可以很清晰的表示出各部分数量同总数之间的关系 (2)折线图可以显示随时间(依据常用比例放置)而改变的连续数据,因此特别适用于显示在相等时间间隔下数据的趋势 (3)由茎叶图可以清楚地看到数据的分布状况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,其次点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐 3用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数 (2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数 (3)平均数:x x1 x 2 x nn,反映了一组数据的平均水平 (4)标准差:是样本数据到平均数的一种平均距离,s1n (x 1 x )2 (x 2 x ) 2 (x n x ) 2 . (5)方差:s 2 1n (x 1 x )2 (x 2 x ) 2 (x n x ) 2 (x n是样本数据,n 是样本容量, x 是样本平均数) 标准差、方差反映了数据对平均数的波动状况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定 思维升华 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定状况(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布状况,大致推断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小 4相关关系与回来方程 (1)相关关系的分类 正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关; 负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (2)线性相关关系 假如散点图中点的分布从整体上看大致在一条直线旁边,就称这两个变量之间具有线性相关关系,这条直线叫做回来直线 (3)回来方程 最小二乘法 求回来直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法; 回来方程 方程ybxa是两个具有线性相关关系的变量的一组数据(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n )的回来方程,其中a,b是待定参数 îïíïì båi 1n (x i x )(y i y )åi 1n (x i x ) 2åi 1nx i y i n x yåi 1nx 2 i n x2,a y bx . (4)回来分析 定义:对具有相关关系的两个变量进行统计分析的一种常用方法;样本点的中心 对于一组具有线性相关关系的数据(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n ),其中( x , y )称为样本点的中心; 相关系数 当 rgt;0 时,表明两个变量正相关; 当 rlt;0 时,表明两个变量负相关 r 的肯定值越接近于 1,表明两个变量的线性相关性越强r 的肯定值越接近于 0,表明两个变量之间几乎不存在线性相关关系通常|r|大于 0.75 时,认为两个变量有很强的线性相关性 思维升华 回来分析问题的类型及解题方法 (1)求回来方程 依据散点图推断两变量是否线性相关,如不是,应通过换元构造线性相关 利用公式,求出回来系数b. 待定系数法:利用回来直线过样本点的中心求系数a. (2)利用回来方程进行预料,把线性回来方程看作一次函数,求函数值 (3)利用回来直线推断正、负相关,确定正相关还是负相关的是系数b. (4)回来方程的拟合效果,可以利用相关系数推断,当|r|越趋近于 1 时,两变量的线性相关性越强 5独立性检验 (1)分类变量:变量的不同值表示个体所属的不同类别,像这样的变量称为分类变量 (2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量 X 和 Y,它们的可能取值分别为x 1 ,x 2 和y 1 ,y 2 ,其样本频数列联表(称为 2×2 列联表)为 2×2 列联表y 1y 2总计 x 1a b ab x 2c d cd 总计 ac bd abcd构造一个随机变量 K 2 n(adbc) 2(ab)(cd)(ac)(bd) ,其中 nabcd 为样本容量 (3)独立性检验 利用随机变量 K 2 来推断两个分类变量有关系的方法称为独立性检验 思维升华 独立性检验的一般步骤 (1)依据样本数据制成 2×2 列联表 (2)依据公式 K 2 n(adbc) 2(ab)(ac)(bd)(cd) 计算 K2 的观测值 k. (3)比较 k 与临界值的大小关系,作统计推断题型一 抽样方法 1用简洁随机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其中某一个体 a第一次被抽到的可能性与其次次被抽到的可能性分别是() A.110 ,110B.310 ,15C. 15 ,310D.310 ,3102(2019全国)某学校为了解 1 000 名新生的身体素养,将这些学生编号为 1,2,1 000,从这些新生中用系统抽样方法等距抽取 100 名学生进行体质测验若 46 号学生被抽到,则下面 4 名学生中被抽到的是() A8 号学生 B200 号学生 C616 号学生 D815 号学生 3(2020四川成都诊断)某单位有男、女职工共 600 人,现用分层抽样的方法,从全部职工中抽取容量为 50 的样本,已知从女职工中抽取的人数为 15,那么该单位的女职工人数为_ 题型二 统计图表及应用 命题点 1 扇形图 例 1 (2018全国)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入改变状况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是() A新农村建设后,种植收入削减 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 命题点 2 折线图 例 2 (2017全国)某城市为了解游客人数的改变规律,提高旅游服务质量,收集并整理了2014 年 1 月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图 依据该折线图,下列结论错误的是() A月接待游客量逐月增加 B年接待游客量逐年增加 C各年的月接待游客量高峰期大致在 7,8 月 D各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,改变比较平稳 命题点 3 茎叶图 例 3 (2020四川成都其次次诊断)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场竞赛的得分制成如图所示的茎叶图有如下结论:甲最近五场竞赛得分的中位数高于乙最近五场竞赛得分的中位数; 甲最近五场竞赛得分的平均数低于乙最近五场竞赛得分的平均数; 从最近五场竞赛的得分看,乙比甲更稳定; 从最近五场竞赛的得分看,甲比乙更稳定 其中全部正确结论的编号为() ABCD 命题点 4 频率分布直方图 例 4 从某小区抽取 100 户居民进行月用电量调查,发觉其用电量都在 50 至 350 度之间,频率分布直方图如图 (1)直方图中 x 的值为_;(2)在这些用户中,月用电量落在区间100,250)内的户数为_跟踪训练 (1)(2020四省八校联盟联考)如图 1 为某省 2019 年 14 月份快递业务量统计图,图 2 为该省 2019 年 14 月份快递业务收入统计图,对统计图理解错误的是() A2019 年 14 月份快递业务量 3 月份最高,2 月份最低,差值接近 2 000 万件 B2019 年 14 月份快递业务量同比增长率均超过 50%,在 3 月份最高,和春节蛰伏后网购迎来喷涨有关 C从两图中看,增量与增长速度并不完全一样,但业务量与业务收入改变高度一样 D从 14 月份来看,业务量与业务收入有波动,但整体保持高速增长 (2)(2020贵州贵阳检测)如图所示折线图是某超市 2020 年一月份至五月份的营业额与成本数据,依据该折线图,下列说法正确的是()A该超市 2020 年的前五个月中三月份的利润最高 B该超市 2020 年的前五个月的利润始终呈增长趋势 C该超市 2020 年的前五个月的利润的中位数为 0.8 万元 D该超市 2020 年前五个月的总利润为 3.5 万元 (3)(2020广西柳州、梧州、贵港、北海、钦州、河池、防城港联考)传承传统文化再掀热潮,在刚刚过去的假期中,央视科教频道以诗词学问竞赛为主的中国诗词大会火爆荧屏,如图的茎叶图是两位选手在个人追逐赛中的竞赛得分,则下列说法正确的是() A甲的平均数大于乙的平均数 B甲的中位数大于乙的中位数 C甲的方差大于乙的方差 D甲的方差小于乙的方差 (4)(2019昆明模拟)为了解学生阳光体育活动的状况,随机统计了n 名学生的阳光体育活动时间(单位:分钟),所得数据都在区间10,110内,其频率分布直方图如图所示已知活动时间在10,35)内的频数为 80,则 n 的值为()A700B800C850D900 题型三 用样本的数字特征估计总体的数字特征 例 5 (2019全国)某行业主管部门为了解本行业中小企业的生产状况,随机调查了 100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表 y 的分组 0.20,0) 0,0.20) 0.20,0.40) 0.40,0.60) 0.60,0.80) 企业数 2 24 53 14 7 (1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到 0.01) 附:74≈8.602.跟踪训练 2 (2020四川成都诊断)我国是世界上严峻缺水的国家,城市缺水问题较为突出,某市政府为了激励居民节约用水,安排在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准(单位:吨):用水量不超过 x 的部分按平价收费,超过 x 的部分按议价收费,为了了解全市市民用水量分布状况,通过抽样,获得了 100 位居民某年的月用水量(单位:吨),将数据根据0,0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图(1)求频率分布直方图中 a 的值; (2)若该市政府希望使 85%的居民每月的用水量不超过标准 x(吨),估计 x 的值,并说明理由题型四 相关关系的推断 1在一次对人体脂肪含量和年龄关系的探讨中,探讨人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图依据该图,下列结论中正确的是()A人体脂肪含量与年龄正相关,且脂肪含量的中位数等于 20% B人体脂肪含量与年龄正相关,且脂肪含量的中位数小于 20% C人体脂肪含量与年龄负相关,且脂肪含量的中位数等于 20% D人体脂肪含量与年龄负相关,且脂肪含量的中位数小于 20% 2(2020云南昆明诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份 1 2 3 4 5 6 人均销售额 6 5 8 3 4 7 利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3依据表中数据,下列说法正确的是() A利润率与人均销售额成正相关关系 B利润率与人均销售额成负相关关系 C利润率与人均销售额成正比例函数关系 D利润率与人均销售额成反比例函数关系题型五 回来分析 命题点 1 线性回来分析 例 1 (2020广西南宁模拟)某地区某农产品近几年的产量统计如下表:年份 2012 2013 2014 2015 2016 2017 年份代码 t 1 2 3 4 5 6 年产量 y(万吨) 6.6 6.7 7 7.1 7.2 7.4(1)依据表中数据,建立 y 关于 t 的线性回来方程yb ta; (2)依据线性回来方程预料 2020 年该地区该农产品的年产量 附:对于一组数据(t 1 ,y 1 ),(t 2 ,y 2 ),(t n ,y n ),其回来直线ybta的斜率和截距的最小二乘估计分别为 båi 1n (t i t )(y i y )åi 1n (t i t ) 2,a y b t . (参考数据:åi 16 (t i t )(y i y )2.80,计算结果保留小数点后两位)命题点 2 非线性回来 例 2 某公司为确定下一年度投入某种产品的宣扬费,需了解年宣扬费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的年宣扬费 x i 和年销售量 y i (i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值 x y w åi 18 (x i x ) 2åi 18 (w i w ) 2åi 18 (x i x ) (y i y ) åi 18 (w i w ) (y i y ) 46.6 563 6.8 289.8 1.6 1 469 108.8表中 w i x i , w 18 åi 18w i . (1)依据散点图推断 yabx 与 ycd x哪一个相宜作为年销售量 y 关于年宣扬费 x 的回.