概率与统计,无答案.docx
《概率与统计,无答案.docx》由会员分享,可在线阅读,更多相关《概率与统计,无答案.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率与统计,无答案概率与统计 1随机抽样 (1)简洁随机抽样:一般地,设一个总体含有 N 个个体,从中 逐个不放回地抽取 n 个个体作为样本(n≤N),假如每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简洁随机抽样 (2)系统抽样:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后根据事先定出的规则,从每一部分抽取一个个体得到所须要的样本,这种抽样方法叫做系统抽样 (3)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后根据肯定的比例,从各层独立地抽取肯定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 三种抽样方法的共同点和联系
2、:(1)抽样过程中每个个体被抽取的机会均等 (2)系统抽样中在起始部分抽样时采纳简洁随机抽样;分层抽样中各层抽样时采纳简洁随机抽样或系统抽样 2用样本的频率分布估计总体分布 (1)在频率分布直方图中, 纵轴表示 频率/ 组距,数据落在各小组内的 频率用各小长方形的面积表示 各小长于 方形的面积总和等于 1.(2)频率分布折线图和总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图; 总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线 (3)茎叶图 茎是指中间的一列数,叶是从茎的旁边
3、生长出来的数 思维升华 (1)通过扇形统计图可以很清晰的表示出各部分数量同总数之间的关系 (2)折线图可以显示随时间(依据常用比例放置)而改变的连续数据,因此特别适用于显示在相等时间间隔下数据的趋势 (3)由茎叶图可以清楚地看到数据的分布状况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,其次点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐 3用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数 (2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数
4、(3)平均数:x x1 x 2 x nn,反映了一组数据的平均水平 (4)标准差:是样本数据到平均数的一种平均距离,s1n (x 1 x )2 (x 2 x ) 2 (x n x ) 2 . (5)方差:s 2 1n (x 1 x )2 (x 2 x ) 2 (x n x ) 2 (x n是样本数据,n 是样本容量, x 是样本平均数) 标准差、方差反映了数据对平均数的波动状况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定 思维升华 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值实际应用时,需先计算样本数据的平均数,分析平均水平,再计
5、算方差(标准差)分析稳定状况(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布状况,大致推断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小 4相关关系与回来方程 (1)相关关系的分类 正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关; 负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (2)线性相关关系 假如散点图中点的分布从整体上看大致在一条直线旁边,就称这两个变量之间具有线性相关关系,这条直线叫做回来直线 (3)回来
6、方程 最小二乘法 求回来直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法; 回来方程 方程ybxa是两个具有线性相关关系的变量的一组数据(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n )的回来方程,其中a,b是待定参数 bi 1n (x i x )(y i y )i 1n (x i x ) 2i 1nx i y i n x yi 1nx 2 i n x2,a y bx . (4)回来分析 定义:对具有相关关系的两个变量进行统计分析的一种常用方法;样本点的中心 对于一组具有线性相关关系的数据(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n )
7、,其中( x , y )称为样本点的中心; 相关系数 当 rgt;0 时,表明两个变量正相关; 当 rlt;0 时,表明两个变量负相关 r 的肯定值越接近于 1,表明两个变量的线性相关性越强r 的肯定值越接近于 0,表明两个变量之间几乎不存在线性相关关系通常|r|大于 0.75 时,认为两个变量有很强的线性相关性 思维升华 回来分析问题的类型及解题方法 (1)求回来方程 依据散点图推断两变量是否线性相关,如不是,应通过换元构造线性相关 利用公式,求出回来系数b. 待定系数法:利用回来直线过样本点的中心求系数a. (2)利用回来方程进行预料,把线性回来方程看作一次函数,求函数值 (3)利用回来直
8、线推断正、负相关,确定正相关还是负相关的是系数b. (4)回来方程的拟合效果,可以利用相关系数推断,当|r|越趋近于 1 时,两变量的线性相关性越强 5独立性检验 (1)分类变量:变量的不同值表示个体所属的不同类别,像这样的变量称为分类变量 (2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量 X 和 Y,它们的可能取值分别为x 1 ,x 2 和y 1 ,y 2 ,其样本频数列联表(称为 2×2 列联表)为 2×2 列联表y 1y 2总计 x 1a b ab x 2c d cd 总计 ac bd abcd构造一个随机变量 K 2 n(adbc) 2(a
9、b)(cd)(ac)(bd) ,其中 nabcd 为样本容量 (3)独立性检验 利用随机变量 K 2 来推断两个分类变量有关系的方法称为独立性检验 思维升华 独立性检验的一般步骤 (1)依据样本数据制成 2×2 列联表 (2)依据公式 K 2 n(adbc) 2(ab)(ac)(bd)(cd) 计算 K2 的观测值 k. (3)比较 k 与临界值的大小关系,作统计推断题型一 抽样方法 1用简洁随机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其中某一个体 a第一次被抽到的可能性与其次次被抽到的可能性分别是() A.110 ,110B.310 ,15C. 15
10、,310D.310 ,3102(2019全国)某学校为了解 1 000 名新生的身体素养,将这些学生编号为 1,2,1 000,从这些新生中用系统抽样方法等距抽取 100 名学生进行体质测验若 46 号学生被抽到,则下面 4 名学生中被抽到的是() A8 号学生 B200 号学生 C616 号学生 D815 号学生 3(2020四川成都诊断)某单位有男、女职工共 600 人,现用分层抽样的方法,从全部职工中抽取容量为 50 的样本,已知从女职工中抽取的人数为 15,那么该单位的女职工人数为_ 题型二 统计图表及应用 命题点 1 扇形图 例 1 (2018全国)某地区经过一年的新农村建设,农村的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 答案
限制150内