概率统计知识点全面总结.pdf
《概率统计知识点全面总结.pdf》由会员分享,可在线阅读,更多相关《概率统计知识点全面总结.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、知识点总结:统计与概率知识点总结:统计与概率I I 统计统计1 1三大抽样三大抽样(1)(1)基本定义:基本定义:总体:在统计中,所有考查对象的全体叫做全体 个体:在所有考查对象中的每一个考查对象都叫做个体 样本:从总体中抽取的一部分个体叫做总体的样本 样本容量:样本中个体的数目叫做样本容量(2)(2)抽样方法:抽样方法:简单随机抽样:简单随机抽样:逐个不放回、等可能性、有限性。=适用于总体较少抽签法:抽签法:整体编号(1N)放入不透明的容器中搅拌均匀逐个抽取n 次,即可得样本容量为n 的样本。随机数表法:随机数表法:整体编号(等位数,如001、111 不能是 1、111)从09中随机取一行一
2、列然后初方向随机(上、下、左、右)重复,超过范围则忽略不计直至取得以n 为样本容量的样本。系统抽样:容量大等距,等可能。系统抽样:容量大等距,等可能。=适用于总体多用随机方法编号,若 N 无法被整除,则剔除后再分组,kN。再用简单随机抽样法来抽取一个nnN个体,设为 l,则编号为 l,k+l,2k+l(n-1)k,抽出容量为 n 的样本。(每组编号相同)。分层抽样:总体差异明显按所占比例抽取等可能分层抽样:总体差异明显按所占比例抽取等可能=适用于由差异明显的几部分构成的总体总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样抽样比为:k样本容量样本容量各层样本容量各层样本
3、容量抽样比抽样比=总体个数总体个数各层个体数量各层个体数量3 3总体分布的估计:总体分布的估计:(1)(1)一表二图:一表二图:频率分布表数据详实频率分布直方图分布直观频率分布折线图便于观察总体分布趋势注:总体分布的密度曲线与横轴围成的面积为1。(2)(2)茎叶图:茎叶图:茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数众位数等。个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。14 4样本分析样本分析(1)在频率直方图中计算众数平均数中位数众数在样本数据的频率分布直方图中,就是最高矩形最高矩形的中点中点的横坐标横坐标。(最多的那个)-忽视其他数据中位数在频率分
4、布直方图中,中位数左边左边和右边右边的直方图的面积面积应该相等相等。(最中间的,若偶取平均)-对极端值不敏感平均数频率分布直方图中每个小矩形的面积每个小矩形的面积乘以小矩形底边中点的横坐标小矩形底边中点的横坐标之和和。-可靠性低极差(全距)样本中最大值与最小值的差值在频率分布直方图中,纵轴表示频率频率,数据落在各小组内的频率用各小矩形的面积各小矩形的面积表示各小矩形的面积总和等于 1.组距组距频数频数频数频数频率频率,此关系式的变形为,此关系式的变形为样本容量样本容量,也可变形为,也可变形为样本容量频率频数样本容量频率频数。样本容量样本容量频率频率(2)平均数的求法:题目类型有离散型和连续型两
5、种情况n 算数平均数算数平均数:x x1 x2.xn1xi加权平均数加权平均数:xnni1 x1p1 x2p2.xnpnxipii1n方方 差差:s s2 2n n(x x1 11 11 1PS:PS:加权平均数加权平均数对一些数据的重要程度作出安排,在每个数据中根据它的重要的程度进行取值.按百分比算p1,p2,.,pix1,x2,.,xix x)(x x2 22 2x x)2 2(x xn nx x)标标 准准 差差:s s2 2n n(x x1 1x x)(x x2 22 2x x)(x xn nx x)2 22 2注:特别地,对于连续型的随机变量在分好组后,其x1,x2,.,xi应该取每
6、一组的组中值近似的表示注:方差与标准差越小,说明样本数据越稳定。平均数平均数反映数据总体水平;方差方差与标准差标准差反映数据的稳定水平。5 5线性回归方程线性回归方程变量之间的两类关系:函数关系(确定性关系)与相关关系(非确定性关系);制作散点图,判断线性相关关系;是估计,如(yi)是平均,如(yi)线性回归方程:(最小二乘法)yi则是真实值.注:其中x y y2 y3 ynx1 x2 x3 xn(x,y)称为样本点的中心,y 1,(回归方程必过此点)nn相关系数r当r0 时,表明两个变量正相关;当r0 时,表明两个变量负相关.r的绝对值越接近于 1,表明两个变量的线性相关性越强;r的绝对值越
7、接近于 0,表明两个变量之间几乎不存在线性关系通常|r|大于时,认为两个变量有很强的线性相关性残差:eiyi-yi相关指数(R)2残差平方和2即真实值-预报值R 越大,分母是定值,也可看分子。则残差平方和越小,模型拟合效果越好。在线性回归模型中,R 表示解释变量对预报变量的变化的贡献率。R 越接近 1,表示回归效果越好.226.6.独立性检验独立性检验1(1)22 列联表:假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表为:y y1 1a ac ca ac cy y2 2b bd db bd d总计总计x x1 1x x2 2总计总计a ab bc cd da
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 知识点 全面 总结
限制150内