2022年统计学重点总结.docx
精选学习资料 - - - - - - - - - 学习必备 欢迎下载统计学学问总结1、统计学统计学是收集、处理、分析、说明数据并从数据中得出结论的科学;2、统计数据分类数据、次序数据、数值型数据3、总体总体是包含所讨论的全部个体(数据)的集合;4、样本样本是从总体中抽取的一部分元素的集合5、样本量样本量构成样本的元素的数目6、参数参数是用来描述总体特点的概括性数字度量7、统计量统计量是用来描述样本特点的概括性数字特点8、变量说明现象某种特点的概念1分类变量:说明事物类别的一个名称2 次序变量:说明事物有序类别的一个名称3 数值型变量:说明事物数字特点的一个名称名师归纳总结 9、概率抽样第 1 页,共 13 页- - - - - - -精选学习资料 - - - - - - - - - 学习必备 欢迎下载也称随机抽样,是指遵循随机原就进行的抽样,总体中的每个单位都有肯定的机会被选入样本 10、 抽样误差 抽样误差是由于抽样的随机性引起的样本结果与总体真值之间 的误差;11、 抽样框 抽样框是有关总体单位的名录 12、 掌握回答误差搞好问卷设计,调查过程的质量掌握(法,期望大家自己找寻)13、 数据的预处理1数据审核2 数据挑选3数据排序4 数据透视表 14、 频数ps:未能找到正确的方频数是落在某一特定类别或组里的数据个数 15、 比例 比例是一个样本(或总体)中各个部分的数据与全部数据之比 16、 比率 比率是样本(或总体)各不同类别数值之间的比值名师归纳总结 17、 条形图与直方图的区分:第 2 页,共 13 页- - - - - - -精选学习资料 - - - - - - - - - 学习必备 欢迎下载1条形图使用条形的长度表示各类别频数的多少,宽度是固定 的;直方图是用面积表示各类别频数的多少,矩形的高表示每 一组的频数或频率,宽度就表示各组的组距,因此其高度和宽度都有意义2 分组数据具有连续性,直方图的各举办通常是连续排列,条 形图是分开排列,3条形图用于展现数据,直方图用于展现数学值型数据最小值下四分位数中位数上四分位数最大值18、 箱线图19、 众数 众数是一组数据中显现次数最多的变量值,用 M0 表示20、 中位数 中位数是一组数据排序后处于中间位置上的变量值 21、 四分位数四分位数是数据排序后处于 22、平均数25%和 75%位置上的数平均数是一组数据相加后除以数据个数得到的结果1简洁平均数2 加权平均数3 几何平均数: G=名师归纳总结 - - - - - - -第 3 页,共 13 页精选学习资料 - - - - - - - - - 学习必备 欢迎下载23、 异众比率 异众比率是指非众数组的频数占总频数的比例 24、 离散系数 离散系数是一组数据的标准差与平均数之比 25、 抽样分布(定义)在总体 X的分布类型已知时,如对任意自然数 n,都 能导出统计量 T=TX1,X2, Xn的分布的数学表达式, 这种分布 称为精确地抽样分布 26、 总体分布 总体中各元素的观测值所形成的相对频数分布是总体分布 27、 样本分布从总体中抽取一个容量为n 的样本,由这 n 个观测值形成的相对频数分布,称为样本分布 28、 抽样分布在重复选取样本量为n 的样本时,由该样本统计量的全部可能取值形成的相对频数分布,称为抽样分布 29、 相关关系 变量之间存在的不确定的数量关系,称为相关关系 30、 相关系数 相关系数是依据样本数据运算的度量两个变量之间线性关系强 度的统计量;如为总体的,称为总体相关系数;如为样本的,就称为样本相关系数,记为名师归纳总结 - - - - - - -第 4 页,共 13 页精选学习资料 - - - - - - - - - 学习必备 欢迎下载另附重要公式:统计学重要公式名师归纳总结 1. 样本平均数:XXQUQL2X5.标准差:i2100%第 5 页,共 13 页n()总体标准差:12. 总体平均数:X( )样本标准差:2 S2 SN6.变异系数3. 四分位差: QDIQR2总体:CV100%标准差4.方差:Xi平均数()总体方差:样本:CVS100%N22 2 样本方差: SXiXn1YiYXiSX,或ZiX iiZ分数7.标准分数 Z8.样本协方差CovX,YSXYXinX19.皮尔逊相关系数rXYSSXYYLLXYLYY,SnX2n2XXXn,n2XiLXXXii2i1n,i1i1nnXnXiYii1XYiYiYi1LXYXini1i1n2Y2nnYiLYYYii1Yii1n,i1ninXiYiXi1n,Y1n- - - - - - -精选学习资料 - - - - - - - - - 10.加权平均数 X学习必备i欢迎下载WXiWi11.分组数据样本平均数 XFiX,X2Fi12.分组数据样本方差 S2FXin113.排列组合公式1n2nm1Pnmn.nnm.,n.12nCmPnmm.nn.m.,nm.BCmCnmnn1P A14.大事补的概率P A15.加法公式 PABPAPB-PA16.条件概率 PA|BPAB, PB|APABP BP A17.乘法公式 PABP B PA|BP A PB|A18.独立大事 PABP A P B19.全概率公式 PBnP A i PB|Aii 1名师归纳总结 20.贝叶斯公式 PAi|BP A i PB|AiP A i PB|Aij1p第 6 页,共 13 页PBnP Aj PB|A21. 离散型随机变量的数学期望E X,xj 1pxp x 22. 离散型随机变量的方差VarX2x2p x 23. 二项分布的概率函数p x x xC p qnx0,1, 2,.,n q124. 二项分布的数学期望和方差E X22np VarX2np25. 泊松分布p x xexex.x.27.超几何分布p x CxCnx,0xrrNrCn N28. 正态概率密度函数f 1ex2229.标准正态分布变换Zx- - - - - - -精选学习资料 - - - - - - - - - 30. X的数学期望和标准差:学习必备欢迎下载:X32. 估量 时的抽样误差E X,233. 总体均值的区间估量n,2n,有限总体时XNnn1 大样本且方差已知:XZ2N1无限总体时Xn2 大样本且方差未知:XZ2S n,31. 比例 的数学期望和标准差 P:3 总体正态 小样本 方差已知XZE pp ,有限总体时PNnp1p4 总体正态 小样本 方差未知Xt2SN1nn无限总体时Pp1p 34. 估量 时所需的样本容量:nZ222n235.总体比率P 的区间估量pZp1pn36.p 的区间估量时所需的样本容量pnZ22p1p237.大样本总体均值的检验统计量:方差已知:ZX/n,方差未知:ZX/n:tX/n,dfn1S38.小样本总体均值的检验统计量Sp039.总体比率检验统计量:Zp01p0n名师归纳总结 40. 总体均值的单侧检验中所需样本容量:1X2第 7 页,共 13 页nZZ222,用Z2代替Z即为双侧检验的公式0141.独立样本时,两个总体均值之差的点估量量:XX1X2 的期望值与标准差:E X1X212,2212X1X2n 1n2- - - - - - -精选学习资料 - - - - - - - - - 42. 两个总体均值之差的区间估量学习必备欢迎下载:1 大样本 n n 230,1,2 已知X12 S 122 S 21X22211X1X2Z2X1X2X 1X2的点估量量为:SX 1X2n 1n 22大样本,1,2 未知X 1X2ZSX222 2 时,X1X2的标准差121X2n 1n 2n 1n 23 小样本 正态X 1 X 2 t 2 S X 1 X 243. 两个总体均值之差的假设检验统计量名师归纳总结 1大样本 ZX1X22122,12p 1pp212p2第 8 页,共 13 页2122p2n 1n22小样本tX1X2111S2 pn 1n2:p13相关样本tddSdn44.两个比率之差的点估量量pp 1p2的期望值与标准差Ep 1p2p 1p2p1p11p1p21p 1p2n 1n211p1n 112nppp 1p2的点估量量:Sp 1p2n 1n2- - - - - - -精选学习资料 - - - - - - - - - 45.学习必备:欢迎下载两个总体比率之差的区间估量名师归纳总结 大样本n p 1,n 11p1,n p2,n21p25 时,Sp211n21S2第 9 页,共 13 页p 1p2Z Sp 1p2:246.两个总体比率之差的检验统计量Zp1p2p 1p2p 1p2总体比率合并估量:pn p1n p2n 1n2p1p 1p2 时p 1p 2的点估量量:Sp 1p2n 1n247.一个总体方差的区间估量:n122248.一个总体方差的检验统计量/ 2Sn1S2k11/ 2:22249.两个总体方差的检验统计量:F1S2,df2kfi50.拟合优度检验统计量:2eieii151.独立假设条件以下联表的期望频数j列之和:eijRTinCTj第i行之和第样本容量1独立性检验统计量:1C2ijfijeijeij2,dfR- - - - - - -精选学习资料 - - - - - - - - - 52.检验K个均值的相等性学习必备欢迎下载名师归纳总结 第个处理的样本均值:Xjnj,X jjj2,第 10 页,共 13 页Xiji1njnj第个处理的样本方差:S2 jXiji11njknjXij,ntkjiX1j总样本均值:Xtj1i1n1ntj j 1,处理均方:MSTRSSTR1XjkXt2处理平方和:SSTRkj nj j1误差均方:MSEnSSEk,1S2t误差平方和:SSEknj:jj1MSTRFk个均值相等检验统计量XMSE总平方和:SSTknjX2ijtj1i1SSE平方和分解:SSTSSTRX i多重比较方法:tFisher LSD的检验统计量1MSEnin- - - - - - -精选学习资料 - - - - - - - - - 54.随机化区组设计:学习必备欢迎下载名师归纳总结 总平方和:SStkaXijXt2,dftnt1,b111,1第 11 页,共 13 页j1i1处理平方和:SSbakX.jXt2,dfbk1,j1区组平方和:SSrkaXi.Xt2,dfra1,i1误差平方和:SSeSStSSbSSr,dfek1a求平方和的另一种方法:1,总平方和:SStX2akXij2,dftakij处理平方和:SSbXij2akXij2,dfka区组平方和:SSrXij2akXij2,dfra1,k误差平方和:SSeSStSSbSSr,dfek1a1b55.析因试验:总平方和:SSTia1jb1kr1XijkXt2,dftnt1因子A平方和:SSAbraXi.Xt2,dfAa1,ai1因子B平方和:SSBarjb1X.jXt2,dfBb1,交互作用平方和:SSABrabXijXi.X.jXt2,dfABi1j1ab r1误差平方和:SSESSTSSASSBSSAB dfeabrab57.简洁线性回来模型:y01x简洁线性回来方程:Ey01x估量的简洁线性回来方程:yb0b x最小二乘法: minyiyi2估量的回来方程的斜率和截距:b1x yi2xii2yi,nxxnb0yb x- - - - - - -精选学习资料 - - - - - - - - - 平方和分解:SSTSSR学习必备欢迎下载SSE名师归纳总结 误差平方和:SSEyiyi2y2Xi2r2第 12 页,共 13 页总平方和:SSTyiy2y2inb回来平方和:SSRyiy2b2X2inX YiXiYi2nXi2Xi21 的符号n判定系数打算系数 :R2r2SSRSST样本相关系数:rxyb1 的符号判定系数均方误差2 的估量量 :S2MSESSE2n估量量的标准误差:SMSESSE2nb 1 的标准差:b 1X2Xi2inb 1 的估量的标准差:S b 1X2 iSXi2nt统计量:tb 1S b 1回来均方:MSRSSRSSRSSR自变量的个数1F检验统计量:FMSRMSEy 0的估量的标准差:Sy0S1XX0X22 in2X iX0X2inE y0 的置信区间估量:y0t/ 2Sy0一个个别值估量的标准差:Sy 0y0S11Xn2X2iny 0的猜测区间估量:y0t/ 2Sy0y0- - - - - - -精选学习资料 - - - - - - - - - 58. 多元线性回来模型:学习必备欢迎下载名师归纳总结 多元回来方程:y01x 12x 2pxp1pxp第 13 页,共 13 页估量的多元回来方程:Ey01x 12x2最小二乘法: miny iy i2SSRSSESST SSR SSE 之间的关系:SST多元打算系数:R2SSR1R2n1SST修正的多元打算系数:2 R a1np回来均方:MSRSSRp误差均方:MSEnSSE1pF检验统计量:FMSRMSEt检验统计量:tb iS b i- - - - - - -