统计学重点总结_办公文档-工作总结 .pdf
学习必备 欢迎下载 统计学知识总结 1、统计学 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。2、统计数据 分类数据、顺序数据、数值型数据 3、总体 总体是包含所研究的全部个体(数据)的集合。4、样本 样本是从总体中抽取的一部分元素的集合 5、样本量 样本量构成样本的元素的数目 6、参数 参数是用来描述总体特征的概括性数字度量 7、统计量 统计量是用来描述样本特征的概括性数字特征 8、变量 说明现象某种特征的概念 1分类变量:说明事物类别的一个名称 2顺序变量:说明事物有序类别的一个名称 3数值型变量:说明事物数字特征的一个名称 9、概率抽样 学习必备 欢迎下载 也称随机抽样,是指遵循随机原则进行的抽样,总体中的每个单位都有一定的机会被选入样本 10、抽样误差 抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。11、抽样框 抽样框是有关总体单位的名录 12、控制回答误差 搞好问卷设计,调查过程的质量控制(ps:未能找到正确的方法,希望大家自己找寻)13、数据的预处理 1数据审核 2数据筛选 3数据排序 4数据透视表 14、频数 频数是落在某一特定类别或组里的数据个数 15、比例 比例是一个样本(或总体)中各个部分的数据与全部数据之比 16、比率 比率是样本(或总体)各不同类别数值之间的比值 17、条形图与直方图的区别:类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 1条形图使用条形的长度表示各类别频数的多少,宽度是固定的;直方图是用面积表示各类别频数的多少,矩形的高表示每一组的频数或频率,宽度则表示各组的组距,因此其高度和宽度都有意义 2分组数据具有连续性,直方图的各举行通常是连续排列,条形图是分开排列,3条形图用于展示数据,直方图用于展示数学值型数据 最小值 下四分位数 中位数 上四分位数 最大值 18、箱线图 19、众数 众数是一组数据中出现次数最多的变量值,用 M0表示 20、中位数 中位数是一组数据排序后处于中间位置上的变量值 21、四分位数 四分位数是数据排序后处于 25%和 75%位置上的数 22、平均数 平均数是一组数据相加后除以数据个数得到的结果 1简单平均数 2加权平均数 3几何平均数:G=类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 23、异众比率 异众比率是指非众数组的频数占总频数的比例 24、离散系数 离散系数是一组数据的标准差与平均数之比 25、抽样分布(定义)在总体 X的分布类型已知时,若对任意自然数 n,都能导出统计量 T=T(X1,X2,Xn)的分布的数学表达式,这种分布称为精确地抽样分布 26、总体分布 总体中各元素的观测值所形成的相对频数分布是总体分布 27、样本分布 从总体中抽取一个容量为 n 的样本,由这 n 个观测值形成的相对频数分布,称为样本分布 28、抽样分布 在重复选取样本量为 n 的样本时,由该样本统计量的所有可能取值形成的相对频数分布,称为抽样分布 29、相关关系 变量之间存在的不确定的数量关系,称为相关关系 30、相关系数 相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若为总体的,称为总体相关系数;若为样本的,则称为样本相关系数,记为 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 另附重要公式:统计学重要公式 D22221.XX2.N3.Q4.1 (2)S1ULiiXnIQRQQXNXn样本平均数:总体平均数:四分位差:方差:()总体方差:样本方差:225.1 2 SS6.100%100%100%CVSCVX 标准差:()总体标准差:()样本标准差:变异系数标准差总体:平均数样本:22121111117.(),8.(,)19.,iiiiiiXYXYXYXYXYXXYYninniXXiiiinniinniiXYiiiiiiYYiXXXZZZSXXYYCovXYSnSLrSSLLXLXXXnXYLXXYYXYnLY标准分数分数或样本协方差皮尔逊相关系数22121111,ninniiiinniiiiYYYnXYXYnn 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 2210.X11.X12.S113.!121,!12,!,!iiiiiiiimnmmnnmnmnnWXWFXFFXXnnPnnnnmmnnPnCmmnmCC 加权平均数分组数据样本平均数分组数据样本方差排列组合公式 nii 114.()1()15.P(AB)P(A)P(B)-P(AB)P(AB)P(AB)16.P(A|B),P(B|A)()()17.P(AB)()P(A|B)()P(B|A)18.P(AB)()()19.P(B)()P(B|A)20.iP AP AP BP AP BP AP A P BP A 事件补的概率加法公式条件概率乘法公式独立事件全概率公式贝叶iiinjj 1()P(B|A)()P(B|A)P(A|B)P(B)()P(B|A)iijP AP AP A斯公式 22221.()()22.()()23.(),0,1,2,.,124.(),()(1)25.()!27.()xxnxnxxxnxrNrE Xxp xVar Xxp xp xC p qxn qpE Xnp Var Xnppeep xxxCCp xC 离散型随机变量的数学期望离散型随机变量的方差二项分布的概率函数二项分布的数学期望和方差泊松分布超几何分布222,0128.()229.nNxxrf xexZ 正态概率密度函数标准正态分布变换 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 30.X:(),131.:(),(1)1(1)XXPPE XNnNnnPE ppNnppNnppn 的数学期望和标准差有限总体时无限总体时比例 的数学期望和标准差有限总体时无限总体时 2222222232.:33.(1):,(2):,(3),(4),34.:XXZnSXZnXZnSXtnZn估计 时的抽样误差总体均值的区间估计大样本且方差已知大样本且方差未知总体正态小样本方差已知总体正态小样本方差未知估计 时所需的样本容量 2222000(1)35.(1)36.37.:,/:/38.:,1/39.:(1)ppPpZnZpppnXZnXZSnXtdfnSnppZppn 总体比率的区间估计的区间估计时所需的样本容量大样本总体均值的检验统计量方差已知方差未知小样本总体均值的检验统计量总体比率检验统计量 122222011212121222121240.:,41.,:(),XXZZnZZXXXXE XXnn总体均值的单侧检验中所需样本容量用代替即为双侧检验的公式独立样本时两个总体均值之差的点估计量的期望值与标准差 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 12121212121212121222212121212222222121212121212242.:(1)(,30),:(2),11,()(3),XXXXXXXXXXXXn nXXZSSSnnXXZSXXnnnnXXtS 两个总体均值之差的区间估计大样本已知的点估计量为大样本未知时的标准差小样本 正态 12121222121212122121212121211221112143.X(1)Z,X(2),11(3)44.:(1)(1)(1)pddppXnnXtSnndtSnppppEpppppppppppnnn两个总体均值之差的假设检验统计量大样本小样本相关样本两个比率之差的点估计量的期望值与标准差1212222112212(1)(1)(1):pppppnppppSnn的点估计量 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 12121212111122221221212112212121245.:,(1),(1)5,46.:11:(1)ppppppppn p npn pnpppZ SppppZn pn ppnnppSppnn两个总体比率之差的区间估计大样本时两个总体比率之差的检验统计量总体比率合并估计时的点估计量 22222/2(1/2)2222122221221147.:148.:49.:50.:,151.:kiiiiijijijijjijnSnSnSSFSfedfkeRTCTijenfee一个总体方差的区间估计一个总体方差的检验统计量两个总体方差的检验统计量拟合优度检验统计量独立假设条件下列联表的期望频数第行之和第列之和样本容量独立性检验统计量,11idfRC 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 1221111212152.:,:,1:,1:,1:():,:1jjjnijijjnijjijjnkijkjittjjtkjjtjtkjjjKXXnXXSnXXnnnSSTRMSTRkSSTRnXXSSEMSEnkSSEnSk 检验个均值的相等性第个处理的样本均值第个处理的样本方差总样本均值处理均方处理平方和误差均方误差平方和个均值相等检211i:X LSD:t11jnkijtjijijMSTRFMSESSTXXSSTSSTRSSEXFisherMSEnn 验统计量总平方和平方和分解多重比较方法的检验统计量 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 2112.12.12254.:,1,:,1,:,1,:,11:,1,:katijtttjikbjtbjaritrietbreijtijtibSSXXdfnSSaXXdfkSSkXXdfaSSSSSSSSdfkaXSSXdfakakXSS随机化区组设计总平方和处理平方和区组平方和误差平方和求平方和的另一种方法总平方和处理平方和 2222,1,:,1,:,11ji jbi ji jrretbreXdfkaakXXSSdfakakSSSSSSSSdfka区组平方和误差平方和 21112.12.12.1155.:,1:,1,:,1,:,11:,abrijktttijkaitAibjtBjabijijtABijeSSTXXdfnASSAbrXXdfaBSSBarXXdfbSSABrXXXXdfabSSESSTSSASSBSSAB dfa 析因试验总平方和因子平方和因子平方和交互作用平方和误差平方和(1)brabab r 01010121220157.:min:,iiiiiiiyxEyxybb xyyxyx ynbxxnbyb x 简单线性回归模型简单线性回归方程估计的简单线性回归方程最小二乘法估计的回归方程的斜率和截距 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 222222222222221122:():():iiiiiiiiiiiiiixySSTSSRSSESSEyyySSTyyynXSSRyybXnXYX YnXXnSSRRrSSTrbbrSM平方和分解误差平方和总平方和回归平方和判定系数决定系数样本相关系数的符号判定系数的符号均方误差的估计量2:2SSESEnSSESMSEn估计量的标准误差 111000012212212002200/20:1:1:():1:1biibiibyiiyyybXXnSbSXXnbttSSSRSSRMSRSSRMSRFFMSEXXySSnXXnE yytSXXSSn 的标准差的估计的标准差统计量回归均方自变量的个数检验统计量的估计的标准差的置信区间估计一个个别值估计的标准差0022200/2:iiyyXXnyytS的预测区间估计 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数学习必备 欢迎下载 0112201122222258.:min,:1:111:1ppppiiayxxxEyxxxyySST SSR SSESSTSSRSSESSRRSSTnRRnpSSRMSRpSSEMSEnpF 多元线性回归模型多元回归方程估计的多元回归方程最小二乘法之间的关系多元决定系数修正的多元决定系数回归均方误差均方检:iibMSRFMSEbttS验统计量检验统计量 类数据顺序数据数值型数据总体总体是包含所研究的全部个体数据的集合样本样本是从总体中抽取的一部分元素的集合样本量样本量构成样本的元素的数目参数参数是用来描述总体特征的概括性数字度量统计量统计量是用来描述样类别的一个名称数值型变量说明事物数字特征的一个名称概率抽样学习必备欢迎下载也称随机抽样是指遵循随机原则进行的抽样总体中的每个单位都有一定的机会被选入样本抽样误差抽样误差是由于抽样的随机性引起的样本结果与到正确的方法希望大家自己找寻数据的预处理数据审核数据筛选数据排序数据透视表频数频数是落在某一特定类别或组里的数据个数比例比例是一个样本或总体中各个部分的数据与全部数据之比比率比率是样本或总体各不同类别数