统计基本公式.docx
统计基本公式两类统计学(描述统计:归纳、总结; 推断统计:样本看总体) 数据类型(分类定性数据、数值型定量数据; 截面数据、时间序列数据) 累积/频数分数(组数、组宽、组限、组中值)、累积/相对或百分数频数分布:组的相对频数=组频数/n 平均数:均值、加权平均数、几何平均数; 中位数:中间值Q2; 众数:次数最多的数; 百分位数:第P百分位数位置 Lp=P100 (n+1) ; 四分位数:Q1、Q2、Q3、Q4 五数概括法(MIN、Q1、Q2、Q3、MAX) 样本 总体 极差=最大值-最小值 四分位数间距 IQR=Q3-Q1 标准差系数=标准差/均值 偏度=nn-1 (n-2) xi-xs3 数据分布的偏斜度:左偏(右偏),平均数在中位数左侧(右侧) 视察值个数 n N 均值 x=xin u=xiN 方差 标准差 s2=xi-x2(n-1) Var=2=xi-u2N 相关系数 rxy=sxysxsy xy=xyxy 切比雪夫定理 与平均数的距离在z个标准差之内的数据值所占的比例至少为(1-1/z2),其中z为大于1的随意实数 阅历法则对于具有钟形分布的数据(z-分数 zi=(xi-x)s): 大约68%(95%、几乎全部)的数据值与平均数的距离在1(2、3)个标准差之内 组合计数法则 CnN=Nn=N!n! N-n!; 排列计数法则 PnN=n!Nn=N!N-n! 古典法、相对频数法、主观法 贝叶斯定理 PAiB=PAi PBAiPA1 PBA1+PAn PBAn; PAB=PBA PA=PAB PB 条件概率 PAB=PA PBAPB 乘法公式(联合概率) PAB=PAB=PA PBA=PB PAB; 加法公式 PAB=PA+PB-PAB 独立事务 PAB=PAB=PAPB PBA=PB PAB=PA 互斥事务 PAB=PAB=0; PAB=PA+PB 互补事务(对立事务、逆事务)PAB=PAB=0 PA+PB=1 随机变量x(离散型、连续型); 随机变量x的概率分布函数x、f(x) 离散型概率函数的基本条件 f(x)0; f(x)=1 x的数学期望 Ex=u=xf(x); x的方差 Varx=2=(x-u)2f(x) x的标准差 =(x-u)2f(x) 随机变量x和y的协方差 xy=Varx+y-Varx-Var(y)/2 xy=x-E(x)y-E(y)f(x,y)=x-uxy-uy)/N x和y的相关系数 xy=xyxy (推断是否独立) x和y的线性组合的数学期望 E(ax+by)=aEx+bE(y) x和y的线性组合的方差 Varax+by=a2Varx+b2Vary+2abxy 二项试验的性质(0-1分布) 1) 试验由一系列相同的n个试验组成 2) 每次试验有两种可能的结果,我们把其中一个称为胜利,另一个称为失败 3) 每次试验胜利的概率都是相同的,用P来表示;失败的概率也都相同,用1-P表示(平稳性) 4) 试验是相互独立的(独立性) 泊松试验的性质(二线分布的N趋势) 1) 在随意两个相等长度的区间上,事务发生的概率相等 2) 事务在某一区间上是否发生与事务在其他去件上是否发生是独立的 超几何概率的性质 1) 当从具有r个“胜利”元素和N-r个“失败”元素的总体N中抽取n次时,给出恰好有x次胜利的概率 2) 各次试验不是独立的,并且各次试验中胜利的概率不等 分布类型 符号 概率函数f(x) 概率分布均值 概率分布方差Varx=2 二项分布 B(n, p) n-随机试验次数 p-胜利概率 fk=Cnkpk1-pn-k, k=0, 1, 2, , n np np(1-p) 泊松分布 P() 或 () -单位时间内随机事务发生的平均次数 fk=kk!e-, k=0, 1, 2, 匀称分布 U(a, b) a-下限值 b-上限值 fx=1b-a, axb0, x<a或x>b a+b2 a-b212 正态分布 N(, 2) -均值 2-方差 fx=12e-x-222 2 t-分布 t(n) n-自由度 0 n/(n-2) 卡方分布 2(n) n-自由度 n 2n F分布 F(n, m) n, m-自由度 指数分布 E() -单位时间内随机事务发生的平均次数 fx=e-x, x00, x<0 1 12 超几何概率分布 fx=rx N-rn-xNn nrN nrN1-rNN-nN-1