第八讲统计优秀课件.ppt
第八讲统计第1 页,本讲稿共38 页2.参数估计(分布参数估计和置信区间)3.描述性统计4.线性模型5.非线性模型6.假设检验7.多元统计8.统计绘图9.统计工序管理10.实验设计第2 页,本讲稿共38 页q 统计工具箱函数 数值计算函数 交互式图形工具函数第3 页,本讲稿共38 页q 概率密度函数(probability density function)Y=PDF(NAME,X,A,B,C)其中NAME 为某种概率分布函数的名称,A,B,C 为参数,X 为给定所需计算的自变量的值,Y 为返回的函数值 NAME 可为 以下典型的概率密度函数标示第4 页,本讲稿共38 页v beta or Beta,v bino or Binomial,v chi2 or Chisquare,v exp or Exponential,v f or F,v gam or Gamma,v geo or Geometric,v hyge or Hypergeometric,v logn or Lognormal,v nbin or Negative Binomial,第5 页,本讲稿共38 页v ncf or Noncentral F,v nct or Noncentral t,v ncx2 or Noncentral Chi-squarev norm or Normal,v poiss or Poisson,v rayl or Rayleigh,v t or T,v unif or Uniform,v unid or Discrete Uniform,v weib or Weibull.第6 页,本讲稿共38 页 同时Matlab 还提供了其它专用概率 密度函数如:betapdf(a,b,c)等价于 pdf(beta,a,b,c)normpdf(x,a,b)等价于 pdf(norm,x,a,b)第7 页,本讲稿共38 页例:正态分布函数N(0,1)X=-3:0.01:3 Y=normpdf(x,0,1)Plot(x,y)第8 页,本讲稿共38 页q 累积分布函数和逆累积分布函数(cumulative distribution function)累积分布函数定义:即 逆累积分布函数:实际上为累积分布函数的逆函数第9 页,本讲稿共38 页调用格式:P=cdf(NAME,X,A,B,C)X=icdf(NAME,P,A,B,C)其中NAME 的取值与pdf 函数使用方法相同 另外也拥有专用cdf 函数,如normcdf第10 页,本讲稿共38 页q 随机数产生函数 产生的基本方法(直接法,反演法,拒绝法)产生随机数的函数 Y=random(NAME,A,B,C,m,n)另外也拥有专用随机数产生函数,如betarnd(a,b)第1 1 页,本讲稿共38 页例:y=random(norm,0,1,100,80)mesh(y)第12 页,本讲稿共38 页q 均值和方差函数(20种专用函数)(mean and variance)M,V=NORMSTAT(MU,SIGMA)M,V=WEIBSTAT(A,B)M,V=BETASTAT(A,B)M,V=BIONSTAT(N,P)M,V=EXPSTAT(Mu)M,V=RAYSTAT(B)等第13 页,本讲稿共38 页q 参数估计 极大似然参数估计方法(Maximum Likelihood Estimate:MLE)对数似然参数估计方法(只对部分分布函数提供)第14 页,本讲稿共38 页参数估计函数格式 phat.pci=mle(NAME,Data,alpha,p1)其中NAME 与前面定义相同(如:beta)Data 为数据样本 Alpha 为用户给定的置信度 P1 为实验的次数 第15 页,本讲稿共38 页参数估计函数格式 L=normlike(mu,sigma,Data)Data 为数据样本 Mu,sigma为用户给定的参数 Weiblike,gamlike,betalike 等第16 页,本讲稿共38 页q 描述性统计 目的:搜集整理加工和分析统计数据,使之系统化条理化。从中显示数据资料的趋势特征和数量关系。内容:位置度量散布度量自助法和缺失数据情况下的处理办法。第17 页,本讲稿共38 页样本的几何均值 M=geomean(X)其中第18 页,本讲稿共38 页样本数据的调和均值 m=harmmean(X)其中第19 页,本讲稿共38 页样本数据的算术平均值 m=mean(X)其中第20 页,本讲稿共38 页样本数据的中值(中位数)m=median(X)其中第21 页,本讲稿共38 页剔除极端数据的样本中值 m=trimmean(X,percent)其中第22 页,本讲稿共38 页q 散布度量 目的:描述样本数据中数据偏离数据中心的程度 内容:标准差(std)和方差(Var);平均绝对偏差(mad);四分位数间距第23 页,本讲稿共38 页样本的标准差(Standard deviation)m=std(X)其中第24 页,本讲稿共38 页样本的协方差(Covariance matrix)m=cov(X,Y)其中第25 页,本讲稿共38 页样本数据的平均绝对偏差(mean absolute derive)m=mad(X)其中第26 页,本讲稿共38 页样本数据的内四分位数间距 m=iqr(X)其中第27 页,本讲稿共38 页样本数据的极差 m=range(X)其中m=max(x)-min(x)第28 页,本讲稿共38 页q 缺失数据的处理函数(Standard deviation ignoring NaNs)Nanmax(x)求缺失数据的样本最大值 Nanmin(x)求缺失数据的样本最小值 Nanmean(x)求缺失数据的样本平均值 Nanstd(x)求缺失数据的样本标准差 Nansum(x)求缺失数据的样本的和第29 页,本讲稿共38 页q 中心矩(关于数学期望的矩)定义 格式:m=moment(X,order)第30 页,本讲稿共38 页q 相关系数 定义:两个随机变量间的线性相依程度的度量 格式:R=corrcoef(X,Y)第31 页,本讲稿共38 页q 样本峰度和样本偏度 定义:样本峰度为单峰分布曲线峰的平坦程度的度量,k=kurtosid(x);定义:样本偏度为样本数据围绕其均值的对称情况的度量,k=skewness(x),第32 页,本讲稿共38 页q 假设检验 两个总体样本一致性的Wilcoxon 检验 p,h=ranksum(x,y,alpha)其中h=0 or 1 p=signrank(x,y,alpha)Wilcoxon signed rank 检验h,sig,ci=ttest(x,m,alpha)单一样本均值的t 假设检验第33 页,本讲稿共38 页 h,sig,ci=ttest2(x,y,alpha)两个样本均值差异的检验h,sig,ci=ztest(x,m,sigma,alpha)已知方差的单样本均值的假设检验第34 页,本讲稿共38 页q 线性模型 方差分析 回归分析第35 页,本讲稿共38 页q 多项式回归 多项式的创建:p=x1,x2,x3,xn 高次 低次 p,s=polyfit(x,y,n).用n 阶多项式拟合x和y polyval(p,x).多项式p 在x上的值Polytool(x,y)拟合多项式及预测的交互式界面 第36 页,本讲稿共38 页q 二次响应曲面工具 rstool(x,y,model,alpha,xname,yname)拟合二次曲面交互式界面 Model 为interaction,quadratic,purequadratic 第37 页,本讲稿共38 页q 非线性回归模型 Nlinfit 非线性最小二乘拟合 Nlintool 非线性 拟合GUI Nlparci 参数置信区间 Nlpredci 预测置信区间 Nnls 非负最小二乘拟合第38 页,本讲稿共38 页