第六章 概率论与数理统计基础知识.ppt
随机变量随机变量对于随机试验,其结果可以用随机变量这一数对于随机试验,其结果可以用随机变量这一数量指标表征。量指标表征。如果对每一个随机试验如果对每一个随机试验e e都有一个试验值都有一个试验值x x与之与之对应,记作对应,记作x=x(e)x=x(e),则称,则称x x为一个随机变量。它为一个随机变量。它发生的概率记为发生的概率记为P P。随机变量可分为:离散随机变量离散随机变量连续随机变量连续随机变量数理统计基础(2/3)对样本的理解样本并非一堆杂乱无章、无规律可循的数据,样本并非一堆杂乱无章、无规律可循的数据,它是受随机性影响的一组数据。它是受随机性影响的一组数据。样本二重性:每个样本即可以视为一组数据,样本二重性:每个样本即可以视为一组数据,又可以视为一组随机变量又可以视为一组随机变量样本不是任意一组随机变量,它是一组独立同样本不是任意一组随机变量,它是一组独立同分布的随机变量。分布的随机变量。研究对象全体的集合称为总体或母体统计推断即是由样本推断总体常用概率分布正态分布 分布t分布F分布正态曲线以f(x)为纵坐标,x为横坐标,绘制的曲线称为正态曲线(normal curve)。在Matlab中使用normpdf(x,)函数计算f(x)以=0,=1为例,f(x)=normpdf(x,0,1):正态曲线 mu=0;sigma=1;%正态分布参数设定 x=-5:0.1:5;fx=normpdf(x,mu,sigma);%计算概率密度函数 plot(x,fx);正态曲线图形特点:钟型钟型:中间高中间高,两头低两头低,关于关于x=x=对称对称最高处对应于最高处对应于x x轴的值是均值轴的值是均值 曲线下面积为曲线下面积为1 1标准差标准差 决定曲线的形状决定曲线的形状x xf f(x x)m m正态曲线位置参数决定曲线的位置当固定,改变的的大小时,f(x)图形的形状不变,只是沿着x轴作平移变换正态曲线形态参数决定曲线的形态当固定,改变的大小时,f(x)图形的对称轴不变,形状发生改变 越小,图形越高越瘦越小,图形越高越瘦 越大,图形越矮越胖越大,图形越矮越胖正态分布的分布函数(2/3)在Matlab中使用normcdf(x,)函数计算分布函数F(x)以=0,=1为例,F(x)=normcdf(x,0,1):分布函数的反函数norminv mu=0;sigma=1;%mu=0;sigma=1;%正态正态分布参数设定分布参数设定 x=-5:0.1:5;x=-5:0.1:5;Fx=normcdf(x,mu,sigma);Fx=normcdf(x,mu,sigma);%计算分布函数计算分布函数 plot(x,Fx);plot(x,Fx);正态分布的分布函数(3/3)例5:已知X服从标准正态分布,求:(1).P(x3)(1).P(x3)的值的值(2).P(-1.96x1.96)(2).P(-1.96x1.96)的值的值(3).P(xx(3).P(xx0 0)=0.9,)=0.9,求求x x0 0的值。的值。解:(1)P(x3)=normcdf(3,0,1)=0.9987(1)P(x3)=normcdf(3,0,1)=0.9987(2)P(-1.96x1.96)=normcdf(1.96,0,1)-normcdf(2)P(-1.96x2f2时,曲线有单峰。时,曲线有单峰。f f越小,曲线越不对称越小,曲线越不对称 f f越大,曲线越趋于正越大,曲线越趋于正态分布。态分布。分布在数理统计中经常对给定的卡方分布,经常需要求它的分位点而不是求其概率。其分位点的定义如下:分布单侧置信概率及相应的 值例如,对于a=0.05,n=10,则f=n-1=9,chi2inv(0.95,9)ans=16.9190故 16.919分布双侧置信概率及相应的 值例如,对于a=0.05,n=10,则f=n-1=9,t分布t分布是1908年英国统计学家Gosset发现的,是由正态分布派生出来的一个分布。如果随机变量xi(i=1,n)是从正态分布N(,2)的总体中随机抽取的样本值,定义为服从自由度f=n-1的t分布。t分布概率密度函数:f为自由度。f=n-1t分布在Matlab中t分布的函数:概率密度函数tpdf(t,f)tpdf(t,f)分布函数tcdf(t,f)tcdf(t,f)分布函数逆函数tinv(p,f)tinv(p,f)t分布概率密度函数特点t t分布密度曲线关于分布密度曲线关于t=0t=0对称,对称,在在t t0 0时,分布密度函时,分布密度函数取得最大值。数取得最大值。在在t=t=处有拐处有拐点。点。当当f f趋无穷大时,趋无穷大时,t t分布分布近似标准正态分布。近似标准正态分布。t分布若 和 来自正态分布N(1,2)和N(2,2),则 -服从正态分布N(1-1,2/n1+2/n2)统计量为服从自由度f=n1+n2-2的t分布。t分布在数理统计中经常对给定的t分布,需要求它的分位点而不是求其概率。其分位点的定义如下。t分布单侧置信概率及相应的 值例如,对于a=0.05,n=10,则f=n-1=9,tinv(0.95,9)ans=1.8331 1.8331t分布双侧置信概率及相应的 值例如,对于a=0.05,n=10,则f=n-1=9,F分布F(f1,f2)分布也是数理统计中经常用到的一个分布,通常是由相互独立的自由度分别为f1和f2 的 分布的函数得到。F(f1,f2)检验实质是对“方差相等”作检验。F分布在Matlab中F分布的函数:概率密度函数fpdf(F,f1,f2)fpdf(F,f1,f2)分布函数fcdf(F,f1,f2)fcdf(F,f1,f2)分布函数逆函数finv(p,f1,f2)finv(p,f1,f2)F分布概率密度函数特点取值区间为取值区间为00,+)。曲线是偏态的,自由度曲线是偏态的,自由度越小,偏态越严重;越小,偏态越严重;当当f1,f2f1,f2都较大时,都较大时,F F分分布可用正态分布来近布可用正态分布来近似。似。F分布在数理统计中经常对给定的F分布,需要求它的分位点而不是求其概率。其分位点的定义如下。F分布单侧置信概率及相应的Fa(f1,f2)值例如,对于a=0.05,f1=6,f2=10 finv(0.95,6,10)ans=3.2172 3.2172F分布双侧置信概率及相应的Fa(f1,f2)值例如,对于a=0.05,f1=6,f2=10,