第2讲 随机数的产生数据的统计描述精选PPT.ppt
第2讲 随机数的产生数据的统计描述第1页,此课件共63页哦实验目的实验目的实验内容实验内容学习随机数的产生方法学习随机数的产生方法直观了解统计描述的基本内容。直观了解统计描述的基本内容。2 2、统计的基本概念。、统计的基本概念。5 5、实验作业。、实验作业。4、计算实例。、计算实例。3、计算统计描述的命令。、计算统计描述的命令。1 1、随机数的产生、随机数的产生第2页,此课件共63页哦 在在MatlabMatlab软件中,可以直接产生满足各种常用分软件中,可以直接产生满足各种常用分布的随机数,命令如下:布的随机数,命令如下:一、随机数的产生一、随机数的产生10常用分布随机数的产生常用分布随机数的产生定义:设随机变量定义:设随机变量XF(x),则称随机变量则称随机变量X的抽样的抽样序列序列Xi为分布为分布F(x)的随机数的随机数第3页,此课件共63页哦函数名 对应分布的随机数binornd二项分布的随机数chi2rnd卡方分布的随机数exprnd指数分布的随机数frndf分布的随机数gamrnd伽玛分布的随机数geornd几何分布的随机数hygernd超几何分布的随机数normrnd正态分布的随机数poissrnd泊松分布的随机数trnd学生氏t分布的随机数unidrnd离散均匀分布的随机数unifrnd连续均匀分布的随机数第4页,此课件共63页哦调用格式:调用格式:1、y=random(name,A1,A2,A3,m,n)其中:其中:name为相应分布的名称,为相应分布的名称,A1,A2,A3为分布为分布参数,参数,m为产生随机数的行数,为产生随机数的行数,n为列数。为列数。2、直接调用。、直接调用。如:如:y=binornd(n,p,1,10)产生参数为产生参数为n,p的的1行行10列的二项分布随机数列的二项分布随机数第5页,此课件共63页哦 当只知道一个随机变量取值在当只知道一个随机变量取值在(a,b)内,但不知道内,但不知道(也没理由假设)它在何处取值的概率大,在何处取(也没理由假设)它在何处取值的概率大,在何处取值的概率小,就只好用值的概率小,就只好用U(a,b)来模拟它。来模拟它。调用格式如下调用格式如下:R=unifrnd(a,b):产生一个均匀分布随机数产生一个均匀分布随机数R=unifrnd(a,b,mm,nn)产生产生mm行行nn列的均匀分布列的均匀分布 随机数随机数(1)产生)产生m*n阶阶a,b均匀分布均匀分布U(a,b)的随)的随机数矩阵:机数矩阵:unifrnd(a,b,m,n)产生一个产生一个a,b均匀分布的随机数均匀分布的随机数:unifrnd(a,b)第6页,此课件共63页哦例例1、产生、产生U(2,8)上的一个随机数,上的一个随机数,10个随机数,个随机数,2行行5列的随机数。列的随机数。命令:命令:(1)y1=unifrnd(2,8)(2)y2=unifrnd(2,8,1,10)(3)y3=unifrnd(2,8,2,5)y1=7.7008y2=3.3868 5.6411 4.9159 7.3478 6.5726 4.7388 2.1110 6.9284 4.6682 5.6926y3=6.7516 6.4292 4.4342 7.5014 7.3619;7.5309 3.0576 7.6128 4.4616 2.3473第7页,此课件共63页哦第8页,此课件共63页哦第9页,此课件共63页哦第10页,此课件共63页哦第11页,此课件共63页哦第12页,此课件共63页哦排队服务系统中顾客到达率为常数时的到达间隔、故排队服务系统中顾客到达率为常数时的到达间隔、故障率为常数时零件的寿命都服从指数分布。障率为常数时零件的寿命都服从指数分布。指数分布在排队论、可靠性分析中有广泛应用。指数分布在排队论、可靠性分析中有广泛应用。例例 顾客到达某商店的间隔时间服从参数为顾客到达某商店的间隔时间服从参数为0.1的指数分的指数分布布 指数分布的均值为指数分布的均值为1/0.1=10。指两个顾客到达商店的平均间隔时间是指两个顾客到达商店的平均间隔时间是10个单个单位时间位时间.即平均即平均10个单位时间到达个单位时间到达1 1个顾客个顾客.顾客到达的顾客到达的间隔时间可用间隔时间可用exprnd(10)模拟。模拟。第13页,此课件共63页哦4、二项分布随机数、二项分布随机数(1)R=binornd(n,p):产生一个二项分布随机数产生一个二项分布随机数(2)R=binornd(n,p,mm,nn)产生产生mm行行nn列的列的 二项分布随机数二项分布随机数例例4、产生、产生B(10,0.8)上的一个随机数,上的一个随机数,15个随机数,个随机数,3行行6列的随机数。列的随机数。命令命令(1)y1=binornd(10,0.8)(2)y2=binornd(10,0.8,1,15)(3)y3=binornd(10,0.8,3,6)第14页,此课件共63页哦20、其他分布随机数的产生方法、其他分布随机数的产生方法定理定理 设设X的分布函数为的分布函数为F(x),连续且严格单调上升,连续且严格单调上升,它的反函数存在,且记为它的反函数存在,且记为F-1(x),随机变量随机变量 U 服从服从 0,1 上的均匀分布,上的均匀分布,则则 F(x)U(0,1)F-1(U)的分布函数为的分布函数为F(x)。第15页,此课件共63页哦(一)直接抽样法(反函数法)(一)直接抽样法(反函数法)(1 1)连续分布的直接抽样法)连续分布的直接抽样法设连续型随机变量设连续型随机变量X的分布函数为的分布函数为F(x),则产生随机数的方法步骤为:则产生随机数的方法步骤为:产生均匀随机数产生均匀随机数R,即,即RU(0,1)则则X=F-1(R),即为所要的随机数即为所要的随机数第16页,此课件共63页哦设分布律为设分布律为P(X=xi)=pi,i=1,2,.,其分布函数为,其分布函数为F(x)(2 2)离散分布的直接抽样法)离散分布的直接抽样法 产生均匀随机数产生均匀随机数R,即,即RU(0,1)则则XF(x)第17页,此课件共63页哦(二)变换抽样法(二)变换抽样法(三)值序抽样法(三)值序抽样法(四)舍选抽样法(四)舍选抽样法(五)复合抽样法(合成法)(五)复合抽样法(合成法)(六)近似抽样法(六)近似抽样法详见:高惠璇详见:高惠璇 北京大学出版社统计计算北京大学出版社统计计算第18页,此课件共63页哦例例5、设设X分布函数为分布函数为F(X)如:如:第19页,此课件共63页哦生成生成n=20的的1行行10000列随机数列随机数,并画经验分布函数曲线并画经验分布函数曲线频率直方图。频率直方图。命令:命令:U=unifrnd(0,1,1,10000);Y=1-(1-U).(1/20);cdfplot(Y);第20页,此课件共63页哦例例5 生成单位圆上均匀分布的生成单位圆上均匀分布的1行行10000列随机数,并画经验列随机数,并画经验分布函数曲线。分布函数曲线。Randnum=unifrnd(0,2*pi,1,10000);xRandnum=cos(Randnum);yRandnum=sin(Randnum);plot(xRandnum,yRandnum);plot(xRandnum,yRandnum,.);第21页,此课件共63页哦第22页,此课件共63页哦第23页,此课件共63页哦例例6 频率的稳定性频率的稳定性1、事件的频率事件的频率 在一组不变的条件下,重复作在一组不变的条件下,重复作n次试验次试验,记记m是是n次试次试验中事件验中事件A发生的次数。发生的次数。频率频率 f=m/n 2.频率的稳定性频率的稳定性 在重复试验中,事件在重复试验中,事件A的频率总在一个定值附近摆动,的频率总在一个定值附近摆动,而且,随着重复试验次数的增加,频率的摆动幅度而且,随着重复试验次数的增加,频率的摆动幅度越来越小,呈现出一定的稳定性越来越小,呈现出一定的稳定性.第24页,此课件共63页哦掷一枚硬币,记录掷硬币试验中频率掷一枚硬币,记录掷硬币试验中频率P*的波动情况。的波动情况。(1)(1)模拟产生模拟产生n个个0-1分布随机数分布随机数randnum(n)(2)(2)对模拟产生的随机数,对模拟产生的随机数,xrandnum(i)表示表示第第i次试验的结果,次试验的结果,1表示正面向上,表示正面向上,0 0表示反表示反面向上。面向上。(3)(3)统计前统计前i次试验中正面向上的次数,次试验中正面向上的次数,并计算频率并计算频率(4 4)作图)作图(关于频率和试验次数的图像)关于频率和试验次数的图像)p为正面向上的概率,为正面向上的概率,n为试验次数为试验次数第25页,此课件共63页哦在在Matlab中编辑中编辑.m文件输入以下命令:文件输入以下命令:function binomoni(p,n)pro=zeros(1,n);%频率向量频率向量randnum=binornd(1,p,1,n);产生二项分布随机数产生二项分布随机数a=0;for i=1:n a=a+randnum(1,i);%频数频数 pro(i)=a/i;%频率频率end pro=pro;num=1:n;plot(num,pro,num,p)第26页,此课件共63页哦在在Matlab命令行中输入以下命令:命令行中输入以下命令:binomoni(0.5,1000)第27页,此课件共63页哦在在Matlab命令行中输入以下命令:命令行中输入以下命令:binomoni(0.5,10000)第28页,此课件共63页哦在在Matlab命令行中输入以下命令:命令行中输入以下命令:binomoni(0.3,1000)第29页,此课件共63页哦例例7、Buffon试验试验1777年法国数学家蒲丰用随机掷针的实验方法计算年法国数学家蒲丰用随机掷针的实验方法计算 假设平面上有很多条距离为假设平面上有很多条距离为1的等距平行线,现向该平的等距平行线,现向该平面随机投掷一根长度为面随机投掷一根长度为l 的针的针(l1)则我们可计算该针与任一平行线相交的概率。这里,随机投则我们可计算该针与任一平行线相交的概率。这里,随机投针指的是:针的中心点与最近的平行线间的距离针指的是:针的中心点与最近的平行线间的距离 x 均匀的均匀的分布在区间分布在区间0,0.5上,针与平行线的夹角上,针与平行线的夹角(不管相交不管相交与否)均匀分布在区间与否)均匀分布在区间0,上上。因此,针与线相交的充要条件是因此,针与线相交的充要条件是第30页,此课件共63页哦从而针线相交的概率为从而针线相交的概率为根据上式,若我们做大量的投针试验并记录针与线相根据上式,若我们做大量的投针试验并记录针与线相交的次数,则由大数定理可以估计出针线相交的概率交的次数,则由大数定理可以估计出针线相交的概率p 从而得到从而得到 的估计值。的估计值。第31页,此课件共63页哦步骤:步骤:设针的长度为设针的长度为 l,模拟试验次数为模拟试验次数为n.(1)(1)模拟产生模拟产生n个个0,0.5上的均匀分布上的均匀分布随机数随机数xrandnum,00,上的均匀分布随机数上的均匀分布随机数sitasita(3)(3)计算针与线相交的频率,作为概率,计算计算针与线相交的频率,作为概率,计算(2 2)统计满足)统计满足的个数,的个数,即为针与线相交的次数即为针与线相交的次数第32页,此课件共63页哦 buffon(.6,1000)piguji=3.1662 buffon(.6,10000)piguji=3.1072 buffon(.6,100000)piguji=3.1522 buffon(.6,1000000)piguji=3.1386 buffon(.6,1000000)piguji=3.1451 buffon(.6,1000000)piguji=3.1418 buffon(.6,1000000)piguji=3.1448 buffon(.6,1000000)piguji=3.1405 buffon(.6,1000000)piguji=3.1394第33页,此课件共63页哦1、表示位置的统计量、表示位置的统计量平均值和中位数平均值和中位数平均值(或均值,数学期望):平均值(或均值,数学期望):中位数:将数据由小到大排序后位于中间位置中位数:将数据由小到大排序后位于中间位置 的那个数值的那个数值.二、常用统计量二、常用统计量第34页,此课件共63页哦2、表示变异(离散)程度的统计量、表示变异(离散)程度的统计量 方差、标准差、极差方差、标准差、极差 样本方差:样本方差:它是各个数据与均值偏离程度的度量它是各个数据与均值偏离程度的度量 标准差:是方差的开方标准差:是方差的开方 极差:样本中最大值与最小值之差极差:样本中最大值与最小值之差.第35页,此课件共63页哦3.3.表示分布形状的统计量表示分布形状的统计量偏度和峰度偏度和峰度 偏度:偏度:峰度峰度 偏度反映分布的对称性,偏度反映分布的对称性,g1 0称为右偏态,称为右偏态,此时数据位于均值,右边的比位于左边的多;此时数据位于均值,右边的比位于左边的多;g1 0称为左偏态,情况相反;而称为左偏态,情况相反;而g1接近接近0则可认为分布是对称的则可认为分布是对称的.第36页,此课件共63页哦峰度是分布形状的另一种度量,正态分布的峰度为峰度是分布形状的另一种度量,正态分布的峰度为3,若若g2比比3大很多,表示分布有沉重的尾巴,说明样本中大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一偏离正态分布的尺度之一 第37页,此课件共63页哦三、分布函数的近似求法(直方图)三、分布函数的近似求法(直方图)1、经验分布函数(累计频率直方图)、经验分布函数(累计频率直方图)Empirical Cumulative Distribution Function 定义:定义:设设x1,x2,xn是总体的容量为是总体的容量为n的样的样本值,将其按由小到大的顺序排列,并本值,将其按由小到大的顺序排列,并重新编号,记为重新编号,记为则经验分布函数为:则经验分布函数为:总体分布函数的近似总体分布函数的近似第38页,此课件共63页哦2、频率直方图、频率直方图近似概率密度函数近似概率密度函数下面介绍频率直方图和经验分布函数的做法下面介绍频率直方图和经验分布函数的做法第39页,此课件共63页哦1、整理资料:、整理资料:把样本值把样本值x1,x2,xn进行分组,先进行分组,先将它们依大小次序排列,得将它们依大小次序排列,得 在包含在包含 的区间的区间a,b内插入一些等分点:内插入一些等分点:注意要使每一个区间注意要使每一个区间(i=1,2,n-1)内都有样本观测值内都有样本观测值x i(i=1,2,n-1)落入其中)落入其中.第40页,此课件共63页哦2、求出各组的频数和频率:、求出各组的频数和频率:统计出样本观测值在每个区间统计出样本观测值在每个区间 中出现的次数中出现的次数 它就是这区间或这组的频数,它就是这区间或这组的频数,计算频率计算频率 累计频数为累计频数为累计频率为累计频率为第41页,此课件共63页哦3、作图:、作图:在直角坐标系的横轴上,标出在直角坐标系的横轴上,标出 分别以分别以 各点,各点,为底边,为底边,作高为作高为 的矩形,的矩形,即得频率直方图即得频率直方图.若以若以为高既得累计频率直方图为高既得累计频率直方图第42页,此课件共63页哦统计工具箱中的基本统计命令统计工具箱中的基本统计命令1.数据的录入、保存和调用数据的录入、保存和调用2.基本统计量基本统计量3.常见概率分布的函数常见概率分布的函数4.4.直方图的描绘直方图的描绘5.综合实例综合实例第43页,此课件共63页哦一、数据的录入、保存和调用一、数据的录入、保存和调用 例例9 9 上海市区社会商品零售总额和全民所有制职工工上海市区社会商品零售总额和全民所有制职工工资总额的数据如下资总额的数据如下统计工具箱中的基本统计命令统计工具箱中的基本统计命令年份 78 79 80 81 82 83 84 85 86 87 职工工资总额 亿元 商品零售总额亿元 23.8 27.6 31.6 32.4 33.7 34.9 43.2 52.8 63.8 73.4 41.4 51.8 61.7 67.9 68.7 77.5 95.9 137.4 155 175 第44页,此课件共63页哦方法方法1 11、年份数据以年份数据以1为增量,用产生向量的方法输入。为增量,用产生向量的方法输入。命令格式:命令格式:x=a:h:b t=78:872、分别以、分别以x和和y代表变量职工工资总额和商品零售总额代表变量职工工资总额和商品零售总额x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0第45页,此课件共63页哦3 3、将变量、将变量t t、x x、y y的数据保存在文件的数据保存在文件datadata中。中。save data t x y4 4、进行统计分析时,调用数据文件、进行统计分析时,调用数据文件datadata中的数据。中的数据。load datat=78:87;x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0;save data t x y第46页,此课件共63页哦1、输入矩阵:输入矩阵:data=78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02、将矩阵、将矩阵data的数据保存在文件的数据保存在文件data1中:中:save data1 data方法方法2 2第47页,此课件共63页哦3 3、数据的调用:、数据的调用:命令:命令:load data1 用以下命令分别将矩阵用以下命令分别将矩阵datadata的第一、二、三行的数据的第一、二、三行的数据赋给变量赋给变量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要调用矩阵若要调用矩阵data的第的第j列的数据,可用命令:列的数据,可用命令:data(:,j)第48页,此课件共63页哦data=78 79 80 81 82 83 84 85 86 87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0;save data1 data;load data1t=data(1,:);x=data(2,:);y=data(3,:);若要调用矩阵若要调用矩阵data的第的第j列的数据,列的数据,可用命令:可用命令:data(:,j)第49页,此课件共63页哦二、基本统计量二、基本统计量对样本对样本x,计算其基本统计量的命令如下:,计算其基本统计量的命令如下:均值:均值:mean(x)中位数:中位数:median(x)标准差:标准差:std(x)方差:方差:var(x)极差:极差:range(x)偏度:偏度:skewness(x)峰度:峰度:kurtosis(x)第50页,此课件共63页哦例例10 对例对例1中的职工工资总额中的职工工资总额x,可计算上述基本统计量。可计算上述基本统计量。clear;load data1x=data(2,:)mean1=mean(x)median1=median(x)std1=std(x)var1=var(x)rang1=range(x)skewness1=skewness(x)kurtosis1=kurtosis(x)第51页,此课件共63页哦mean1=41.7200median1=34.3000std1=16.4544var1=270.7462range1=49.6000skewness1=0.8590kurtosis1=2.4037第52页,此课件共63页哦三三、常见概率分布的函数常见概率分布的函数常见的几种分布的命令字符为常见的几种分布的命令字符为:正态分布:正态分布:norm 指数分布:指数分布:exp 泊松分布:泊松分布:poiss 分布:分布:beta 威布尔分布:威布尔分布:weib 分布:分布:chi2 t分布:分布:t F分布:分布:F第53页,此课件共63页哦Matlab工具箱对每一种分布都提供五类函数,其命令字工具箱对每一种分布都提供五类函数,其命令字符为:符为:概率密度:概率密度:pdf 概率分布:概率分布:cdf逆概率分布:逆概率分布:inv 均值与方差:均值与方差:stat随机数生成:随机数生成:rnd(当需要一种分布的某一类函数时,将以上所列的分布命(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可量、数组或矩阵)和参数即可.)第54页,此课件共63页哦1、描绘数组、描绘数组data的频数直方图的命令为:的频数直方图的命令为:hist(data,k)四、频数直方图的描绘四、频数直方图的描绘2、描绘附加带有正态密度曲线的直方图命令为:、描绘附加带有正态密度曲线的直方图命令为:histfit(data,k)第55页,此课件共63页哦五、经验分布函数(累计频率直方图)作图五、经验分布函数(累计频率直方图)作图描绘数组描绘数组data的经验分布函数的命令为:的经验分布函数的命令为:cdfplot(data)第56页,此课件共63页哦例例11 一一道道工工序序用用自自动动化化车车床床连连续续加加工工某某种种零零件件,由由于于刀刀具具损损坏坏等等会会出出现现故故障障.故故障障是是完完全全随随机机的的,并并假假定定生生产产任任一一零零件件时时出出现现故故障障机机会会均均相相同同.工工作作人人员员是是通通过过检检查查零零件件来来确确定定工工序序是是否否出出现现故故障障的的.现现积积累累有有100次次故故障障纪纪录录,故故障障出出现现时时该该刀刀具具完完成成的的零零件件数数如如下下:作作频频数数直直方图及经验分布函数图方图及经验分布函数图第57页,此课件共63页哦459 362 624 542 509 584 433 748 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 428 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 577 496 468 499 544 645764 558 378 765 666 763 217 715 310 851第58页,此课件共63页哦解解 1、数据输入、数据输入x1=459 362 624 542 509 584 433 748 815 505;x2=612 452 434 982 640 742 565 706 593 680;x3=926 653 164 487 734 608 428 1153 593 844;x4=527 552 513 781 474 388 824 538 862 659;x5=775 859 755 49 697 515 628 954 771 609;x6=402 960 885 610 292 837 473 677 358 638;x7=699 634 555 570 84 416 606 1062 484 120;x8=447 654 564 339 280 246 687 539 790 581;x9=621 724 531 512 577 496 468 499 544 645;x10=764 558 378 765 666 763 217 715 310 851;x=x1 x2 x3 x4 x5 x6 x7 x8 x9 x10;save dj x第59页,此课件共63页哦解解 2、作频数直方图、作频数直方图load djhist(x,10)histfit(x,10)(看起来刀具寿命服从正态分布)(看起来刀具寿命服从正态分布)解解 3、作经验分布函数图、作经验分布函数图load djcdfplot(x)第60页,此课件共63页哦例例3、作以下数据的直方图,并估计其分布类型、作以下数据的直方图,并估计其分布类型8.21 1.91 5.97 3.07 9.46 1.8 4.86 0.750.79 2.61 3.50 0.53 0.98 2.19 1.00 2.085.37 6.19 5.38 3.14 1.59 5.87 0.88 2.834.97 1.76 3.02 4.05 1.82 2.38 1.15 0.223.24 0.64 8.77 0.10 6.52 6.89 0.66 1.529.96 22.21 0.56 8.07 6.04 2.07 6.29 3.7813.68 0.06第61页,此课件共63页哦1、数据输入、数据输入x=8.21 1.91 5.97 3.07 9.46 1.8 4.86 0.750.79 2.61 3.50 0.53 0.98 2.19 1.00 2.085.37 6.19 5.38 3.14 1.59 5.87 0.88 2.834.97 1.76 3.02 4.05 1.82 2.38 1.15 0.223.24 0.64 8.77 0.10 6.52 6.89 0.66 1.529.96 22.21 0.56 8.07 6.04 2.07 6.29 3.7813.68 0.06Save data1 X;第62页,此课件共63页哦2、作频率直方图、作频率直方图,并观察其分布形式并观察其分布形式load data1;hist(x,9)解解 3、作经验分布函数图、作经验分布函数图load datacdfplot(x)第63页,此课件共63页哦