欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第二章基本统计概念的回顾优秀PPT.ppt

    • 资源ID:65261276       资源大小:1.99MB        全文页数:41页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第二章基本统计概念的回顾优秀PPT.ppt

    第二章基本统计概念的回顾第一页,本课件共有41页第二章第二章 基本统计概念的回顾基本统计概念的回顾第二页,本课件共有41页主要内容2.1 随机试验随机试验2.2 随机变量随机变量2.3 总体的的数字特征总体的的数字特征2.4 样本分布的数字特征样本分布的数字特征第三页,本课件共有41页2.1 随机试验随机试验p随机试验:指至少有两个可能结果,但不确定哪一个结果会出随机试验:指至少有两个可能结果,但不确定哪一个结果会出现的过程现的过程p总体:随机试验所有可能的集合称为总体(总体:随机试验所有可能的集合称为总体(population)或样或样本空间本空间 例子:在一种双回合游戏中,例子:在一种双回合游戏中,O1表示两个回合全部获胜;表示两个回合全部获胜;O2表表示第一个回合获胜,第二个回合失败;示第一个回合获胜,第二个回合失败;O3表示第一个回合失败,表示第一个回合失败,第二个回合获胜;第二个回合获胜;O4表示两个回合全部失败。样本空间有表示两个回合全部失败。样本空间有4种种结果组成:结果组成:O1,O2,O3,O4p样本点:样本空间(或总体)的每一元素,即每一种结果成样本点:样本空间(或总体)的每一元素,即每一种结果成为样本点为样本点第四页,本课件共有41页2.1 随机试验随机试验p随机试验的可能结果组成的集合称为事件,它是样本随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集空间的一个子集p如果两个事件不能同时发生,则两个事件称为是互斥的如果两个事件不能同时发生,则两个事件称为是互斥的p如果一个事件的发生与另一个事件的发生的可能性相如果一个事件的发生与另一个事件的发生的可能性相同,则两个事件称为等可能性的。例如抛一枚硬币,同,则两个事件称为等可能性的。例如抛一枚硬币,正面朝上和正面朝下是等可能出现的正面朝上和正面朝下是等可能出现的第五页,本课件共有41页2.2 随机变量随机变量一、概率分布一、概率分布p 引入一个随机变量来描述总体,随机变量是取值具有随机性引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型两种类型。的变量,按取值情况可以分为离散型和连续型两种类型。p 样本就是样本就是n个相互独立的与总体具有相同分布的随机个相互独立的与总体具有相同分布的随机变量变量x1,xn,即,即n元随机变量。随机试验的可能结果组成元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集的集合称为事件,它是样本空间的一个子集p 总体与样本间的联系在于具有相同的分布总体与样本间的联系在于具有相同的分布第六页,本课件共有41页2.2 随机变量随机变量一、概率分布一、概率分布p 引入一个随机变量来描述总体,随机变量是取值具有随机性引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型两种类型。的变量,按取值情况可以分为离散型和连续型两种类型。p 样本就是样本就是n个相互独立的与总体具有相同分布的随机变量个相互独立的与总体具有相同分布的随机变量x1,xn,即,即n元随机变量。随机试验的可能结果组成的元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集集合称为事件,它是样本空间的一个子集p 总体与样本间的联系在于具有相同的分布总体与样本间的联系在于具有相同的分布第七页,本课件共有41页2.2 随机变量随机变量2、概率分布的含义和性质、概率分布的含义和性质w随机变量随机变量X取各个值的概率称为取各个值的概率称为X的概率分布。对一个离散型随机变的概率分布。对一个离散型随机变量量X可以给出如下的概率分布:可以给出如下的概率分布:P(X=xi)=piw对于随机变量对于随机变量X(无论连续还是离散)可以确定实值函数(无论连续还是离散)可以确定实值函数F(x),称,称为累积分布函数(为累积分布函数(cumulative distribution function,CDF),定义如下定义如下F(x)P(Xx)第八页,本课件共有41页p概率分布性质概率分布性质(1)取值范围)取值范围(2)若)若A,B,C,为互斥事件,则有为互斥事件,则有P(A+B+C+)P(A)P(B)P(C)对于任意事件对于任意事件A,B则有则有P(A+B)P(A)P(B)P(AB)(3)若)若A,B,C,为互斥事件,且为一完备事件组,则为互斥事件,且为一完备事件组,则P(A+B+C+)P(A)P(B)P(C)=1(4)事件)事件A,B,C,称为相互独立的事件,如果有称为相互独立的事件,如果有P(ABC)P(A)P(B)P(C)(5)条件概率)条件概率P(A|B)=P(AB)/P(B)2.2 随机变量随机变量第九页,本课件共有41页举例:举例:国际贸易专业有国际贸易专业有200名学生,其中男生名学生,其中男生120人,女生人,女生80人,在人,在这些学生中,这些学生中,40名男生和名男生和24名女生计划选学计量经济学,若名女生计划选学计量经济学,若随机抽取一人,发现这个学生计划选学计量经济学。那么这随机抽取一人,发现这个学生计划选学计量经济学。那么这个学生是男生的概率是多少?个学生是男生的概率是多少?第十页,本课件共有41页3、连续型随机变量的分布函数及概率密度函数、连续型随机变量的分布函数及概率密度函数w对于连续型随机变量,取任何特定数值的概率为对于连续型随机变量,取任何特定数值的概率为0。w设设F(x)是随机变量是随机变量X的分布函数,如果对任意实数的分布函数,如果对任意实数x,存在非,存在非负函数负函数f(x)0,使使 就称就称f(x)0为为X的概率密度函数的概率密度函数(PDF),且,且f(x)具有性质具有性质2.2 随机变量随机变量第十一页,本课件共有41页4、多元随机变量的概率密度函数、多元随机变量的概率密度函数w联合概率密度函数联合概率密度函数f(X,Y)=P(X=x,Y=y)。w边缘概率密度函数边缘概率密度函数f(X),f(Y)。w条件概率密度函数条件概率密度函数wf(X|Y)=P(X=x|Y=y)w条件概率密度函数条件概率密度函数f(X|Y)f(X,Y)/f(Y)w独立随机变量独立随机变量 如果如果f(X,Y)f(X)f(Y),则称变量,则称变量X和和Y是统计独立的是统计独立的2.2 随机变量随机变量第十二页,本课件共有41页5、随机变量函数、随机变量函数w 设设f(x)是定义在随机变量是定义在随机变量X的一切可能取值集合上的函数。如果对于的一切可能取值集合上的函数。如果对于X的每一个可能值的每一个可能值x,都有另一个随机变量,都有另一个随机变量Y的取值的取值y=f(x)与之相对应,与之相对应,则称则称Y为为X的函数,记作的函数,记作Y=f(X)。w常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。用函数关系表示。2.2 随机变量随机变量第十三页,本课件共有41页2.3 对总体的描述:随机变量的数字特征对总体的描述:随机变量的数字特征p 数学期望数学期望p 方差方差p 数学期望与方差的图示数学期望与方差的图示p 相关系数与协方差相关系数与协方差p 偏度和峰度偏度和峰度第十四页,本课件共有41页一、数学期望(集中趋势的度量)一、数学期望(集中趋势的度量)1、离散型随机变量数学期望的定义离散型随机变量数学期望的定义w 假定有一个离散型随机变量假定有一个离散型随机变量X有有n个不同的可能取值个不同的可能取值x1,x2,xn,而,而p1,p2,pn是是X取这些值相应的概率,取这些值相应的概率,则这个随机变量则这个随机变量X的数学期望定义如下:的数学期望定义如下:w数学期望描述的是随机变量(总体)的一般水平数学期望描述的是随机变量(总体)的一般水平第十五页,本课件共有41页2、连续型随机变量数学期望的定义连续型随机变量数学期望的定义w 若连续型随机变量若连续型随机变量X有分布密度函数有分布密度函数f(x),而积分,而积分 绝对收敛,则称绝对收敛,则称 为为X的数学期的数学期望。望。w数学期望是最容易发生的,因而是可以期待的。它反映数据集数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。中的趋势。一、数学期望(集中趋势的度量)一、数学期望(集中趋势的度量)第十六页,本课件共有41页求离散型随机变量数学期望举例求离散型随机变量数学期望举例例例1 甲、乙两射手在一次射击中的得分(分别用甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率表示)的分布率如下:如下:试比较两射手的射击技术水平,并计算如果二人各发一弹,试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。他们得分和的估计值。解解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因为因为EXEY,所以乙射手射击水平比较高;,所以乙射手射击水平比较高;二人各发一弹,得分总和最可能在二人各发一弹,得分总和最可能在4.3分左右(即分左右(即4分或分或5分)分)第十七页,本课件共有41页例例2:第十八页,本课件共有41页3、数学期望的性质、数学期望的性质(1)如果)如果a、b为常数,则为常数,则 E(aX+b)=aE(X)+b(2)如果)如果X、Y为两个随机变量,则为两个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果)如果g(x)和和f(x)分别为分别为X的两个函数,则的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果)如果X、Y是两个独立的随机变量,则是两个独立的随机变量,则 E(X.Y)=E(X).E(Y)第十九页,本课件共有41页4、条件期望、条件期望w条件期望值的定义:w对于连续型随机变量的条件期望只要把加总符号换成积分号即可。第二十页,本课件共有41页w几个重要性质几个重要性质(1)一般地(2)(3)重期望律:例:已知例:已知 ,则则 第二十一页,本课件共有41页二、方差:离散程度的度量二、方差:离散程度的度量1、随机变量方差的定义、随机变量方差的定义若X为连续型随机变量,则X的方差以下式给出 随机变量的方差记作Var(x)。方差的算术平方根叫标准差。第二十二页,本课件共有41页2、方差的性质、方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则为相互独立的随机变量,则 Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,为常数,x,y为两个相互独立的随机变量,则为两个相互独立的随机变量,则Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)2第二十三页,本课件共有41页例例3 计算本节例计算本节例1中甲射手的方差中甲射手的方差w例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:E(X)=2.1 Var(X)=(-1.1)2 0.4+(-0.1)2 0.1+0.92 0.5 =0.89第二十四页,本课件共有41页三、数学期望与方差的图示三、数学期望与方差的图示w数学期望描述随机变量的集中程度,方差描述随机变数学期望描述随机变量的集中程度,方差描述随机变量的离散程度。量的离散程度。1 方差同、期望变大方差同、期望变大 2 期望同、方差变小期望同、方差变小51055第二十五页,本课件共有41页四、相关系数与协方差四、相关系数与协方差w协方差和相关系数都是描述两个随机变量相互关联程协方差和相关系数都是描述两个随机变量相互关联程度的参数或统计量。度的参数或统计量。w方差是度量一个随机变量变异程度的指标,而协方差则是度量方差是度量一个随机变量变异程度的指标,而协方差则是度量两个随机变量协同变动的指标。要度量两个随机变量两个随机变量协同变动的指标。要度量两个随机变量之间之间的的关系,自然要考察两个变量同时变化关系,自然要考察两个变量同时变化协同变化的情协同变化的情况,于是需要定义协方差。为了弥补协方差的不足况,于是需要定义协方差。为了弥补协方差的不足受计量单位和数量尺度的影响,进而定义了度量两个随受计量单位和数量尺度的影响,进而定义了度量两个随机变量呈线性相关程度的指标机变量呈线性相关程度的指标相关系数。相关系数。第二十六页,本课件共有41页 1、协方差、协方差(1)定义:令随机变量)定义:令随机变量X和和Y的期望分别为的期望分别为E(x),E(y),其其协方差为协方差为:cov(X,Y)=E(X-E(x)(Y-E(y)=E(XY)-E(X)E(Y)一般而言,两随机变量的协方差可正可负。若两变量一般而言,两随机变量的协方差可正可负。若两变量同方向变动,则协方差为正,反之则为负。同方向变动,则协方差为正,反之则为负。第二十七页,本课件共有41页(2)协方差的性质协方差的性质(1)若随机变量X,Y相互独立,则其协方差为0。(2)cov(a+bX,c+dY)=bdcov(X,Y)(3)cov(X,X)=var(X)(3)相关变量的方差)相关变量的方差 若随机变量不是独立的,对于X+Y或X-Y的方差为:Var(X+Y)=var(X)+var(Y)+2cov(X,Y)Var(X-Y)=var(X)+var(Y)-2cov(X,Y)(4)若E(y|x)=E(y),则Cov(x,y)=0 证明:利用重期望律第二十八页,本课件共有41页2、相关系数、相关系数w相关系数用相关系数用 表示,其计算公式为:表示,其计算公式为:w从公式可看出两变量的相关系数等于它们的协方差与其各自的从公式可看出两变量的相关系数等于它们的协方差与其各自的标准差之比。标准差之比。w相关系数介于相关系数介于-1-1到到1 1之间。之间。w相关系数的典型图形见相关系数的典型图形见P P3131第二十九页,本课件共有41页五、偏度五、偏度(skewness)与峰度与峰度(kurtosis)w用于描述概率密度函数形状的数字特征。偏度(S)是对称性的度量;峰度(K)是概率密度函数高低或胖瘦的度量1、偏度(、偏度(S)的计算)的计算 对于正态分布,S0;若偏度S的值为正,则其概率密度为正偏或右偏,分布函数有长的右尾;若S的值为负,则其概率密度为负偏或左偏,分布函数有长的左尾。第三十页,本课件共有41页2、峰度(、峰度(K)的计算)的计算 概率密度函数的峰度K小于3时,成为低峰态的(胖的或短尾的),峰度K大于3时,称为尖峰态的(瘦的或长尾的)。对于正态分布的峰度为3,称为常峰态的。五、偏度五、偏度(skewness)与峰度与峰度(kurtosis)第三十一页,本课件共有41页2.4 样本分布的数字特征一、样本平均数一、样本平均数w总体的数字特征是一个固定不变的数,称为参数;样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。w样本平均数的定义样本平均数的定义:对于样本x1,x2,,xn,则样本平均数为w样本平均数用来描述样本的平均水平(一般水平)。第三十二页,本课件共有41页二、样本方差和标准差二、样本方差和标准差1、定义:、定义:对于样本x1,x2,,xn,则称分别为样本方差和标准差。2、样本序列的正态性检验、样本序列的正态性检验偏度:峰度:第三十三页,本课件共有41页 检验样本序列的正态性可采用检验样本序列的正态性可采用Jarque-Bera检验。该检验的检验。该检验的零假设是样本服从正态分布,检验统计量为零假设是样本服从正态分布,检验统计量为 其中其中m是产生样本序列时用到的估计系数的个数。在零是产生样本序列时用到的估计系数的个数。在零假设下假设下JB统计量服从统计量服从2(2)分布。若为原始数据则分布。若为原始数据则m=0;若若序列是通过模型估计得到的,序列是通过模型估计得到的,m为估计的参数个数。为估计的参数个数。2、样本序列的正态性检验、样本序列的正态性检验第三十四页,本课件共有41页检验的显著性水平检验的显著性水平 虚拟假设:H0;对立假设:H1。在假设检验中存在两类错误:拒绝一个其实是真的虚拟假设,即第类错误;第 类错误是指H0实际上是错误的,但没有拒绝它。检验的显著性水平(significance level)则定义为第类错误的概率,用符号表示为:P(拒绝H0|H0)即当H0为真时拒绝H0的概率。检验的检验的p值值 检验的p值(p-value)是指给定t统计量的观测值,能拒绝虚拟假设的最小显著性水平。小的p值是拒绝虚拟假设的证据。检验的显著性水平和p值第三十五页,本课件共有41页 例如:例如:样本序列取2002年我国30个地区以1978年为基衡量的实际人均GDP,采用Eviews软件计算有 S2.32 K=8.53 JB=65.29 p-value=0.00 则2002年各地区人均GDP呈现右偏、尖峰的分布形态,并且在99%的置信水平下拒绝零假设,即序列不服从正态分布。第三十六页,本课件共有41页三、样本协方差三、样本协方差 1、协方差的定义式、协方差的定义式若样本容量足够大,可用pij=1/n,那么第三十七页,本课件共有41页2协方差的缺陷协方差的缺陷(1)协方差是一个有单位的指标。例如,)协方差是一个有单位的指标。例如,Y为身高(厘米),为身高(厘米),X为体重(千克),那么它们的协方差为体重(千克),那么它们的协方差COV(Y,X)的单位为厘)的单位为厘米米.千克。所以不便于用作相互比较。千克。所以不便于用作相互比较。(2)协方差受数据尺度的影响。例如,)协方差受数据尺度的影响。例如,Y为身高(毫米),为身高(毫米),X为体为体重(克),那么它们的协方差重(克),那么它们的协方差COV(Y,X)的单位为毫米)的单位为毫米.克。同一组数据计算出来的协方差,(克。同一组数据计算出来的协方差,(2)比()比(1)大了)大了10倍。因此,也不便于用作相互比较。倍。因此,也不便于用作相互比较。于是,需要引入一个度量两个随机变量之间线性关系的指标于是,需要引入一个度量两个随机变量之间线性关系的指标相关系数,以克服单位与尺度的影响。相关系数,以克服单位与尺度的影响。第三十八页,本课件共有41页四、样本相关系数四、样本相关系数1、相关系数的定义、相关系数的定义第三十九页,本课件共有41页2根据相关系数初步判定变量之间的关系根据相关系数初步判定变量之间的关系正相关:正相关:Y为我国人均消费,为我国人均消费,X为我国人均国民收入,相关系为我国人均国民收入,相关系数:数:0.98第四十页,本课件共有41页负相关负相关Y与与X的相关,系数:的相关,系数:-0.92第四十一页,本课件共有41页

    注意事项

    本文(第二章基本统计概念的回顾优秀PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开