《统计学基础知识》PPT课件.ppt





《《统计学基础知识》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学基础知识》PPT课件.ppt(134页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章 统计学基础知识回顾主要内容n第一节 总体、样本和随机函数n第二节 对总体的描述随机变量的数字特征n第三节 对样本的描述样本分布的数字特征n第四节 随机变量的分布总体和样本的连接点n第五节 通过样本,估计总体(一)估计量的特征n第六节 通过样本,估计总体(二)估计方法n第七节 通过样本,估计总体(三)假设检验 四个基本定义与统计学的逻辑结构n总体和个体n样本和样本容量n随机变量n统计量n统计学的逻辑结构总体(集合)和个体(构成集合的元素)n研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。(1)按组成总体个体的多寡分为:有限总体和无限总体;(2)总体具有同质性:每个个体具有共
2、同的观察特征,而 与其它总体相区别;(3)度量同一对象得到的数据也构成总体,数据之间的差 异是绝对的,因为存在不可消除的随机测量误差;(4)个体表现为某个数值是随机的,但是,它们取得某个 数值的机会是不同的,即它们按一定的规律取值,即 它们的取值与确定的概率相对应。样本和样本容量n总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。n抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。随机变量n根据概率不同而取不同数值的变量称为随机变量(Random Variable)。n注意:(1)一个随机变量具有下列特性:RV可以取许多不同的数 值,
3、取这些数值的概率为p,p满足:0=p=1。(2)随机变量以一定的概率取到各种可能值,按其取值情 况随机变量可分为两类:离散型随机变量和连续型随 机变量。离散型随机变量的取值最多可列多个;连续 型随机变量的取值充满整个数轴或者某个区间。离散型随机变量与连续型随机变量 10 20 30 40 50概率概率xx离散型随机变量连续型随机变量总体与随机变量的关系n表示总体状况的数量特征,在总体中是参差不齐的,往往以一定的概率取不同的数值,显然对于这样的数值我们采用一般的变量是无法加以描述的。但是。可以采用一种特殊的变量来表示它们。这个特殊变量就是随机变量。因为,根据随机变量的定义,随机变量以一定的概率取
4、许多不同的值,而且概率p满足:0=p=1。n由于我们主要研究总体的数量特征,可以直接用随机变量来表示所研究的总体。总体、随机变量、样本间的联系n总体就是一个随机变量,所谓样本就是n个(样本容量n)相互独立且与总体有相同分布的随机变量X1,Xn。n每一次具体抽样所得的数据,就是n元随机变量的一个观察值,记为(X1,Xn)。n通过总体的分布可以把总体和样本连接起来。总体分布是总体和样本的连接点n所谓分布,它是从全局而言的。通俗地说,分布就是某个对象在什么地方,堆积了多少。n任何一个随机变量都有自己的分布,这个什么地方就是在数轴上取什么值,堆积多少就是在那里占有的比例是多少或者概率有多大。n总体可以
5、表示为随机变量,并具有自身的分布。n样本则是相互独立与总体具有相同分布的n元随机变量。因此,总体分布是总体和样本的连接点。从而,可以通过对样本特征的研究达到对总体进行研究的目的。因为它们具有相同的分布。统计量n设(x1,x2,xn)为一组样本观察值,函数f(x1,x2,xn)若不含有未知参数,则称为统计量。n统计量一般是连续函数。由于样本是随机变量,因而它的函数也是随机变量,所以,统计量也是随机变量。n统计量一般用它来提取或压榨由样本带来的总体信息。样本与总体之间的关系样本是总体的一部分,是对总体随机抽样后得到的集合。对观察者而言,总体是不了解的,了解的只是样本的具体情况。我们所要做的就是通过
6、对这些具体样本的情况的研究,来推知整个总体的情况。Xn+1XnX1样本总体统计学的逻辑结构(1)总体和样本 引入一个随机变量来描述总体(2)对总体的描述:随机变量的数字特征(3)对样本的描述:样本分布的数字特征(4)总体与样本的连接点:随机变量的分布(5)如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数 a 估计量的优良性 b 估计方法 c 对估计量的检验假设检验a 估计量的优良性n1、无偏性n2、有效性n3、均方误最小n4、一致性b 估计方法 矩法最大似然法最小二乘法总体分布未知正态总体一般总体(大样)已知方差方差未知一般总体(大样)正态总体估计期望单个总体两个总体估计方差(
7、常用小样本下,正态总体估计其它参数)点估计区间估计c 对估计量的检验假设检验n1.对总体分布特征的假设检验(1)一个正态总体的假设检验a 检验均值:已知方差和未知方差b 检验方差:未知均值(双尾和单尾)(2)两个正态总体的假设检验a 检验均值:未知方差但可假设其相等b 检验方差:未知均值(双尾和单尾)(3)总体分布的假设检验a 总体为离散型分布b 总体为连续型分布n2.对各种系数、参数估计值的假设检验一、随机变量的分布(一)离散型随机变量的分布n定义:如果随机变量只取有限个或可列多个可能值,而且以确定的概率取这些值,则称为离散型随机变量。n通常用分布列表示离散型随机变量:n的概率分布也可用一系
8、列等式表示:nP(=xi)=pi (i=1,2,)称为的概率函数。n显然满足概率的定义:n离散型随机变量的分布就是指它的分布列或概率函数。离散型随机变量举例1n例1 一批产品的废品率为5%,从中任取一个进行检验,以随机变量来描述这一试验并写出的分布。以X=0表示“产品为合格产品”,X=1表示“产品为废品”,那么分布列如下:其概率函数p(X=0),p(X=1),或p(X=i)=()i()1-i (i=0,1)离散型随机变量举例2n用随机变量X描述掷一颗骰子的试验。分布的概率函数为:P(X=i)=1/6(i=1,2,3,4,5,6)(二)随机变量的分布函数n定义:若X是一个随机变量(可以是离散的,
9、也可以是非离散的),对任何实数x,令F(x)=P(X=x),称F(x)为随机变量X的分布函数。F(x),即事件“X=x”的概率,是一个实函数。对任意实数x1x2,有P(x1Xx2)=P(X=x2)-P(X=x1)=F(x2)-F(x1)x2x2F(x)F(x)Xx1x1分布函数F(x)的性质分布函数举例n例3 求例1中的分布函数n例4 求例2中的分布函数01F(x)x(三)连续型随机变量的分布n定义:对于任何实数x,如果随机变量X的分布函数 F(x)可以写成n概率分布密度函数的性质:连续型随机变量分布函数举例a x ba x bF(x)(x)二、二元随机变量nn元随机变量的定义:每次试验同时处
10、理n个随机变量(X1,X2,Xn),它们的取值随试验的进行而变化。如果对任何一组实数(x1,x2,xn),事件“X1x1,X2x2,Xnxn”有着确定的概率,则称n个随机变量(X1,X2,Xn)总体为一个n元随机变量。nn元随机变量分布函数的定义:n元函数F(x1,x2,xn)=P(X1x1,X2x2,Xnxn)(x1,x2,xn)属Rn,为n元随机变量分布函数。离散二元随机变量的定义:如果二元随机变量(X,Y)所有可能取值为有限或可列多个,并且以确定的概率取各个不同数值,则称(X,Y)为二元随机变量。(X,Y)的联合分布表和联合分布函数n(X,Y)为离散型的二元随机变量,通常用联合分布函数与
11、联合分布表表示。离散二元分布函数的示例n例6 同一品种的5个产品中,有2个正品,3个次品,每次从中抽取一个进行质量检查,不放回的抽取,连续两次。令“Xi=0”表示第i次抽取到正品,而“Xi=1”表示第i次抽取到次品,写出(X1,X2)的分布。解 p(X1=0,X2=0)=p(X1=0)P(X2=0)=(2/5)(1/4)=1/10 p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10 p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10 p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10连续
12、二元随机变量的定义三、独立性n(一)事件的独立性n(二)随机变量的独立性(一)事件的独立性定义1.12 事件的独立性的定义 如果事件A发生的可能性不受事件B发生与否的的影响,即P(AB)=P(A),则称事件A对于事件B独立。显然,若事件A对于事件B独立,事件B对于事件A也一定独立,我们称事件A与事件B相互独立。A与B独立的充分必要条件是:P(AB)=P(A)P(B)(二)随机变量的独立性n定义1.13 边际分布的定义 离散型二元随机变量(X,Y)中,分量X(或Y)的概率分布称为(X,Y)的关于X(或Y)的边际分布,边际分布又称边缘分布。n定义1.14 随机变量相互独立的定义 对于任何实数x,y
13、,如果二元随机变量(X,Y)的联合分布函数F(x,y)等于X和Y的边际分布的乘积,即 F(x,y)=FX(x).FY(y)则称X与Y相互独立。四、随机变量函数的概念和分布n定义1.15 随机变量函数的定义 设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。n 我们常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已
14、知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。第二节 对总体的描述随机变量的数字特征一、数学期望二、方差三、数学期望与方差的图示一、数学期望n研究数字特征的必要性n两个最重要的数字特征(1)数学期望(2)方差研究数字特征的必要性n总体就是一个随机变量。对总体的描述就是对随机变量的描述。随机变量的分布就是对随机变量最完整的描述。但是,(1)求出总体的分布往往不是一件容易的事情;(2)而且,在很多情况下,我们并不需要全面考察随机变量的变化情 况,只需要了解总体的一些综合指标。一般说来,常常需要了解总体的一般水平和它的离散程度;(3)如果了解总体的一般水平和离散程度
15、,就已经对总体有了粗略的了解了;(4)在很多情况下,了解这两个数字特征还是深入求出总体分布的基础和关键。数学期望的定义n定义2.1 离散型随机变量数学期望的定义 假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下:数学期望描述的是随机变量(总体)的一般水平。n定义2.2 连续型随机变量数学期望的定义女儿期待父亲钓多少鱼回家?女儿期待父亲钓多少鱼回家?n数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。数学期望的性质(1)如果a、b为常数,则 E(aX+b)=aE(X)+b(2)如果X、Y为两
16、个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y)求离散型随机变量数学期望举例n例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。解 EX=1 EXEY 乙射手射击水平比较高 二人各发一弹,得分总和最可能在分左右(即4分或5分)二、方差n定义2.3 离均差的定义 如果随机变量X的数学期望E(X)存在,称 X-E(X)为随机变量X的离均差。
17、显然,随机变量离均差的数学期望是0,即 E X-E(X)=0n定义2.4 连续型随机变量的方差n定义2.5 随机变量离均差平方的数学期望,叫随机变量的方差,记作Var(x),或D(x)。方差的算术平方根叫标准差。方差的意义n(1)离均差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。n(2)一般情况下,我们采用方差来描述离散程度。因为离均差的和为0,无法体现随机变量的总离散程度。事实上正偏差大亦或负偏差大,同样是离散程度大。方差中由于有平方,从而消除了正负号的影响,并易于加总,也易于强调大的偏离程度的突出作用。方差的性质(1)Var(c)=0(
18、2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则 Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,x,y为两个相互独立的随机变量,则Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)2例2 计算本节例1中甲射手的方差n例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:Var(X)=()2 0.4+()2 2 三、数学期望与方差的图示n数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学基础知识 统计学 基础知识 PPT 课件

限制150内