抽样分布 (2)精选PPT.ppt
抽样分布2023/1/12河南财经学院数学教研室1第1页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室2 2 一、图形描述一、图形描述 常用的统计图有扇形图、直方图常用的统计图有扇形图、直方图.1.统计资料的描述统计资料的描述 时间序列数据时间序列数据 对某个统计指标在不同时间对某个统计指标在不同时间进行观测进行观测,将得到的数据按时间先后次序进行排将得到的数据按时间先后次序进行排列列.年份1988 1989 1990 1991 1992 1993 1994 职工年平均工资(元)1747 1935 2140 2340 2711 3371 4538第2页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室3 3 横截面数据横截面数据 将某个指标在不同的个体上进将某个指标在不同的个体上进行观测行观测,就得到该指标的一组横截面数据就得到该指标的一组横截面数据.企业编号 1 2 3 4 5 6 7 职工工资(元)1450 1550 1720 1850 1150 1970 2300 2.统计图形描述统计图形描述 常用的统计图形是直方图常用的统计图形是直方图.下面通过一个例子来介绍一下直方图的做法下面通过一个例子来介绍一下直方图的做法.第3页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室4 4 数频直方图数频直方图 数频直方图是以垂直条形代表频数分布的一数频直方图是以垂直条形代表频数分布的一种图形种图形.430303661538429364144202843813380273251252826426114202542410430244209444234048404224247558213406396204125428194764444183583376174722436163881销售收入(万元)公司编号销售收入(万元)公司编号表表4-3 304-3 30个公司月销售额个公司月销售额第4页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室5 5 画出频数直方图的具体步骤如下画出频数直方图的具体步骤如下:确定数据的大小值范围确定数据的大小值范围;将数据分成等长的若干组将数据分成等长的若干组(段段);完成频数分布表完成频数分布表;销售额分组频数相对频数320,360)310.0%360,400)723.3%400,440)1446.7%440,480)413.3%480,520)13.3%520,560)13.3%合计30100%第5页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室6 6 画出直方图画出直方图.50%40%30%20%10%0%300 360 400 440 480 520 560频数相对频数第6页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室7 7 二、数字特征描述二、数字特征描述 数字特征描述是对一组统计数据作适当的计数字特征描述是对一组统计数据作适当的计算处理算处理,从而求出反映这组数据特征的一些从而求出反映这组数据特征的一些“量量”的方法的方法.这些量就是统计量,常见的有以下几种:这些量就是统计量,常见的有以下几种:1.平均数平均数 若有某个指标的若有某个指标的个观测值个观测值它们它们的平均数用的平均数用来表示来表示:第7页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室8 8 例例1 5名学生的数学考试成绩为名学生的数学考试成绩为93、89、92、98、86分,则他们的平均成绩为分,则他们的平均成绩为 若记观测值总数若记观测值总数 其中其中表示取值为表示取值为的观测值的个数,的观测值的个数,称为观测值称为观测值的相对频数。的相对频数。第8页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室9 9 2.中位数中位数 把观测值按从小到大的次序排列,最中间的把观测值按从小到大的次序排列,最中间的数称为这组观测值的中位数,用数称为这组观测值的中位数,用表示。表示。设有设有个观测值个观测值按序排列后为按序排列后为则中位数为则中位数为第9页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室1010 例例2 对于例对于例1中的中的5名同学的学习成绩名同学的学习成绩,按序按序排列为排列为8689929398 由于由于为奇数为奇数,所以中位数成绩为所以中位数成绩为 3.众数众数 众数是指观测值中出现频数最高的那个观测众数是指观测值中出现频数最高的那个观测值值,用用表示表示,众数也是一种位置平均数众数也是一种位置平均数.众数一般可以从观测值的频数直方图上看出众数一般可以从观测值的频数直方图上看出来来,频数频数(或相对频数或相对频数)最高的组称为众数组最高的组称为众数组,众数众数就位于众数组内就位于众数组内.第10页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室1111 平均数、中位数和众数是用来描述数据集中平均数、中位数和众数是用来描述数据集中趋势的最常用的量,三者的关系用图形表示如趋势的最常用的量,三者的关系用图形表示如图所示:图所示:第11页,此课件共60页哦2023/1/122023/1/12河南财经学院数学教研室河南财经学院数学教研室1212 英国统计学家皮尔逊(英国统计学家皮尔逊(K.pearson)发现,)发现,在一个微偏斜的分布中,中位数大致位于平均在一个微偏斜的分布中,中位数大致位于平均值与众位数间距的值与众位数间距的1/3处,用公式表示如下:处,用公式表示如下:若已知若已知时,可由上式求出时,可由上式求出 4.极差极差 极差也称为全距,是次序分布中最大值与极差也称为全距,是次序分布中最大值与最小值之差,用最小值之差,用来表示为来表示为第12页,此课件共60页哦2023/1/12河南财经学院数学教研室13第二节第二节 数理统计的基本概念数理统计的基本概念一、总体与个体一、总体与个体 研究对象的全体称为总体,组成总体的每个研究对象的全体称为总体,组成总体的每个基本单元称为个体。基本单元称为个体。二、样本与样品二、样本与样品 从总体从总体中随机抽取的中随机抽取的个个体个个体称为总体称为总体的样本,的样本,称为样本容量,组成样称为样本容量,组成样本的个体称为样品(或观测值)。本的个体称为样品(或观测值)。第13页,此课件共60页哦2023/1/12河南财经学院数学教研室14第二节第二节 数理统计的基本概念数理统计的基本概念二、简单随机样本二、简单随机样本3.简单随机样本:简单随机样本:随机抽样,样本随机抽样,样本(X1,X2,Xn)满足:满足:.独立性:独立性:指指X1,X2,Xn相互独立相互独立.代表性:代表性:样本中的每个个体样本中的每个个体Xi与总体与总体X同分同分布布简单随机样本的获得方法:重复抽样简单随机样本的获得方法:重复抽样对于无限总体,或总体容量相对于样本容量大对于无限总体,或总体容量相对于样本容量大得多时得多时,不重复抽样所得样本,也可近似认为不重复抽样所得样本,也可近似认为简单随机样本简单随机样本第14页,此课件共60页哦2023/1/12河南财经学院数学教研室15是取自总体是取自总体 根据定义根据定义,若若的样本的样本,且且的分布函数为的分布函数为则样本的分则样本的分布函数为布函数为是连续型随机变量是连续型随机变量,其概率密度为其概率密度为 若总体若总体则样本则样本的概率密度为的概率密度为第15页,此课件共60页哦2023/1/12河南财经学院数学教研室16是离散型随机变量是离散型随机变量,其概率分布为其概率分布为 若总体若总体则样本则样本的概的概率分布为率分布为 例例1 设设是取自正态总体是取自正态总体的样本的样本,则样本的概率函数为则样本的概率函数为第16页,此课件共60页哦2023/1/12河南财经学院数学教研室17 例例2 一批产品中有合格品和不合格品两种一批产品中有合格品和不合格品两种,现从中随机抽取一件现从中随机抽取一件,用数字用数字“0”表示合格品表示合格品,数字数字“1”表示不合格品,这时总体表示不合格品,这时总体服从服从0-1分布:分布:即即设设是取自这个总体的样本是取自这个总体的样本,则有则有第17页,此课件共60页哦2023/1/12河南财经学院数学教研室18三、统计量与样本矩三、统计量与样本矩定义定义4.2设设为总体为总体的一个样本的一个样本,是是的连续函数的连续函数,如如果果中不包含任何未知参数中不包含任何未知参数,则称则称为一个统计量为一个统计量.下面给出一些常用而重要的统计量下面给出一些常用而重要的统计量:1.样本矩样本矩(1)样本均值样本均值第18页,此课件共60页哦2023/1/12河南财经学院数学教研室19(2)样本方差样本方差(3)样本标准差样本标准差(4)样本样本阶原点矩阶原点矩当当时时,一阶原点矩就是样本均值一阶原点矩就是样本均值.第19页,此课件共60页哦2023/1/12河南财经学院数学教研室20(5)样本样本阶中心矩阶中心矩当当时时,第20页,此课件共60页哦2023/1/12河南财经学院数学教研室212.次序统计量次序统计量 设设是来自总体是来自总体的样本的样本,是样本观测值是样本观测值,把样本观测值按把样本观测值按从小到大的次序排列成从小到大的次序排列成则可根据则可根据的对应关系来确定后者在大小的对应关系来确定后者在大小顺序中的位置顺序中的位置,定义定义称由此得到的称由此得到的的样本次序统计量的样本次序统计量,第21页,此课件共60页哦2023/1/12河南财经学院数学教研室22如果如果为观测值为观测值,则称则称为第为第个次个次序统计量序统计量.显然显然两者也分别称为最小次序统计量和最大次序两者也分别称为最小次序统计量和最大次序统计量统计量.称称称称为样本中位数为样本中位数.第22页,此课件共60页哦2023/1/12河南财经学院数学教研室23 例例3 已知已知相互独立相互独立,且它们的分布函数且它们的分布函数分别是分别是求求的次序统计量的次序统计量:的分布函数的分布函数 解解 而而 第23页,此课件共60页哦2023/1/12河南财经学院数学教研室24 例例4 设总体设总体服从区间服从区间上的均匀分布上的均匀分布,求求:来自来自的简单随机样本的简单随机样本的密度的密度的密度的密度;的密度的密度;解解 由于由于的密度为的密度为则由于则由于相互独立且与相互独立且与同分布同分布,所以由式所以由式(4-7)得得第24页,此课件共60页哦2023/1/12河南财经学院数学教研室25由于由于服从区间服从区间上的均匀分布上的均匀分布,其分其分布函数为布函数为又由例又由例3可推知可推知第25页,此课件共60页哦2023/1/12河南财经学院数学教研室26第26页,此课件共60页哦2023/1/12河南财经学院数学教研室27 解解 例例5 设总体设总体为来自为来自的样本的样本,试求试求:第27页,此课件共60页哦2023/1/12河南财经学院数学教研室28第28页,此课件共60页哦2023/1/12河南财经学院数学教研室29是大样本是大样本,故由中心极限定理故由中心极限定理,近似服从近似服从 第29页,此课件共60页哦2023/1/12河南财经学院数学教研室30 设设是来自正态总体是来自正态总体的简单随即样本的简单随即样本,为样本均值,则有为样本均值,则有证证第30页,此课件共60页哦2023/1/12河南财经学院数学教研室31第三节第三节 抽样分布抽样分布一、正态分布一、正态分布 由前面第二章正态分布的定义可知由前面第二章正态分布的定义可知:若总体若总体其密度函数为其密度函数为将将标准化后得标准化后得其概率密度为其概率密度为即即服从标准正态分布服从标准正态分布.第31页,此课件共60页哦2023/1/12河南财经学院数学教研室32定义定义4.3若若对于给定的对于给定的称满足称满足或或的点的点为标准正态分布的为标准正态分布的水平上侧临界值水平上侧临界值,如图如图4-3所示所示.图图4-3第32页,此课件共60页哦2023/1/12河南财经学院数学教研室33对于给定的对于给定的算出算出查标准正态分布表查标准正态分布表即可求得即可求得即即例如例如第33页,此课件共60页哦2023/1/12河南财经学院数学教研室34二、二、分布分布定义定义4.4设随机变量设随机变量其中其中的密度函数为的密度函数为函数函数,则称则称服从服从自由度为自由度为分布分布,记为记为第34页,此课件共60页哦2023/1/12河南财经学院数学教研室35分布的概率密度函数的图形如图分布的概率密度函数的图形如图4-4所示所示,0 5 10 15 20 25 300.050.200.150.10图图4-4 的概率密度函数的概率密度函数 它随自由度它随自由度的不同有所变动的不同有所变动,当当时时第35页,此课件共60页哦2023/1/12河南财经学院数学教研室36定理定理4.1设随机变量设随机变量服从自由度为服从自由度为分布分布,服从自由度为服从自由度为分布分布,且且相互独立相互独立,则则服从自由度为服从自由度为分布分布.此定理称为此定理称为分布的可加性分布的可加性.推论推论 若若自由度相应为自由度相应为相互独立相互独立,都服从都服从分布分布,则有则有第36页,此课件共60页哦2023/1/12河南财经学院数学教研室37定理定理4.2设设相互独立相互独立,都服从标准都服从标准正态分布正态分布,则随机变量则随机变量服从自由度为服从自由度为分布分布.证证由定理由定理2.6,因因再由定理再由定理4.1的推论的推论,即由即由分布分布的可加性的可加性,得得第37页,此课件共60页哦2023/1/12河南财经学院数学教研室38定义定义4.5设设服从自由度为服从自由度为分布分布,对对于给定的于给定的将满足将满足水平上侧临界水平上侧临界值值,记为记为它与它与有关有关(见图见图4-5)第38页,此课件共60页哦2023/1/12河南财经学院数学教研室39 例例1 已知已知 解解 由附表由附表,查自由度为查自由度为9的的分布上侧分布上侧临界值表临界值表,因因查表得查表得查表得查表得同样同样,因因第39页,此课件共60页哦2023/1/12河南财经学院数学教研室40三、三、分布分布定理定理4.3设设相互独相互独立立,则随机变量则随机变量服从自由度为服从自由度为分布分布,记为记为其密度函数为其密度函数为则称则称服从自由度为服从自由度为分布分布,记为记为它的图形关于直线它的图形关于直线对称对称.第40页,此课件共60页哦2023/1/12河南财经学院数学教研室41当当时时,可以证明可以证明即当即当很大很大分布非常分布非常近似于近似于如图如图4-6所示所示.-2 -1 0 1 2图图4-6第41页,此课件共60页哦2023/1/12河南财经学院数学教研室42定义定义4.6设设所决定的所决定的称作自由度为称作自由度为水平水平侧临界值侧临界值,如图如图4-7所示所示.记为记为显然有显然有图图4-7双侧临界值双侧临界值第42页,此课件共60页哦2023/1/12河南财经学院数学教研室43 例例2 查表求查表求 解解 第43页,此课件共60页哦2023/1/12河南财经学院数学教研室44四、四、分布分布定义定义4.7设随机变量设随机变量相互独立相互独立,且且则随机变量则随机变量服从自由度为服从自由度为如图如图4-8所示所示.1 2 30.21.00.80.60.4第44页,此课件共60页哦2023/1/12河南财经学院数学教研室45第45页,此课件共60页哦2023/1/12河南财经学院数学教研室46定义定义4.8设随机变量设随机变量对于给定的对于给定的所决定的实数所决定的实数称作自由度为称作自由度为水平上侧临界值水平上侧临界值,记为记为如图如图4-9所示所示.第46页,此课件共60页哦2023/1/12河南财经学院数学教研室47 例例3 解解 第47页,此课件共60页哦2023/1/12河南财经学院数学教研室48第四节第四节 重要统计量及其分布重要统计量及其分布一、一个正态总体一、一个正态总体定理定理4.4 设设是来自正态总体是来自正态总体的简单随即样本的简单随即样本,为样本均值,则有为样本均值,则有第48页,此课件共60页哦2023/1/12河南财经学院数学教研室49证证第49页,此课件共60页哦2023/1/12河南财经学院数学教研室50定理定理4.5 第50页,此课件共60页哦2023/1/12河南财经学院数学教研室51定理定理4.6 第51页,此课件共60页哦2023/1/12河南财经学院数学教研室52证证第52页,此课件共60页哦2023/1/12河南财经学院数学教研室53二、两个正态总体二、两个正态总体定理定理4.7 第53页,此课件共60页哦2023/1/12河南财经学院数学教研室54证证第54页,此课件共60页哦2023/1/12河南财经学院数学教研室55定理定理4.8 第55页,此课件共60页哦2023/1/12河南财经学院数学教研室56证证第56页,此课件共60页哦2023/1/12河南财经学院数学教研室57定理定理4.9 第57页,此课件共60页哦2023/1/12河南财经学院数学教研室58证证第58页,此课件共60页哦2023/1/12河南财经学院数学教研室59三、非正态总体(大样本)三、非正态总体(大样本)定理定理4.10 第59页,此课件共60页哦2023/1/12河南财经学院数学教研室60证证第60页,此课件共60页哦