中国矿业大学_数理统计_课件.ppt
《中国矿业大学_数理统计_课件.ppt》由会员分享,可在线阅读,更多相关《中国矿业大学_数理统计_课件.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、周周圣圣武武数理统计数理统计Tel:13852138385E-mail:中国矿业大学中国矿业大学 理学院理学院第二章第二章数理统计的基本概念数理统计的基本概念2.1引言引言2.2总体总体、样本样本与统计模型与统计模型2.3统计量统计量和抽样分布和抽样分布2.42分布分布、t分布和分布和F分布分布2.5次序统计量次序统计量2.6描述性统计分析描述性统计分析总体特征的识别总体特征的识别2.1引言引言数理统计问题可以分为数理统计问题可以分为两大类两大类:如何科学地安排试验,以获取有效的随机数据。如何科学地安排试验,以获取有效的随机数据。描述统计学。描述统计学。如:试验设计、抽样方法。如:试验设计、抽
2、样方法。研研究究如如何何分分析析所所获获得得的的随随机机数数据据,对对所所研研究究的的问问题题进进行行科科学学的的、合合理理的的估估计计和和推推断断,尽尽可可能能地地为为采采取取一定的决策提供依据,一定的决策提供依据,作出精确而可靠的结论作出精确而可靠的结论.推断统计学。推断统计学。如:参数估计、假设检验等。如:参数估计、假设检验等。2.1引言引言应用数理统计方法解决实际问题的基本步骤:应用数理统计方法解决实际问题的基本步骤:(1)确定研究对象、研究目的;)确定研究对象、研究目的;(2)数据收集与整理;)数据收集与整理;(3)数据分析;)数据分析;(4)应用数据分析结果解决实际问题。)应用数据
3、分析结果解决实际问题。2.2总体、样本与统计模型总体、样本与统计模型1.总体总体研究对象的某项数量指标值的全体称为研究对象的某项数量指标值的全体称为总体。总体。总体中每个研究对象总体中每个研究对象(元素元素)称为称为样本。样本。例如例如:咱们班男生的身高;咱们班男生的身高;人的体温;人的体温;徐州地徐州地区下个月的区下个月的气温;气温;徐州地徐州地区下个月的区下个月的降雨量;降雨量;总体总体有限总体有限总体无限总体无限总体 总体可以用一个随机变量总体可以用一个随机变量 X 及其分布来描述。及其分布来描述。此总体就可以用随机变量此总体就可以用随机变量X或其分布函数或其分布函数例如例如,研究某批灯
4、泡的寿命时,研究某批灯泡的寿命时,这批灯泡中每个这批灯泡中每个灯泡的寿命灯泡的寿命是我们所关心的指标是我们所关心的指标.表示表示.2.样本样本样本样本:在总体中抽取的部分个体。:在总体中抽取的部分个体。样本容量样本容量:样本中所含个体的数目:样本中所含个体的数目n。定义定义为了准确地进行判断,对抽样有所要求:为了准确地进行判断,对抽样有所要求:代表性:代表性:样本的每个分量样本的每个分量与总体与总体X 有相同的有相同的分布函数;分布函数;独立性独立性:为相互独立的随机变量,为相互独立的随机变量,满足以上条件的样本满足以上条件的样本称为来自总体称为来自总体X 的容量为的容量为n 的一个的一个简单
5、随机样本(简称样本)。简单随机样本(简称样本)。样本的一次具体实现样本的一次具体实现称为称为样本值样本值。联合分布函数为联合分布函数为联合概率密度为联合概率密度为2.3统计量和抽样分布统计量和抽样分布定义定义1 设设 是来自总体是来自总体X 的一个样本,的一个样本,为一实值连续函数,为一实值连续函数,其不包含任何其不包含任何未知参数,则称未知参数,则称为一个为一个统计量统计量。为为的的观测值观测值。注注:仍为随机变量。仍为随机变量。是一个数。是一个数。例如例如总体总体是一个样本,是一个样本,则则均为统计量。均为统计量。当当未知时未知时,均不是统计量。均不是统计量。当当已知已知时时,均为统均为统
6、计量。计量。几个常用的统计量几个常用的统计量1.1.样本均值样本均值2.2.样本方差样本方差设设是来自总体是来自总体X 的一个样本,的一个样本,3.样本标准差样本标准差4.4.样本样本k 阶原点矩阶原点矩5.5.样本样本k 阶中心矩阶中心矩它们的观察值分别为:它们的观察值分别为:其样本为其样本为例例2 设总体设总体X 服从参数为服从参数为的的泊松分布,泊松分布,X的样本为的样本为求求例例1 设总体设总体X 的数学期望和方差分别为的数学期望和方差分别为是是来自总体来自总体例例3 3设设的的一样本一样本,总总体体的的阶矩阶矩存在,证明存在,证明(1)(2)证证独立且与独立且与同同分布分布独立且与独
7、立且与同同分布分布由辛钦大数定律,知由辛钦大数定律,知2.4几个常用的分布几个常用的分布记为记为定义定义设设相互独立相互独立,都服从正态都服从正态分布分布N(0,1),则称随机变量则称随机变量所服从的分布为自由度为所服从的分布为自由度为 n的的分布分布.分布分布1.分布的概率密度为分布的概率密度为其中伽玛函数其中伽玛函数定理定理1证明证明当x0时,依定义有作球坐标变换其中该变换的Jacobi行列式为其中是的函数,与r无关其中由得显然,当x2当当n 充分大时,其图形类似于标准正态分布充分大时,其图形类似于标准正态分布概率密度的概率密度的图形图形。但对于较小的但对于较小的n,t 分布与分布与N(0
8、,1)分布相差分布相差很大。很大。(3)t分布分布的分位点的分位点对于给定的正数对于给定的正数,称满足条件,称满足条件分位点。分位点。为为分布的上分布的上的点的点设设X与与Y相互独立,则称相互独立,则称服从自由度为服从自由度为3.F 分布分布n1及及n2的的F分布,分布,记作记作F F(n1,n2)。(2)若若X F(n1,n2),则,则n22(1)由定义可知,由定义可知,F(n2,n1)性质性质n24(3)F分布分布的分位点的分位点对于给定的正数对于给定的正数称满足条件称满足条件分位点分位点.分布的上分布的上的点的点为为证明证明:设设由定义由定义又因为又因为故故例例1 设总体设总体X,Y 相
9、互独立相互独立其样本为其样本为试求统计量试求统计量服从什么分布?服从什么分布?解解由已知得由已知得所以所以例例2 设总体设总体X 服从正态分布服从正态分布,其样本为,其样本为解解由已知得由已知得所以所以故故例例3 已知总体已知总体X 服从自由度为服从自由度为n 的的t 分布,求证:分布,求证:解解由已知得由已知得其中其中故故所以所以还能得还能得2.5正态总体的统计量的分布正态总体的统计量的分布1.单个正态总体的统计量的分布单个正态总体的统计量的分布定理定理1设设X1,X2,Xn 是取自正态总体是取自正态总体的样本,的样本,分别为样本均值和样本方差,则有分别为样本均值和样本方差,则有相互独立相互
10、独立定理定理2 设总体设总体X 服从正态分布服从正态分布是是X 的样本,的样本,分别为样本均值和样本方差,则有分别为样本均值和样本方差,则有证明证明因为因为是样本是样本的线性组的线性组合,故合,故,标准化后可得,标准化后可得又因为又因为相互独立,所以相互独立,所以也相互独立,则由也相互独立,则由t 分布的定义得分布的定义得2.两个正态总体的统计量的分布两个正态总体的统计量的分布定理定理3 设设X1,X2,Xn1 与与Y1,Y2,Yn2分别是来自分别是来自正态总体正态总体的样本,并且这两个样的样本,并且这两个样本相互独立,记本相互独立,记则有则有当当时时其中其中例例4 设总体设总体X 服从正态分
11、布服从正态分布,其样本为,其样本为解解由已知得由已知得,得,得例例5 设总体设总体X 服从正态分布服从正态分布,其样本为,其样本为解解由已知得由已知得查表查表例例6 设总体设总体X 服从正态分布服从正态分布,其样本为,其样本为解解因为因为例例7 设总体设总体X 服从正态分布服从正态分布,其样本为,其样本为解解由已知得由已知得所以所以标准化得标准化得又因为又因为故故例例8 设总体设总体X,Y 相互独立相互独立其样本为其样本为试求以下概率试求以下概率解解由已知得由已知得则则所以所以例例9一个样本,求一个样本,求设设是是来自正态总体来自正态总体的的(1)(2)由定理由定理2知知解解 例例9 9一个样
12、本,求一个样本,求设设是是来自正态总体来自正态总体的的(1)(2)查表可得查表可得2.5 次序统计量次序统计量称为样本称为样本的的次序统计量次序统计量.特别地,特别地,注注称称为为极差极差说明说明:定理定理1 设设独立同分布,独立同分布,为其次序统计量,则为其次序统计量,则 若若F(x)具有概率密度具有概率密度f(x),则,则X(k)的概率密度为的概率密度为例例解解样本的分布样本的分布1 1)样本的频数分布)样本的频数分布将将n个样本值个样本值按从小到大排列,把相同按从小到大排列,把相同的数合并,并指出其频数(样本中各数出现的次数)的数合并,并指出其频数(样本中各数出现的次数)x频数频数频率频
13、率2 2)样本的经验分布函数)样本的经验分布函数样本值样本值 样本值小于或等于样本值小于或等于x的个数,作的个数,作 样本的经验分布函数样本的经验分布函数给出了在给出了在n次独立重复试验中,事件次独立重复试验中,事件出现的频率,具有分布函数的一切性质。如:出现的频率,具有分布函数的一切性质。如:非降,右连续;非降,右连续;由频数分布知由频数分布知若样本为若样本为n维维r.vr.v,那么对于每一样本值,那么对于每一样本值就可作一个经验分布函数,故就可作一个经验分布函数,故是随机变量是随机变量-n次独立重复试验中,事件次独立重复试验中,事件发生的频率。发生的频率。由伯努利大数定律,由伯努利大数定律
14、,这就是我们可以由样本推断总体的基本理论依据这就是我们可以由样本推断总体的基本理论依据.格列汶科进一步证明了:当格列汶科进一步证明了:当n时,时,Fn(x)以以概率概率1 1关于关于x一致收敛于一致收敛于F(x),即即这就是著名的格列汶科定理这就是著名的格列汶科定理.定理告诉我们,当样本容量定理告诉我们,当样本容量n足够大时,对所有足够大时,对所有的的x,Fn(x)与与F(x)之差的绝对值都很小,这件事之差的绝对值都很小,这件事发生的概率为发生的概率为1.1.2.6描述性统计分析描述性统计分析总体特征的识别总体特征的识别2.6.1 2.6.1 描述统计量描述统计量1 1、中心位置的描述、中心位
15、置的描述2 2、变异性的描述、变异性的描述3 3、样本偏度系数和峰度系数、样本偏度系数和峰度系数所谓描述性统计分析,就是对一组数据的各种所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。及其所代表的总体的特征。描述性统计分析的项目很多,常用的如描述性统计分析的项目很多,常用的如平均数、标准差、中位数、极差、偏态程度平均数、标准差、中位数、极差、偏态程度等等。这些分析是复杂统计分析的基础。等等。这些分析是复杂统计分析的基础。数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置
16、位置)偏态和峰态偏态和峰态偏态和峰态偏态和峰态(形状)(形状)(形状)(形状)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)数据分布特征的测度数据分布特征的测度数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众 数数数数中位数中位数中位数中位数均均均均 值值值值离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰 态态态态四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率偏偏偏偏 态态态态1.中心位置的描述中心位置的描述(1)分类数据:)分类数据:众数众数(2)顺序数据:)顺序数据:
17、中位数和分位数中位数和分位数(3)数值型数据:)数值型数据:均值均值(4)众数、中位数和均值的比较众数、中位数和均值的比较(1)众数)众数(mode)出现次数最多的变量值出现次数最多的变量值不受极端值的影响不受极端值的影响一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数主要用于分类数据,也可用于顺序数据和数值型数据值型数据众数众数(不唯一性不唯一性)无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据:6 :6 559 8 9 8 5555多于一个众数多于一个众数多于一个众数多于一个众数原始数据原
18、始数据:25 :25 28282828 36 36 42424242(2)中位数)中位数(median)排序后处于中间位置上的值MMe e50%50%1.不受极端值的影响不受极端值的影响2.主要用于顺序数据,也可用数值型数据,但不主要用于顺序数据,也可用数值型数据,但不能用于分类数据能用于分类数据3.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即样本中位数样本中位数定义定义其观测值为其观测值为(3)数值型数据的中位数)数值型数据的中位数(9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国 矿业大学 数理统计 课件
限制150内