《数理统计方法》PPT课件.ppt
《《数理统计方法》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数理统计方法》PPT课件.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 对随机现象进行观测、试验,对随机现象进行观测、试验,以取得有代表性的观测值以取得有代表性的观测值 对已取得的观测值进行整理、对已取得的观测值进行整理、分析分析,作出推断、决策作出推断、决策,从而从而 找出所研究的对象的规律性找出所研究的对象的规律性数数理理统统计计的的分分类类描述统计学描述统计学推断统计学推断统计学第八章第八章 数理统计方法数理统计方法参数估计参数估计假设检验假设检验回归分析回归分析方差分析方差分析 推断 统计学总体和样本总体和样本总体与个体总体与个体 总体总体或或母体母体指我们研究对象的指我们研究对象的全体构成的集合全体构成的集合,个体个体指总体中包含的指总体中包含的每个成
2、员每个成员 我我们们研研究究总总体体时时,所所关关心心的的往往往往是是总总体体某某方方面面的的特特性性,这这些些特特性性又又常常常常可可以以用用一一个个或或多多个个数数量量指标来反映指标来反映 例例如如,在在研研究究某某厂厂生生产产的的灯灯泡泡的的质质量量时时,关关心心的可能是这些灯泡的寿命和光亮度等的可能是这些灯泡的寿命和光亮度等 总总体体指指一一个个或或多多个个数数量量指指标标,我我们们可可以以用用一一个个或多个随机变量来表示它们或多个随机变量来表示它们总体总体指标值全集指标值全集指标指标随机变量随机变量把总体与某个随机变量的可能取值的集合等同,把总体分布与某个随机变量的分布等同,把对总体
3、的研究转化为对某个随机变量规律的研究。数理统计中提到的总体,是指分布未知或数理统计中提到的总体,是指分布未知或者分布类型已知但至少某些参数未知的随机变者分布类型已知但至少某些参数未知的随机变量,常用量,常用X X,Y Y,Z Z等表示。等表示。因因此此,总总体体可可以以是是一一维维随随机机变变量量,也也可可以以是是多多维随机变量维随机变量 例例如如,在在研研究究某某厂厂生生产产的的灯灯泡泡的的质质量量时时,可可以以分分别别用用X,Y表表示示灯灯泡泡的的寿寿命命和和光光亮亮度度,那那么么,对对上上面面两两个个问问题题的的研研究究就就转转化化为为对对总总体体(X,Y)的的研研究了究了 2 2 样本
4、与抽样样本与抽样 实实际际应应用用中中,为为了了研研究究总总体体的的特特性性,总总是是从从总总体体中中抽抽出出部部分分个个体体进进行行观观察察和和试试验验,根根据据观观察察或或试验得到的数据推断总体的性质试验得到的数据推断总体的性质我们把从总体中抽出的部分个体称为我们把从总体中抽出的部分个体称为样本样本,把样本中包含个体的数量称为把样本中包含个体的数量称为样本容量样本容量,把对样本的观察或试验的过程称为把对样本的观察或试验的过程称为抽样抽样,把把观观察察或或试试验验得得到到的的数数据据称称为为样样本本观观测测值值(观观测测数据),简称数据),简称样本值样本值 在在应应用用中中,我我们们从从总总
5、体体中中抽抽出出的的个个体体必必须须具具有有代代表表性性,样样本本中中个个体体之之间间要要具具有有相相互互独独立立性性,为为保保证证这两点,一般采用简单随机抽样这两点,一般采用简单随机抽样 定定义义 一一种种抽抽样样方方法法若若满满足足下下面面两两点点,称称其其为为简简单单随机抽样随机抽样:(1)总体中每个个体被抽到的机会是均等的;总体中每个个体被抽到的机会是均等的;(2)样本中的个体相互独立样本中的个体相互独立 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本 如如果果没没有有特特殊殊说说明明,以以后后所所说说样样本本均均指指简简单单随随机机样样本本随机抽样随
6、机抽样 获得样本获得样本完成试验完成试验 获得数据获得数据整理加工整理加工 统计推断统计推断3 统计量与抽样分布统计量与抽样分布 在在利利用用样样本本推推断断总总体体的的性性质质时时,往往往往不不能能直直接接利利用用样样本本,而而需需要要对对它它进进行行一一定定的的加加工工,这这样样才才能能有有效效地地利利用用其其中中的的信信息息,否否则则,样样本本只只是是呈呈现现为一堆为一堆“杂乱无章杂乱无章”的数据的数据一、基本概念1.统计量的定义统计量的定义1.表示位置的统计量表示位置的统计量 设设X1,X2,Xn为为总总体体X的的样样本本,x1,x2,.,xn为样本观测值,为样本观测值,(1)样本均值
7、样本均值 常常用用来来作作为为总总体体期期望望(均均值值)的的估估计计量量,其观测值为其观测值为(2)(2)中位数中位数把一组数据按大小顺序排序后处于中间位置的数。把一组数据按大小顺序排序后处于中间位置的数。(3)(3)分位数分位数 设设X为为一一随随机机变变量量,我我们们知知道道对对于于给给定定的的实实数数x,PX x是是事事件件X x的的概概率率在在统统计计中中,我我们们常常常常需需要要对对给给定定事事件件X x的的概概率率,由由此此确确定定的的x取取是是一一个临界点个临界点,称为分位数称为分位数(点点),有如下定义:有如下定义:定定义义 设设X为为随随机机变变量量,若若对对给给定定的的
8、(0,1),存存在在x 满满足足 PX x =,则则称称x 为为X的的上上 分分位位数数(点点)1方差、标准差与变异系数方差、标准差与变异系数、极差极差样本方差、标准差与变样本方差、标准差与变异系数为总体方差、标异系数为总体方差、标准差、变异系数的相合准差、变异系数的相合估计估计方差方差均方差均方差变异系数变异系数 时,有时,有 2 2 表示分散性的数字特征表示分散性的数字特征标准差标准差(方差方差)越越大大,表示观察值表示观察值分布越分散;反分布越分散;反之分布越集中之分布越集中.刻划数刻划数据据相对相对分散分散指指标标 极差极差 (1)样本样本k阶原点矩(简称样本阶原点矩(简称样本k阶矩)
9、阶矩),(k=1,2,)(2)样本样本k阶中心矩阶中心矩 ,(k=2,3,)显然显然3 3 表示分布形态的数字特征表示分布形态的数字特征 (3 3)偏度)偏度(skewness)(skewness)注注意意奇数奇数阶中阶中心距心距频频数数频频数数其中其中s样本标准差样本标准差.分布对称;分布对称;称正偏度称正偏度(右偏右偏态态)均值右边数据更分散;均值右边数据更分散;负偏度,均值左边的数据更负偏度,均值左边的数据更分散分散.4峰度峰度 1.正峰正峰值值表示数据中含有表示数据中含有较较多多远远离均离均值值的极端数的极端数值值,相,相对对尖尖锐锐的分布的分布,尾部粗尾部粗2.负负峰表示两峰表示两侧
10、侧的极端数的极端数值值比比较较少,数据大部分少,数据大部分在均在均值值周周围围,相,相对对平坦平坦,尾部尾部细细 尖峰粗尾 平峰细尾反映与正态分布相比某反映与正态分布相比某一分布的尖锐或平坦度一分布的尖锐或平坦度.设设已知已知已知已知总总体体体体X X X X的可能分布函数族的可能分布函数族的可能分布函数族的可能分布函数族为为:理论根据理论根据:样本矩本矩(的的连续函数函数)依概率收依概率收敛于于总 体矩体矩(的连续函数的连续函数).).其中其中其中其中 为待估参数为待估参数为待估参数为待估参数.矩估计法矩估计法:用用样本矩本矩(函数函数)来估来估计总体矩体矩(函数函数).).8.2 参数估计
11、法参数估计法-矩估计法矩估计法 设总体体X X的前的前k k阶矩矩 均存在均存在均存在均存在,而样本矩而样本矩而样本矩而样本矩其中其中其中其中 矩估矩估计法就是法就是:令令总体的前总体的前k k阶矩分别与样本的阶矩分别与样本的 对应阶矩相等对应阶矩相等,即即 矩估计法矩估计法 可作为待估参数可作为待估参数可作为待估参数可作为待估参数 的估计量的估计量的估计量的估计量(称为称为称为称为矩估计矩估计矩估计矩估计 量量量量),),),),其其其其观观察察察察值为值为待估参数的估待估参数的估待估参数的估待估参数的估计值计值(称称称称为为矩估计值矩估计值矩估计值矩估计值).).).).这是含这是含这是含
12、这是含k k k k个待估参数个待估参数个待估参数个待估参数 的的的的联立方程组联立方程组联立方程组联立方程组,其解,其解,其解,其解1.矩估计法矩估计法 解解解方程组得到矩估计量分别为解方程组得到矩估计量分别为例例1.矩估计法矩估计法 上例表明上例表明:总体均值与方差的矩估计量的表达式不因不总体均值与方差的矩估计量的表达式不因不同的总体分布而异同的总体分布而异.一般地一般地,1.矩估计法矩估计法 一般说,事件一般说,事件A A发生的概率与参数发生的概率与参数有关,有关,取值不同,则取值不同,则P(A)P(A)也不同。因而应记也不同。因而应记事件事件A A发生的发生的概率为概率为P(A|P(A
13、|).).若若A A发生了,则认为此时的发生了,则认为此时的 值应是值应是在在 中使中使P(A|P(A|)达到最大的那一个达到最大的那一个。这就是极大。这就是极大似然的思想似然的思想.2.最大似然估计最大似然估计 求最大似然估计量的步骤求最大似然估计量的步骤:最大似然估计法是由费舍尔引进的最大似然估计法是由费舍尔引进的.2.最大似然估计最大似然估计 最大似然估计法也适用于分布中含有多个最大似然估计法也适用于分布中含有多个未知参数的情况未知参数的情况.此时只需令此时只需令对数似然方程组对数似然方程组对数似对数似然方程然方程2.最大似然估计最大似然估计 解解X 的的似然函数为似然函数为例例2.最大
14、似然估计最大似然估计 2.最大似然估计最大似然估计 它们与相应的矩它们与相应的矩估计量相同估计量相同.2.最大似然估计最大似然估计 对于同一个参数于同一个参数,用不同方法求出的估用不同方法求出的估计量可能量可能 不同不同.那么那么,采用哪一个估计量为好呢采用哪一个估计量为好呢?用何种标准来用何种标准来 评判估计量的优劣评判估计量的优劣?下面下面,介介绍几个常用几个常用标准准.1 1、无偏性无偏性无偏性无偏性 定义定义定义定义 设设估估估估计计量量量量 存在期望存在期望存在期望存在期望,且且且且对对任意任意任意任意 有有有有3 3 3 3 3 3、估计量的评选标准、估计量的评选标准、估计量的评选
15、标准、估计量的评选标准、估计量的评选标准、估计量的评选标准 则称称 为 的的无偏估计量无偏估计量无偏估计量无偏估计量.称称为用用 来估来估计 的的系统误差系统误差系统误差系统误差.因此因此,无偏估计就是说无系统误差无偏估计就是说无系统误差无偏估计就是说无系统误差无偏估计就是说无系统误差.2 设设 都是参数都是参数的无偏估计,若的无偏估计,若则称则称 比比 有效有效 例例 如如,设设 总总 体体 X的的 方方 差差 存存 在在,X1,X2,Xn(n2)为总体为总体X的一个样本,的一个样本,易知易知 ,均为均为 的无偏估计的无偏估计,又有又有所以所以,当当n2时,最有效,时,最有效,较较X1有效有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计方法 数理统计 方法 PPT 课件
限制150内