经济学统计多元正态分布统计推断.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《经济学统计多元正态分布统计推断.pptx》由会员分享,可在线阅读,更多相关《经济学统计多元正态分布统计推断.pptx(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节引言第二节均值向量的检验第三节协差阵的检验第2页/共83页第一节 引言 在单一变量的统计分析中,已经给出了正态总体N(,2)的均值 和方差 2的各种检验。对于多变量的正态总体Np(,),各种实际问题同样要求对 和进行统计推断。例如,我们要考察全国各省、自治区和直辖市的社会经济发展状况,与全国平均水平相比较有无显著性差异等,就涉及到多元正态总体均值向量的检验问题等。本章类似单一变量统计分析中的各种均值和方差的检验,相应地给出多元统计分析中的各种均值向量和协差阵的检验。第3页/共83页其基本思想和步骤均可归纳为:第一,提出待检验的假设H0和H1;第二,给出检验的统计量及其服从的分布;第三,给
2、定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定 域中,以便对待判假设做出决策(拒绝或接受)。在检验的过程中,关键在于对不同的检验给出不同的统计量,而有关统计量的给出大多用似然比方法得到。由于多变量问题的复杂性,本章只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例。为了更好的说明检验过程中统计量的分布,本章还要介绍HotellingT2分布和Wilks分布的定义。第4页/共83页第二节 均值向量的检验 一单一变量检验的回顾及HotellingT2分布二一个正态总体均值向量的检验三两个正态总体均值向量的检验四多
3、个正态总体均值向量的检验第5页/共83页一、单一变量检验的回顾及HotellingT2分布为了对多元正态总体均值向量作检验,首先需要给出HotellingT2分布的定义。第6页/共83页第7页/共83页第8页/共83页第9页/共83页二、一个正态总体 均值向量的检验在经济生产、管理决策中的很多实际问题,通常要选取多个指标进行考察,根据历史数据,将项指标的历史平均水平记作,考虑新的项指标平均值是否与历史数据记载的平均值有明显差异?若有差异,进一步分析差异主要在哪些指标上,先看下面的实例:n例3.1测量20名健康女性排汗量x1、钠含量x2、钾含量x3得表3.1。问健康女性x1、x2、x3的均值是不
4、是4、50、10?第10页/共83页排汗量排汗量x1钠含量钠含量x2钾含量钾含量x33.73.748.548.59.39.35.75.765.165.18.08.03.83.847.247.210.910.93.23.253.253.212.012.03.13.155.555.59.79.74.64.636.136.17.97.92.42.424.824.814.014.07.27.233.133.17.67.66.76.747.447.48.58.55.45.454.154.111.311.3排汗量排汗量x1钠含量钠含量x2钾含量钾含量x33.93.936.936.912.712.74.54
5、.558.858.812.312.33.53.527.827.89.89.84.54.540.240.28.48.41.51.513.513.510.110.18.58.556.456.47.17.14.54.571.671.68.28.26.56.552.852.810.910.94.14.144.144.111.211.25.55.540.940.99.49.4第11页/共83页n例3.1的数学模型就是:服从要根据20个样品做复合检验:一般的,我们考虑p维正态分布均值等于常数的检验问题:为取自维正态总体 的一个样本,要检验:n其中0为已知p维向量。第12页/共83页第13页/共83页 第1
6、4页/共83页第15页/共83页 第16页/共83页n例3.1测量20名健康女性排汗量x1、钠含量x2、钾含量x3得表3.1。问健康女性x1、x2、x3的均值是不是4、50、10?解:建立用SAS,SPSS等软件都可算出所以否定原假设,即在0.10显著水平下拒绝第17页/共83页三、两个正态总体均值向量的检验例3.2为了研究日美两国在华企业对中国经营环境的评价是否存在差异,从两国在华企业对中国的政治、经济、法律、文化等环境打分,得表3-2。试分析日美两国在华企业对中国经营环境的评价是否存在差异?美国企业号美国企业号政治环境政治环境X1X1经济环境经济环境X2X2法律环境法律环境X3X3文化环境
7、文化环境X4X4美美1 16565353525256060美美2 27575505020205555美美3 36060454535356565美美4 47575404040407070美美5 57070303030305050美美6 65555404035356565美美7 76060454530306060美美8 86565404025256060美美9 96060505030307070美美10105555555535357575第20页/共83页例3.2为了研究日美两国在华企业对中国经营环境的评价是否存在差异,从两国在华企业对中国的政治、经济、法律、文化等环境打分,得表3-2。试分析日美
8、两国在华企业对中国经营环境的评价是否存在差异?日本企业号日本企业号政治环境政治环境Y1Y1经济环境经济环境Y2Y2法律环境法律环境Y3Y3文化环境文化环境Y4Y4日日1 15555555540406565日日2 25050606045457070日日3 34545454535357575日日4 45050505050507070日日5 55555505030307575日日6 66060404045456060日日7 76565555545457575日日8 85050656535358080日日9 94040454530306565日日10104545505045457070第21页/共83
9、页第23页/共83页 第24页/共83页第25页/共83页第26页/共83页 第27页/共83页第28页/共83页第29页/共83页第30页/共83页第31页/共83页例3.2的解:作假设 第32页/共83页所以日美两国在华企业对中国经营环境的评价存在显著差异。第33页/共83页四、多个正态总体均值向量的检验经常遇到这样的问题,有几种不同的原料,要考查它们对产品质量有没有显著的影响。某种新药与其它一些传统药物对病人进行分组实验来考查不同的药物与治愈率有否明显不同,这里我们考查的对象,原料,药物称为因素.当考查的因素只有一个时我们称为单因素问题。如果同时考虑两个或更多的因素问题,则称多因素方差分
10、析(这时计算起来很复杂)。第36页/共83页例:考查温度对某一化工厂产品得率的影响,选了五种不同温度,同一温度做了三次试验,测得结果如下:第37页/共83页n现在分析温度的变化对得率的影响。从平均得率来看,现在分析温度的变化对得率的影响。从平均得率来看,好象温度好象温度对得率是有一定的影响,对得率是有一定的影响,但详细观察一下数据就会发现问题,表现但详细观察一下数据就会发现问题,表现在:在:n(1)同一温度下得率并不完全一样,产生这种差异的原因是由于)同一温度下得率并不完全一样,产生这种差异的原因是由于试验过程中各偶然因素的干扰及测量误差所致,试验过程中各偶然因素的干扰及测量误差所致,这一类误
11、差称为试这一类误差称为试验误差,或随机误差。验误差,或随机误差。n(2)两种温度的率不同的试验中的倾向有所差别。如)两种温度的率不同的试验中的倾向有所差别。如65与与70相比,第一产相比,第一产65比比70好,而后二次好,而后二次70比比65好。产生好。产生这种矛盾现象,显然也可能是由于随机误差的干扰。由于随机误差这种矛盾现象,显然也可能是由于随机误差的干扰。由于随机误差的存在,对于不同温度下的得率的差异自然要提出疑问,这差异是的存在,对于不同温度下的得率的差异自然要提出疑问,这差异是随机误差造成的呢,还是温度不同的影响。随机误差造成的呢,还是温度不同的影响。由于温度的不同而引起由于温度的不同
12、而引起得率的差异我们称为组间误差或系统误差。得率的差异我们称为组间误差或系统误差。n上例全部上例全部15个数据参差不齐,它们的差异叫个数据参差不齐,它们的差异叫总变差总变差。产生总变差。产生总变差的原因有两个的原因有两个n1)随机误差随机误差 2)系统误差系统误差 第38页/共83页方差分析解决这类问题的思想是:l由数据的总变差中分离出随机误差和系统误差。l用系统误差和随机误差在一定条件下进行比较,如差异不大则认为系统误差对指标的影响不大,如系统误差比随机误差大的多,则说明条件的影响很大。以上面的例子说明即温度的变化对得率的影响很大,因此调整温度对产量的影响很大。l选择较好的工艺条件或确定进一
13、步的实验方案。这里介绍几个方差分析术语:因素:实验中的每一个条件,如上例的温度便是一个因素。水平:因素在实验中的等级称为水平,如上例中因素温度分为五个水平:6065,70,75,80。如果把因素记为A,则相应地把水平记为A1,A2,A3,A4,A5.样本:在同样条件下得到不同的实验结果每个结果,称为样本。第39页/共83页4.1单因素方差分析 设因素设因素A取了取了M个水平,每个水平重复了个水平,每个水平重复了N次实验得到次实验得到MN个样本,个样本,在水平在水平Ai下的第下的第j 次实验结果(样本)次实验结果(样本)Xij 可以分解为:可以分解为:这里这里ij N(0,1)。)。为了看出因素
14、各水平影响的大小,将为了看出因素各水平影响的大小,将Xij 再进行分解再进行分解,令令令令第40页/共83页显然显然ai之间有关系之间有关系ai 表示水平表示水平Ai 对实验结果产生的影响,它称做水平对实验结果产生的影响,它称做水平Ai 的效应。的效应。方差分析模型就是建立在以下假定之下:方差分析模型就是建立在以下假定之下:1)2)3)第41页/共83页(一)参数估计(一)参数估计即通过实验估计即通过实验估计和和ai,其估计量记为和,其估计量记为和和和ai。令。令则则这里这里第42页/共83页取取是是的一个无偏估计。的一个无偏估计。类似地可以推出类似地可以推出 的无偏估计是的无偏估计是此时方差
15、分析模型可以改写为:此时方差分析模型可以改写为:反映了误差反映了误差。由于。由于,均为已知故均为已知故可以通过样本求得。可以通过样本求得。第43页/共83页(二)统计检验(二)统计检验如果因素如果因素A对指标有显著的影响,效应对指标有显著的影响,效应ai不全部为零,反之不全部为零,反之则全为零。因此我们假设则全为零。因此我们假设或或基本思想是将总变差进行分离,即系统误差和随机误差。基本思想是将总变差进行分离,即系统误差和随机误差。设:设:Stotal 总变差,即总变差,即第44页/共83页注:交叉项在线性假设下为注:交叉项在线性假设下为0。这里统计量。这里统计量第45页/共83页对它们取期望值
16、,利用对它们取期望值,利用 有有 令令则有则有第46页/共83页如果如果H0:成立,则:成立,则,从而,从而与与之比应近于之比应近于1,即即统计量统计量F 值应近于值应近于1。如果因素。如果因素A 对指标有显著的影响对指标有显著的影响则则 将显著的大于将显著的大于1,这就是为什么可以用统计量,这就是为什么可以用统计量F来进行检验因素来进行检验因素A 是否显著的道理。是否显著的道理。由统计理论推知,在线性模型假设下,由统计理论推知,在线性模型假设下,服从服从(M-1)个自个自由度的由度的分布,分布,服从服从(NM)个自由的个自由的分布,且两者独立,从而分布,且两者独立,从而服从以(服从以(M-1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济学 统计 多元 正态分布 推断
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内