多元正态分布优秀PPT.ppt
《多元正态分布优秀PPT.ppt》由会员分享,可在线阅读,更多相关《多元正态分布优秀PPT.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元正态分布第1页,本讲稿共59页图标说明图标说明表示:需要注意和温馨提醒的地方;表示:需要注意和温馨提醒的地方;表示:需要重点掌握的知识点;表示:需要重点掌握的知识点;表示:难点内容。表示:难点内容。第2页,本讲稿共59页第一章第一章 多元正态分布及其抽样分布多元正态分布及其抽样分布l1.1引言引言l1.2 多元指标统计数据及其图示多元指标统计数据及其图示1.3多元正态分布多元正态分布1.4统计距离和马氏距离统计距离和马氏距离1.5多元统计中常用的分布多元统计中常用的分布第3页,本讲稿共59页1.1引言l目的:明确多元统计分析及它能够解决目的:明确多元统计分析及它能够解决的主要问题的主要问题
2、第4页,本讲稿共59页一一、什么是多元统计分析什么是多元统计分析1.定义l多元统计分析:多元统计分析:研究多个随机变量之间相互依赖关系及内在统研究多个随机变量之间相互依赖关系及内在统计规律性的一门统计学科。计规律性的一门统计学科。l社会经济现象,受多种指标共同作用和影响的现社会经济现象,受多种指标共同作用和影响的现象几乎无处不在,利用多元统计分析方法可以对象几乎无处不在,利用多元统计分析方法可以对这样的复杂现象进行量化分析,从而达到对研究这样的复杂现象进行量化分析,从而达到对研究对象进行分类和简化。对象进行分类和简化。l举例举例第5页,本讲稿共59页2.主要内容:主要内容:多元正态总体的参数估
3、计和假设检验以多元正态总体的参数估计和假设检验以及常用的统计方法,这些统计方法包括:及常用的统计方法,这些统计方法包括:多元数据图表示法、聚类分析、判别分多元数据图表示法、聚类分析、判别分析、主成分分析、因子分析、对应分析、析、主成分分析、因子分析、对应分析、多重多元回归分析、典型相关分析、路多重多元回归分析、典型相关分析、路径分析等。径分析等。第6页,本讲稿共59页3、多元统计分析的产生和发展、多元统计分析的产生和发展l19281928年年WishartWishart论文论文 产生产生l2020世纪世纪3030年代年代理论框架形成理论框架形成l2020世纪世纪4040年代年代开始有限应用开始
4、有限应用l2020世纪世纪5050年代年代广泛应用广泛应用l2020世纪世纪6060年代年代新发展新发展第7页,本讲稿共59页二二、多元统计分析能解决那些类型实多元统计分析能解决那些类型实际问题际问题l经济学:如:对全国经济学:如:对全国30市自治区经济效益作综市自治区经济效益作综合评价,显然要选取的指标很多。如:固定资合评价,显然要选取的指标很多。如:固定资产投资完成额、职工工资总额、工业销售利税产投资完成额、职工工资总额、工业销售利税率等很多指标,对这些错综复杂的综合指标进率等很多指标,对这些错综复杂的综合指标进行分析解释时,可用主成分分析法和因子分析行分析解释时,可用主成分分析法和因子分
5、析法。法。l工业:如:某服装厂要生产一批新型服装,如工业:如:某服装厂要生产一批新型服装,如何确定服装的主要指标及分类的型号?何确定服装的主要指标及分类的型号?第8页,本讲稿共59页l教育学:如何对高考的考生成绩作因素教育学:如何对高考的考生成绩作因素分析?分析?l多元统计分析在农业、医学、体育科学、多元统计分析在农业、医学、体育科学、生态学、地质学、社会学、军事科学、生态学、地质学、社会学、军事科学、心理学等各个学科领域都有非常广泛的心理学等各个学科领域都有非常广泛的用途。用途。第9页,本讲稿共59页1、城镇居民消费水平通常用八项指标来描述,如人均粮食支出、人均城镇居民消费水平通常用八项指标
6、来描述,如人均粮食支出、人均副食支出、人均烟酒茶支出、人均衣着商品支出、人均日用品支出、副食支出、人均烟酒茶支出、人均衣着商品支出、人均日用品支出、人均燃料支出、人均非商品支出。这八项指标存在一定的线性关系。人均燃料支出、人均非商品支出。这八项指标存在一定的线性关系。为了研究城镇居民的消费结构,需要将相关强的指标归并到一起,为了研究城镇居民的消费结构,需要将相关强的指标归并到一起,这实际就是对指标进行聚类分析。这实际就是对指标进行聚类分析。2、在企业经济效益的评价中,涉及到的指标往往很多,如百元固定资、在企业经济效益的评价中,涉及到的指标往往很多,如百元固定资产原值实现产值、百元固定资产原值实
7、现利税、百元资金实现利税、产原值实现产值、百元固定资产原值实现利税、百元资金实现利税、百元工业总产值实现利税、百元销售收入实现利税、每吨标准煤实百元工业总产值实现利税、百元销售收入实现利税、每吨标准煤实现工业产值、每千瓦时电力实现工业产值、全员劳动生产率、百元现工业产值、每千瓦时电力实现工业产值、全员劳动生产率、百元流动资金实现产值。如何将这些具有错综复杂关系的指标综合成几流动资金实现产值。如何将这些具有错综复杂关系的指标综合成几个较少的因子,既有利于对问题进行分析和解释,又能便于抓住主个较少的因子,既有利于对问题进行分析和解释,又能便于抓住主要矛盾做出科学的评价。可用主成分分析和因子分析法。
8、要矛盾做出科学的评价。可用主成分分析和因子分析法。第10页,本讲稿共59页3、某一产品是用两种不同原料生产的,试问此两种原料生产的产品、某一产品是用两种不同原料生产的,试问此两种原料生产的产品寿命有无显著差异?又比如,若考察某商业行业今年和去年的经营寿命有无显著差异?又比如,若考察某商业行业今年和去年的经营状况,这时需要看这两年经营指标的平均水平是否有显著差异以及状况,这时需要看这两年经营指标的平均水平是否有显著差异以及经营指标之间的波动是否有显著差异。可用多元正态总体均值向量经营指标之间的波动是否有显著差异。可用多元正态总体均值向量和协差阵的假设检验。和协差阵的假设检验。4、按现行统计报表制
9、度,农村家庭纯收入是指农村常住居民家、按现行统计报表制度,农村家庭纯收入是指农村常住居民家庭总收入中扣除从事生产和非生产经营用支出、税款和上交庭总收入中扣除从事生产和非生产经营用支出、税款和上交承包集体任务金额以后剩余的、可直接用于进行生产的、非承包集体任务金额以后剩余的、可直接用于进行生产的、非生产性建设投资、生产性消费的那一部分收入。如果我们收生产性建设投资、生产性消费的那一部分收入。如果我们收集某年各个省、自治区、直辖市农民家庭人均纯收入的数据,集某年各个省、自治区、直辖市农民家庭人均纯收入的数据,可以用相应分析,揭示全国农民人均纯收入的特征以及各省、可以用相应分析,揭示全国农民人均纯收
10、入的特征以及各省、自治区、直辖市与各收入指标的关系。自治区、直辖市与各收入指标的关系。第11页,本讲稿共59页5、某医院已有、某医院已有100个分别患有胃炎、肝炎、冠心病、糖尿病等个分别患有胃炎、肝炎、冠心病、糖尿病等的病人资料,记录了他们每个人若干项症状指标数据。如的病人资料,记录了他们每个人若干项症状指标数据。如果对于一个新的病人,当也测得这若干项症状指标时,可果对于一个新的病人,当也测得这若干项症状指标时,可以利用判别分析方法判定他患的是哪种病。以利用判别分析方法判定他患的是哪种病。6、有、有100种酒,品尝家可以对每两种酒进行品尝对比,给出一种酒,品尝家可以对每两种酒进行品尝对比,给出
11、一种相近程度的得分(越相近得分越高,相差越远得分越低)种相近程度的得分(越相近得分越高,相差越远得分越低),希望用这些得分数据来了解这,希望用这些得分数据来了解这100种酒之间的结构关系。这样种酒之间的结构关系。这样的问题就可以用多维标度法来解决。的问题就可以用多维标度法来解决。7、在地质学中,常常要研究矿石中所含化学成分之间的关系。设在某、在地质学中,常常要研究矿石中所含化学成分之间的关系。设在某矿体中采集了矿体中采集了60个标本,对每个标本测得个标本,对每个标本测得20个化学成分的含量。个化学成分的含量。我们希望通过对这我们希望通过对这20个化学成分的分析,了解矿体的性质和矿个化学成分的分
12、析,了解矿体的性质和矿体形成的主要原因。体形成的主要原因。第12页,本讲稿共59页8、研究中国七星瓢虫在黄海、渤海的群聚与近期气象条件的关系。、研究中国七星瓢虫在黄海、渤海的群聚与近期气象条件的关系。对对1000个类似的鱼类样本,如何根据测量的特征如体重、身长、个类似的鱼类样本,如何根据测量的特征如体重、身长、鳍数、鳍长、头宽等,我们可以利用聚类分析方法将这类鱼分鳍数、鳍长、头宽等,我们可以利用聚类分析方法将这类鱼分成几个不同品种。成几个不同品种。9、考古学家对挖掘出来的人头盖骨的高、宽等特征来判断是男或女,、考古学家对挖掘出来的人头盖骨的高、宽等特征来判断是男或女,根据挖掘出的动物牙齿的有关
13、测试指标,判别它是属于哪一类动根据挖掘出的动物牙齿的有关测试指标,判别它是属于哪一类动物牙齿、是哪一个时代的。物牙齿、是哪一个时代的。10、在高考招生工作中,我们知道每个考生的基本情况,通过分析我们、在高考招生工作中,我们知道每个考生的基本情况,通过分析我们不仅可以了解到学生喜欢学习的科目,还可以进一步从考生每门课不仅可以了解到学生喜欢学习的科目,还可以进一步从考生每门课程的成绩,分析出学生的逻辑思维能力、形象思维能力和记忆力等程的成绩,分析出学生的逻辑思维能力、形象思维能力和记忆力等等对学习成绩的影响。等对学习成绩的影响。第13页,本讲稿共59页三、期望达到的目的三、期望达到的目的l学会分析
14、多元观测数据,对给定多元数学会分析多元观测数据,对给定多元数据能恰当选用本书所介绍的方法,结合据能恰当选用本书所介绍的方法,结合统计软件进行计算、分析。对所研究问统计软件进行计算、分析。对所研究问题作出科学评价与合理的推断。题作出科学评价与合理的推断。l清楚理解每种方法所要解决的问题,前清楚理解每种方法所要解决的问题,前提条件和局限性等。比较某些有联系方提条件和局限性等。比较某些有联系方法之间的相似处与差异。法之间的相似处与差异。第14页,本讲稿共59页四、多元统计分析的前提条件l1.多元统计分布对资料的分布有一定的要多元统计分布对资料的分布有一定的要求;求;l2.需要有足够大的样本。需要有足
15、够大的样本。为什么在统计学分析中需要有足够大的样本?为什么在统计学分析中需要有足够大的样本?为什么在统计学分析中需要有足够大的样本?为什么在统计学分析中需要有足够大的样本?第15页,本讲稿共59页例甲、乙两研究者分别例甲、乙两研究者分别例甲、乙两研究者分别例甲、乙两研究者分别 用某新药治疗用某新药治疗用某新药治疗用某新药治疗1010例和例和例和例和403403例老例老例老例老年性气管炎患者年性气管炎患者年性气管炎患者年性气管炎患者,其疗效如下表。其疗效如下表。其疗效如下表。其疗效如下表。甲 治疗结果 例 数%临床治愈 7 70 未治愈 3 30 合计 10 100乙 治疗结果 例 数%临床治愈
16、 83 20 未治愈 320 80 合计 403 100第16页,本讲稿共59页 临临床床上上感感兴兴趣趣的的问问题题是是新新药药治治疗疗老老年年性性气气管管炎炎治治愈愈率率是是多多少少,而而不不是是10和和403例的治愈频率例的治愈频率,那那么么应应用用20%,还还是是70%,以以估估计计新新药治疗老年性气管炎治愈率呢?药治疗老年性气管炎治愈率呢?第17页,本讲稿共59页l历历史史上上许许多多著著名名科科学学家家做做过过抛抛掷掷硬硬币币的试验的试验,抛掷硬币试验结果如表抛掷硬币试验结果如表 l 试验者 抛掷次数(n)正面次数(k)频率(k/n)l l De Morgan 2048 1061
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 正态分布 优秀 PPT
限制150内