应用多元统计分析全套ppt课件最全电子教案完整版教学教程整套全书课件ppt.pptx
《应用多元统计分析全套ppt课件最全电子教案完整版教学教程整套全书课件ppt.pptx》由会员分享,可在线阅读,更多相关《应用多元统计分析全套ppt课件最全电子教案完整版教学教程整套全书课件ppt.pptx(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第第1 1章章 绪绪 论论应用多元统计分析应用多元统计分析 - 1- 多元统计分析是研究多个随机变量之间相互依赖关系及内在多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律的一门统计学科统计规律的一门统计学科, ,其内容既包括一元统计理论方法的推其内容既包括一元统计理论方法的推广,也包括多个随机变量特有的一些理论和方法,后者有大量的广,也包括多个随机变量特有的一些理论和方法,后者有大量的实际应用背景。实际应用背景。 在实际问题中,涉及到的随机变量往往有多个,且这些变量在实际问题中,涉及到的随机变量往往有多个,且这些变量之间又存在一定的联系。例如之间又存在一定的联系。例如, , 一个
2、国家的经济状况需要用多个一个国家的经济状况需要用多个指标来刻画。人的体能需要用年龄、体重、肺活量等多项指标来指标来刻画。人的体能需要用年龄、体重、肺活量等多项指标来反映。反映。 例例1.1 1.1 考察学生的学考察学生的学习情况时,需要了解学生习情况时,需要了解学生在几个主要科目的学习成在几个主要科目的学习成绩,等等。表绩,等等。表1.11.1给出给出2020名名中学生中学生5 5门主课期末考试成门主课期末考试成绩。我们希望根据表绩。我们希望根据表1.11.1提提供的数据对这供的数据对这2020名学生的名学生的学习情况进行评价。学习情况进行评价。 如果用一元统计方法,需要对各门课程成绩分别分析
3、。这样处理,如果用一元统计方法,需要对各门课程成绩分别分析。这样处理,由于忽视了课程之间可能存在的相关性,因此会丢失许多信息,分析的由于忽视了课程之间可能存在的相关性,因此会丢失许多信息,分析的结果不能客观全面地反映学生的真实学习情况。结果不能客观全面地反映学生的真实学习情况。 如果采用多元分析方法,可以同时对多门课程的成绩进行综合分析,如果采用多元分析方法,可以同时对多门课程的成绩进行综合分析,给出比较客观和全面的分析结果。给出比较客观和全面的分析结果。 1. 1. 多元统计理论基础多元统计理论基础 包括多维随机向量,特别是多维正态随包括多维随机向量,特别是多维正态随机向量,以及由此定义的各
4、种统计量的分布及其性质,多元统计分机向量,以及由此定义的各种统计量的分布及其性质,多元统计分布理论。布理论。 2. 2. 多元统计推断多元统计推断 包括多元正态总体的参数估计和假设检验问包括多元正态总体的参数估计和假设检验问题,特别是均值向量和协方差阵的估计和假设检验等问题。题,特别是均值向量和协方差阵的估计和假设检验等问题。 3. 3. 变量之间的相互关系变量之间的相互关系 (1) (1) 多元回归分析:多元回归分析:分析变量之间的分析变量之间的因果关系因果关系, ,建立一个变量或几个变量与另一些变量的定量关系式建立一个变量或几个变量与另一些变量的定量关系式, ,并并用于预测或控制。用于预测
5、或控制。(2) (2) 典型相关分析:典型相关分析:分析两组变量之间的相关关分析两组变量之间的相关关系。系。多元统计分析概述多元统计分析概述 4. 4. 分类与判别问题分类与判别问题 (1) (1) 判别分析:判别分析:根据观测到的样品数根据观测到的样品数据据( (训练样本训练样本) ),按相似程度大小对所考察的样品或变量进行分,按相似程度大小对所考察的样品或变量进行分类类( (归类归类) ),常称其为,常称其为“”。(2) (2) 聚类分析:聚类分析:对观测到的数据,按相似程度大小对样品或变量进行分类。常对观测到的数据,按相似程度大小对样品或变量进行分类。常称其为称其为“”。 5. 5. 简
6、化数据结构简化数据结构 将高维数据降为低维数据将高维数据降为低维数据, ,使使数据结构得到有效简化数据结构得到有效简化, ,并在此基础上分析变量之间或样品之间并在此基础上分析变量之间或样品之间的复杂关系。这类问题的统计方法包括的复杂关系。这类问题的统计方法包括主成分分析主成分分析、因子分析因子分析以及对应分析,等等。以及对应分析,等等。多元统计分析概述多元统计分析概述 多元统计分析起源于多元统计分析起源于2020世纪初,世纪初,19281928年年WishartWishart发表的一篇论发表的一篇论文文多元正态总体样本协方差阵的精确分布多元正态总体样本协方差阵的精确分布被公认为是多元统被公认为
7、是多元统计的开端。之后计的开端。之后FisherFisher、HotellingHotelling、RoyRoy和许宝騄等著名统计学和许宝騄等著名统计学家的开创性工作,使多元统计分析在理论上得到了迅速发展,并家的开创性工作,使多元统计分析在理论上得到了迅速发展,并在许多领域得到实际应用。但是,由于使用多元统计方法解决实在许多领域得到实际应用。但是,由于使用多元统计方法解决实际问题时需要的计算量很大,使其发展受到一定限制。际问题时需要的计算量很大,使其发展受到一定限制。多元统计分析概述多元统计分析概述 到了到了2020世纪中后期,随着电子计算机的出现和发展,使得多元世纪中后期,随着电子计算机的出
8、现和发展,使得多元统计分析方法在自然科学和社会科学的许多领域得到广泛的应用,统计分析方法在自然科学和社会科学的许多领域得到广泛的应用,并由此带来其理论的进一步发展。另一方面,不断提出一些新理论、并由此带来其理论的进一步发展。另一方面,不断提出一些新理论、方法和技术,又促使其应用范围进一步扩大。方法和技术,又促使其应用范围进一步扩大。2121世纪初,随着现代世纪初,随着现代信息技术的高速发展和广泛应用,人类进入了大数据时代。信息技术的高速发展和广泛应用,人类进入了大数据时代。多元统计分析概述多元统计分析概述 海量数据和超高维数据的大量涌现,对统计理论、方法和技术海量数据和超高维数据的大量涌现,对
9、统计理论、方法和技术的发展提出新的挑战。近年来,我国学者在多元统计分析的理论研的发展提出新的挑战。近年来,我国学者在多元统计分析的理论研究和应用方面取得了显著成绩,有不少研究工作已达到国际领先水究和应用方面取得了显著成绩,有不少研究工作已达到国际领先水平,并形成许多高水平的科研团队,活跃在各个领域。平,并形成许多高水平的科研团队,活跃在各个领域。多元统计分析概述多元统计分析概述多元数据的直观表示多元数据的直观表示 多元数据可以通过图形直观表示,以便对所研究的数据的直多元数据可以通过图形直观表示,以便对所研究的数据的直观了解。观了解。另一方面,对具体问题的多元分析结果或过程也可以通另一方面,对具
10、体问题的多元分析结果或过程也可以通过图形来展示,以便人们对分析结果或计算过程有直观的理解。过图形来展示,以便人们对分析结果或计算过程有直观的理解。本章主要介绍多元数据的几个常用直观表示方法,本章主要介绍多元数据的几个常用直观表示方法,对于多元分析对于多元分析的结果或过程的直观表示方法,将在本书后面几章介绍的各种多的结果或过程的直观表示方法,将在本书后面几章介绍的各种多元分析方法中介绍。元分析方法中介绍。 包括包括轮廓图、散布矩阵图、均值轮廓图、散布矩阵图、均值条条形形图、箱图、箱线线图、星相图、图、星相图、脸谱图、调和曲线图等图形脸谱图、调和曲线图等图形。 要求学生了解多元数据的直观表示方法及
11、多变量图形的要求学生了解多元数据的直观表示方法及多变量图形的一些特点,并掌握一些复杂的多元数据的图示技术。一些特点,并掌握一些复杂的多元数据的图示技术。 图形有助于对所研究数据的直观了解,如果能把一些多元图形有助于对所研究数据的直观了解,如果能把一些多元数据直接绘图显示,便可从图形一目了然看出多元变量之间数据直接绘图显示,便可从图形一目了然看出多元变量之间的关系。的关系。 例例1.21.2 为了研究全国为了研究全国3131个省、市、自治区个省、市、自治区20201818年城镇居民年城镇居民生活消费的分布规律,根据调查资料做区域消费类型划分生活消费的分布规律,根据调查资料做区域消费类型划分。食品
12、食品x1x1:人均食品支出:人均食品支出( (元元/ /人人) ) 衣着衣着x2x2:人均衣着商品支出:人均衣着商品支出( (元元/ /人人) ) 居住居住x3x3:人均居住支出:人均居住支出( (元元/ /人人) ) 生活生活x4x4:人均家庭设备用品及服务支出:人均家庭设备用品及服务支出( (元元/ /人人) ) 交通交通x5x5:人均交通和通讯支出:人均交通和通讯支出( (元元/ /人人) )教育教育x6x6:人均娱乐教育文化服务支出:人均娱乐教育文化服务支出( (元元/ /人人) )医疗医疗x7x7:人均医疗保健支出:人均医疗保健支出( (元元/ /人人) ) 其他其他x8x8:人均杂
13、项商品和服务支出:人均杂项商品和服务支出( (元元/ /人人) )地区x1x2x3x4x5x6x7x8北京8064.92175.514110.32371.94767.43999.43274.51078.6天津8647.51990.06406.31818.44280.93186.62676.9896.3河北4271.31257.44050.41138.72355.41734.51540.5373.8山西3688.21261.03228.5855.61845.21940.01635.1356.4内蒙古5324.31751.23680.01204.63074.32245.41847.5537.9辽宁
14、5727.81628.14169.51259.42968.22708.02257.1680.2吉林4417.41397.03294.8899.42479.72193.42012.0506.7黑龙江4573.21405.43176.3866.42196.62030.32235.3490.4上海10728.22036.814208.52095.54881.25049.43070.21281.5江苏6529.81541.06731.21493.33522.82582.62016.4590.4浙江8198.31813.57721.21652.44302.03031.32059.4692.6安徽5414
15、.71137.43941.91041.22082.11810.41224.0392.8福建7572.91212.16130.01223.12923.32194.01234.8505.8江西4809.01074.13795.21047.71872.11813.01000.0381.0山东5030.91391.83928.51394.32834.32174.41627.6398.1河南3959.81172.83512.01054.41838.01769.11541.5321.0湖北5491.31316.24310.61253.22584.12187.51907.9487.0湖南5260.01215
16、.53976.11190.22322.92786.21705.5351.5广东8480.81135.36643.31440.83423.92750.91520.8658.2广西4545.7616.73268.5898.22150.11798.91364.6291.9海南6552.2655.93744.0826.61919.02185.51236.1409.2重庆6220.81454.53498.81338.92545.02087.81660.0442.8四川5937.91173.83368.01182.22398.81599.71568.6434.5贵州3792.9934.72760.7878
17、.12408.01660.01083.5280.1云南3983.4789.13081.1859.92212.81772.71267.7283.2西藏4330.51285.22102.6622.31847.7609.3460.1262.6陕西4292.51141.13388.21200.82005.82008.81749.4373.2甘肃4253.31111.53095.0896.91640.71710.31573.9342.4青海4671.61350.62990.0932.02671.41655.61842.0444.0宁夏4234.11388.23014.31067.12724.42139.
18、51727.1420.4新疆4691.61456.02894.31082.82274.41762.51592.6434.9X=read.table(biao1.2.txt,header=T) pairs(X) #pairs(X) #画散布矩阵画散布矩阵图图从该图可以看出从该图可以看出, ,食品支出与生活用品及服务食品支出与生活用品及服务支出、教育及文化娱乐支出之间存在显著线支出、教育及文化娱乐支出之间存在显著线性相关关系,而教育及文化娱乐支出又与居性相关关系,而教育及文化娱乐支出又与居住支出、其他支出之间存在显著线性相关关住支出、其他支出之间存在显著线性相关关系,等等。系,等等。食品10002
19、00010001000400040010004000900010002000衣着居住2000100001000生活交通2000400010004000教育医疗500250040009000400100020001000020004000500 2000其他# #按行做均值条形图按行做均值条形图barplot(apply(X,1,mean) 北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆010002000300040005000# #按行做均值条形图按行做均值条形图barplot(apply(X,2,mean) 食
20、品衣着居住生活交通教育医疗其他010002000300040005000boxplot(X) #boxplot(X) #按列做按列做垂直垂直箱线图箱线图boxplot(X,horizontal=T)#boxplot(X,horizontal=T)#水平水平箱线图箱线图从该图可以看出,食品消费支出远高从该图可以看出,食品消费支出远高于其它指标的支出。于其它指标的支出。食品衣着居住生活交通教育医疗其他02000400060008000100001200014000# #简单星相图简单星相图stars(X) stars(X) 北 京天 津河 北山 西内 蒙 古辽 宁吉 林黑 龙 江上 海江 苏浙 江
21、安 徽福 建江 西山 东河 南湖 北湖 南广 东广 西海 南重 庆四 川贵 州云 南西 藏陕 西甘 肃青 海宁 夏新 疆食 品衣 着居 住生 活交 通教 育医 疗其 他# #带图例度彩色星相图带图例度彩色星相图stars(Xstars(X, ,key.loc=c(key.loc=c(1717, ,7 7),), draw.segments=T) draw.segments=T) 北 京天 津河 北山 西内 蒙 古辽 宁吉 林黑 龙 江上 海江 苏浙 江安 徽福 建江 西山 东河 南湖 北湖 南广 东广 西海 南重 庆四 川贵 州云 南西 藏陕 西甘 肃青 海宁 夏新 疆居 住生 活交 通教 育
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 全套 ppt 课件 电子 教案 完整版 教学 教程 整套 全书
限制150内