多元统计分析第1章绪论ppt课件.ppt
《多元统计分析第1章绪论ppt课件.ppt》由会员分享,可在线阅读,更多相关《多元统计分析第1章绪论ppt课件.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用多元统计分析 Applied Multivariate Statistical A张立新曲阜师范大学经济学院1为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益第一章第一章 绪绪论论4一、课程介绍一、课程介绍4二、利用统计学进行科学研究的程序二、利用统计学进行科学研究的程序2为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益一、课程介绍:一、课程介绍:41 1、什么是多元统计分析?、什么是多元统计分析?42 2、多元统计分析的起源与发展、多元统计分析的起源与发
2、展43 3、多元统计分析的主要方法、多元统计分析的主要方法44 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?45 5、教与学相关问题、教与学相关问题46 6、软件介绍、软件介绍47 7、考核要求、考核要求48 8、参考教材、参考教材3为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益1 1、什么是多元统计分析?、什么是多元统计分析?4什么是统计学?什么是统计学?4关于如何收集、分析、解释和表达数据的科学。关于如何收集、分析、解释和表达数据的科学。4研究研究随机现象随机现象规律性的方法学。规律性的方法学。4自然界和人
3、类社会活动中,普遍存在自然界和人类社会活动中,普遍存在三类现象三类现象。4确定性现象确定性现象:在相同的条件下出现相同的结果,称为确定性:在相同的条件下出现相同的结果,称为确定性现象或必然现象。现象或必然现象。1+1=2。属于。属于经典数学经典数学研究的范畴。研究的范畴。4随机性现象随机性现象:在相同的条件下出现不同的结果,但结果是确:在相同的条件下出现不同的结果,但结果是确定的,称为随机性现象。如掷硬币正反面。定的,称为随机性现象。如掷硬币正反面。概率统计学概率统计学4模糊性现象模糊性现象:在相同的条件下出现不确定的结果,称为模糊:在相同的条件下出现不确定的结果,称为模糊性现象。如美人与丑人
4、。性现象。如美人与丑人。模糊数学模糊数学4为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益1 1、什么是多元统计分析?、什么是多元统计分析?4在实际问题中,很多随机现象涉及到的变量在实际问题中,很多随机现象涉及到的变量/指标不止一指标不止一个,而经常是多个变量,而且这些变量间又存在一定的个,而经常是多个变量,而且这些变量间又存在一定的联系,常常需要处理多个变量的观测数据。联系,常常需要处理多个变量的观测数据。4衡量一个地区的经济发展水平:衡量一个地区的经济发展水平:GDP,收入、消费、投资、收入、消费、投资、进出口进出口4天气
5、预报:降雨与前一天的气温、气压、湿度等天气预报:降雨与前一天的气温、气压、湿度等4医学诊断:血压、脉搏、白血球、体温等医学诊断:血压、脉搏、白血球、体温等4学习成绩;购买行为;企业竞争力;组织文化学习成绩;购买行为;企业竞争力;组织文化4如何分析:如何分析:分开分析分开分析(可能难以避免相关性,(可能难以避免相关性,丢失信息丢失信息););对多个变量(对多个变量(多维随机向量多维随机向量)同时进行分析同时进行分析研究,即多研究,即多元统计分析。元统计分析。5为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益1 1、什么是多元统计
6、分析?、什么是多元统计分析?4是统计学的重要分支,一元的推广和发展。是统计学的重要分支,一元的推广和发展。4又称:多变量统计分析,高级统计学,多元分析,又称:多变量统计分析,高级统计学,多元分析,高维数据统计分析。当假定总体分布是多元正态分高维数据统计分析。当假定总体分布是多元正态分布时,称为狭义多元分析,否则为广义多元分析布时,称为狭义多元分析,否则为广义多元分析4是研是研究多个随机变量之间的相互依赖关系以及内在究多个随机变量之间的相互依赖关系以及内在统计规律性的一门统计学科(理论和方法)统计规律性的一门统计学科(理论和方法)4多元统计分析的前提条件多元统计分析的前提条件多元统计对资料的分布
7、有一定的要求多元统计对资料的分布有一定的要求;需要有足够大的样本,一般认为,需要有足够大的样本,一般认为,样本量样本量m m是研是研究变量个数究变量个数P P的的1010倍左右。倍左右。6为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2 2、多元统计分析的起源与发展、多元统计分析的起源与发展4起源于起源于20世纪初,世纪初,1928年威沙特年威沙特(Wishart)发表论文多发表论文多元正态总体样本协方差阵的精确分布元正态总体样本协方差阵的精确分布,标志着多元分析标志着多元分析的开端的开端.4之后之后R.A.Fisher、H
8、.Hotelling、S.N.Roy、许宝禄等人作、许宝禄等人作了一系列奠基的工作,使多元统计分析在理论上得到迅了一系列奠基的工作,使多元统计分析在理论上得到迅速的发展速的发展,在许多领域中也有了实际应用在许多领域中也有了实际应用.但由于用统计方但由于用统计方法解决实际问题时需要的计算量很大,使其发展受到影法解决实际问题时需要的计算量很大,使其发展受到影响响,甚至停滞了相当长的时间。甚至停滞了相当长的时间。4二十世纪二十世纪50年代中期年代中期,随着电子计算机的出现和发展随着电子计算机的出现和发展,使得使得多元统计分析重现活力,在地质、气象、医学、社会学多元统计分析重现活力,在地质、气象、医学
9、、社会学等方面得到广泛的应用等方面得到广泛的应用.7为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益2 2、多元统计分析的起源与发展、多元统计分析的起源与发展41960年代通过应用和实践又完善和发展了理论年代通过应用和实践又完善和发展了理论,由于新理由于新理论、新方法的不断出现又促使它的应用范围更加扩大论、新方法的不断出现又促使它的应用范围更加扩大.4我国至我国至1970年代初期才关注到多元统计的方法;改革开年代初期才关注到多元统计的方法;改革开放后受到各个领域的极大关注放后受到各个领域的极大关注,近近30多年来我国在多元统多
10、年来我国在多元统计方法的理论研究和应用上也取得了很多显著成绩计方法的理论研究和应用上也取得了很多显著成绩,有些有些研究工作已达到国际水平研究工作已达到国际水平4但总的说来,我国的统计学与发达国家相比差距还较大。但总的说来,我国的统计学与发达国家相比差距还较大。首先,与我国经济和科技发展对统计学的需求相比,与首先,与我国经济和科技发展对统计学的需求相比,与一个十多亿人口的大国相比,我国统计学的队伍还很小;一个十多亿人口的大国相比,我国统计学的队伍还很小;其次,统计学的应用远没有达到应有的程度。有很多能其次,统计学的应用远没有达到应有的程度。有很多能够应用统计学的行业领域还不大了解统计学。够应用统
11、计学的行业领域还不大了解统计学。8为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益许宝禄许宝禄4在中国开创了概率论、数理统计的教学与研究工作。在内曼皮尔在中国开创了概率论、数理统计的教学与研究工作。在内曼皮尔逊理论、参数估计理论、多元分析、极限理论等方面取得卓越成就,逊理论、参数估计理论、多元分析、极限理论等方面取得卓越成就,是多元统计分析学科的开拓者之一。是多元统计分析学科的开拓者之一。4原籍浙江杭州,祖父曾任苏州知府,父亲曾任两浙盐运使。兄弟姊原籍浙江杭州,祖父曾任苏州知府,父亲曾任两浙盐运使。兄弟姊妹共妹共7人,他最幼。
12、其两兄均为专家,姊夫俞平伯是著名的文学家人,他最幼。其两兄均为专家,姊夫俞平伯是著名的文学家.4清华大学数学系(与华罗庚同学清华大学数学系(与华罗庚同学),),1933年毕业获理学士学位,经年毕业获理学士学位,经考试录取赴英留学,体检时发现体重太轻不合格,未能成行,休养考试录取赴英留学,体检时发现体重太轻不合格,未能成行,休养一年。一年。1934年任北京大学数学系助教。年任北京大学数学系助教。41936年考取伦敦大学统计系学习数理统计,年考取伦敦大学统计系学习数理统计,1938 年博士毕业后留校年博士毕业后留校认讲师。发表了多篇数理统计学科的重要文献认讲师。发表了多篇数理统计学科的重要文献。4
13、1940年回国在西南联合大学任教;年回国在西南联合大学任教;1946年到北卡罗莱纳大学任教年到北卡罗莱纳大学任教;1947年回国在北京大学任教年回国在北京大学任教 4熟练运用英语、德语、法语、俄语熟练运用英语、德语、法语、俄语9为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益3 3、多元统计分析的主要方法、多元统计分析的主要方法4多元描述统计分析多元描述统计分析4多元方差分析多元方差分析4多元回归分析多元回归分析4聚类分析聚类分析4判别分析判别分析4对应分析对应分析4主成份分析主成份分析4因子分析因子分析4典型相关分析典型相关
14、分析4结合分析结合分析4多维标度法多维标度法4路径分析路径分析4神经网络分析神经网络分析4结构方程模型结构方程模型10为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益4 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?4应用性、实用性,进行深层次经济社会分析和解决实际问题应用性、实用性,进行深层次经济社会分析和解决实际问题的一种有效工具的一种有效工具 4培养统计思维;是培养统计思维;是科学研究不可缺少的实用工具。科学研究不可缺少的实用工具。4在自然科学和社会科学等各个领域中得到广泛的应用:经济在自然科学和社会科学等各
15、个领域中得到广泛的应用:经济管理、工业、农业、医学、教育学、体育、生态学、地质学、管理、工业、农业、医学、教育学、体育、生态学、地质学、气象、水文、社会学、考古学、军事科学、文学等气象、水文、社会学、考古学、军事科学、文学等4物理学家物理学家爱因斯坦爱因斯坦学习和研究统计,将统计学思想应用于他学习和研究统计,将统计学思想应用于他的物理学和哲学研究中。的物理学和哲学研究中。4生物学家生物学家达尔文达尔文学习和研究统计,进化论方面的工作在本质学习和研究统计,进化论方面的工作在本质而言是属于生物统计学。而言是属于生物统计学。4护理学的奠基人护理学的奠基人 Nightingale学习和研究统计,学习和
16、研究统计,出版世界上第出版世界上第一部医院统计的专著一部医院统计的专著医院统计与医院规划医院统计与医院规划。11为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益多元统计分析的用途多元统计分析的用途研究目标研究目标/用途用途 内容内容 方法方法 数据或结构性化简数据或结构性化简(降维)(降维)尽可能简单地表示所研究的现象,尽可能简单地表示所研究的现象,但不损失很多有用的信息,并希望但不损失很多有用的信息,并希望这种表示能够很容易的解释。这种表示能够很容易的解释。多元回归分析、聚类分析、主多元回归分析、聚类分析、主成分分析、因子分
17、析、相应分成分分析、因子分析、相应分析、多维标度法、可视化分析析、多维标度法、可视化分析 分类和组合分类和组合 基于所测量到的一些特征,给出好基于所测量到的一些特征,给出好的分组方法,对相似的对象或变量的分组方法,对相似的对象或变量分组。分组。判别分析、聚类分析、主成分判别分析、聚类分析、主成分分析、可视化分析分析、可视化分析 变量之间的相关关变量之间的相关关系系 变量之间是否存在相关关系,相关变量之间是否存在相关关系,相关关系又是怎样体现。关系又是怎样体现。多元回归、典型相关、主成分多元回归、典型相关、主成分分析、因子分析、相应分析、分析、因子分析、相应分析、多维标度法、可视化分析多维标度法
18、、可视化分析 预测与决策预测与决策 通过统计模型或最优准则,对未来通过统计模型或最优准则,对未来进行预见或判断。进行预见或判断。多元回归、判别分析、聚类分多元回归、判别分析、聚类分析、可视化分析、神经网络、析、可视化分析、神经网络、时间序列,马尔科夫概型分析时间序列,马尔科夫概型分析假设的提出及检验假设的提出及检验检验由多元总体参数表示的某种统检验由多元总体参数表示的某种统计假设,能够证实某种假设条件的计假设,能够证实某种假设条件的合理性。合理性。多元总体参数估计、假设检验多元总体参数估计、假设检验 12为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保
19、障用人单位和职工的合法权益回归分析回归分析定性数据建模定性数据建模聚类分析聚类分析判别分析判别分析主成分分析主成分分析因子分析因子分析结构方程结构方程统计学方法的应用以及内容之间的逻辑关系 应用范围统计方法13为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益4 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?43.1 教育学教育学4 n个考生报考曲师大经济统计系个考生报考曲师大经济统计系.每个考生参加每个考生参加7 7门课门课(语文、数学、政治、外语、物理、化学、生物)的考语文、数学、政治、外语、物理、化学、生物)的
20、考试,各门课成绩记为试,各门课成绩记为Yj1,Yj2,Yj7 。又每个考生在高又每个考生在高中学习期间,中学习期间,m门主要课程成绩为门主要课程成绩为Xj1,Xj2,Xjm(j=1,2,=1,2,n)。经对这大量的资料作统计分析,我们能经对这大量的资料作统计分析,我们能够得出:够得出:(1)1)高考成绩和高中学习期间成绩的关系高考成绩和高中学习期间成绩的关系,即给出两组即给出两组变量变量线性组合间的关系线性组合间的关系,从而可由考生在高中期间的学从而可由考生在高中期间的学习成绩来习成绩来预报高考的综合成绩或某科目的成绩预报高考的综合成绩或某科目的成绩.14为了规范事业单位聘用关系,建立和完善适
21、应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益4 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?4(2)利用利用n个学生在高中学习期间个学生在高中学习期间m门主科的考试成绩,门主科的考试成绩,可可对学生进行分类对学生进行分类,如按文、理科成绩分类,按总成绩,如按文、理科成绩分类,按总成绩分类等。若准备分类等。若准备给优秀学生发奖给优秀学生发奖,那么一等奖、二等奖,那么一等奖、二等奖的比例应该是多少?应用多元统计分析的方法可以给出的比例应该是多少?应用多元统计分析的方法可以给出公平合理地确定。公平合理地确定。4评选三好生评选三好生,评选学习奖,评选各种
22、奖学金,推荐研究生,评选学习奖,评选各种奖学金,推荐研究生,甚至评选小偷!甚至评选小偷!4如何评选更合理?如何评选更合理?4可以使用主成份分析可以使用主成份分析15为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益4 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?4比如全班有比如全班有40名学生名学生,本科生四年中主要课程包括基础课本科生四年中主要课程包括基础课,专业基础课专业基础课,本专业的限选课本专业的限选课,设共有设共有12门课门课.从教务处可从教务处可以得到全班以得到全班40名学生这名学生这12门课的成绩门课
23、的成绩,组成的组成的40行行12列的列的数据阵数据阵X,即原始数据,即原始数据.4 (1)全班学生综合成绩的排序全班学生综合成绩的排序4 12门课的成绩可看成门课的成绩可看成12个变量个变量,这是这是多指标多指标(变量变量)系统的系统的排序评估问题排序评估问题。4如何更科学、更客观地将一个如何更科学、更客观地将一个多指标问题综合为单个综多指标问题综合为单个综合变量合变量的形式?的形式?主成分分析方法为样本排序或多指标系主成分分析方法为样本排序或多指标系统评估提供可行的方法。统评估提供可行的方法。16为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人
24、单位和职工的合法权益4 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?4用主成分分析方法从用主成分分析方法从12个相关的变量中可以综合得出几个相关的变量中可以综合得出几个互不相关的主成分它们是原始变量的线性组合。个互不相关的主成分它们是原始变量的线性组合。其中第一主成分综合原始变量的信息最多(一般在其中第一主成分综合原始变量的信息最多(一般在70以上),我们就用第一主成分(即单个综合指标)以上),我们就用第一主成分(即单个综合指标)F1替替代原来的代原来的12个变量;然后计算第一主成分的得分并进行个变量;然后计算第一主成分的得分并进行排序。比如排序。比如4F1是是12个变量的线性组
25、合,且系数都是正数,数值有大个变量的线性组合,且系数都是正数,数值有大有小。显然数值大的变量对综合指标(主成分)的贡献有小。显然数值大的变量对综合指标(主成分)的贡献大;数值小的变量对综合指标(主成分)的贡献小。大;数值小的变量对综合指标(主成分)的贡献小。4成绩简单的加总并不是最科学地代表成绩简单的加总并不是最科学地代表12门课综合成绩的门课综合成绩的指标指标17为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益4 4、为什么要学习多元统计分析?、为什么要学习多元统计分析?412个原始变量(课程)提供的信息各为多少?用什么量个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 绪论 ppt 课件
限制150内