哈尔滨工业大学-多元统计分析-数学建模必备-葛虹教学内容.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《哈尔滨工业大学-多元统计分析-数学建模必备-葛虹教学内容.ppt》由会员分享,可在线阅读,更多相关《哈尔滨工业大学-多元统计分析-数学建模必备-葛虹教学内容.ppt(120页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多多 元元 统统 计计 分分 析析哈尔滨工业大学数学系 葛 虹第一页,共120页。多元(du yun)统计分析内容简介n第一章 多元统计(tngj)的基本概念n第二章 主成分分析n第三章 聚类分析n第四章 多元正态分布n第五章 多元回归分析第二页,共120页。第一章 多元(du yun)统计的基本概念n 第一节 随机向量n 及其数字(shz)特征第三页,共120页。随机(su j)向量极其分布P维随机(su j)向量:联合分布函数:联合密度函数:第四页,共120页。特征函数一元随机变量(su j bin lin):二元随机向量 :P元随机向量例1第五页,共120页。条件(tiojin)分布与独
2、立性两随机向量间的条件(tiojin)分布 的D.F:;d.f ;c.f 的D.F:;d.f ;c.f 的D.F:;d.f ;c.f 给定 ,的条件(tiojin)密度函数:第六页,共120页。两随机向量独立的充分必要条件(b yo tio jin)与 相互独立第七页,共120页。随机(su j)向量的数字特征随机向量的数学(shxu)期望随机向量的方差阵 第八页,共120页。两随机(su j)向量间的协方差阵随机(su j)向量的相关系数阵第九页,共120页。随机向量的数字(shz)特征的计算性质 对称(duchn),非负定;第十页,共120页。例2求:第十一页,共120页。第二节 随机向量
3、(xingling)的样本 及其数字特征P维随机(su j)样本 P维随机(su j)向量 的一个容量为n的样本:的样本(yngbn)的样本 的样本第十二页,共120页。样本均值第十三页,共120页。样本(yngbn)离差阵与样本(yngbn)方差阵样本(yngbn)离差阵样本(yngbn)方差阵第十四页,共120页。样本(yngbn)相关系数阵与 的样本(yngbn)相关系数第十五页,共120页。作 业 一1 令 (1)求c;(2)求 ;(3)证明:;(4)是否相互(xingh)独立?第十六页,共120页。2 设三个随机变量(su j bin lin)x,y,z的联合密度函数为:(1)求常数
4、k;(2)x,y,z是否相互独立?(3)试求在给定y=1/2,z=1的条件下x的分布。第十七页,共120页。3 设随机(su j)向量 的协方差阵为:(1)求相关系数阵;(2)令 ,求 的协方差阵。第十八页,共120页。实验报告一实验报告一选择一组多维有意义的数据编写SAS数据文件利用SAS作单变量的置方图,计算基本统计特征(均值、方差或标准差)并由此分析单变量的基本分布情况利用SAS计算多维随机变量的样本(yngbn)协方差阵、样本(yngbn)相关系数阵并由此分析变量之间的相关性要求打印 SAS数据文件 置方图 计算结果 分析结果第十九页,共120页。第二章 主成分(chng fn)分析第
5、一节 为什么要进行主成分(chng fn)分析第二十页,共120页。消除自变量(binling)间的相关性与多维变量(binling)降维 满足(1)(2)第二十一页,共120页。第二节 数学模型与理论(lln)主成分前提条件:目标:寻找正交矩阵(j zhn)使 (1)(2)且结论:是 的特征值;的行向量分别为相应的特征向量;第二十二页,共120页。理论主成分的计算(j sun)过程求非负定阵 的特征值:求 所对应的单位(dnwi)特征向量:写出主成分:第二十三页,共120页。第三节 样本主成分(chng fn)的计算过程首先将原始数据标准化得到标准化数据(消除(xioch)量纲影响);求标准
6、化数据的样本协方差阵 (该矩阵是原样本数据的样本相关系数阵);求 的特征值 和所对应的单位特征向量:第二十四页,共120页。写出p个主成分(chng fn)的表达式:是样本均值,是样本标准差第二十五页,共120页。选择(xunz)主成分的方法贡献率:第i 个主成分的贡献率为累积(lij)贡献率:前m 个主成分的累积(lij)贡献率为选择法则:保留m 个主成分第二十六页,共120页。第四节 主成分(chng fn)的应用利用第一主成分进行(jnxng)综合评价 若第一主成分满足:(1)其中(2)第一主成分的贡献率 ,则 可以作为一个综合评价指标第二十七页,共120页。利用第一、二个主成分(chn
7、g fn)进行分类若第一、二个主成分(chng fn)的累积贡献率 ,则由第一、二个主成分(chng fn)在平面上的散点图,可以对样品进行分类。第二十八页,共120页。实验(shyn)二 主成分分析选取一组有意义的P维数据(shj)利用SAS的“交互数据(shj)分析”对P维变量进行主成分分析,并选择主成分进行排序与分类。要求说明:1)主成分选择原理 2)所选择主成分的表达式 3)最后的排序与分类结果。第二十九页,共120页。第三章 聚类分析第一节 p维空间中的距离(jl)欧氏距离(jl)马氏距离(jl)B模距离(jl)明氏距离(jl)一点到总体(zngt)的马氏距离第三十页,共120页。第
8、二节 聚类方法(fngf)简介问题:将n个p维样本分成(fn chn)m个类系统聚类法与聚类步骤流程图动态聚类法与聚类步骤流程图第三十一页,共120页。系统(xtng)聚类法与聚类步骤流程图初始(ch sh)分类:若 与 距离(jl)最小,合并为一类no输出分类结果第三十二页,共120页。动态(dngti)聚类法与聚类步骤流程图寻找(xnzho)m个凝聚点:若 则 ;得计算(j sun)各类的重心:若 则 ;得计算各类的重心:重心改变输出分类结果yesno第三十三页,共120页。第三节 五种系统(xtng)聚类(cluster)方法最短距离法(method=single)最长距离法(metho
9、d=complete)重心(zhngxn)法(method=centroid)第三十四页,共120页。类平均法(method=average)离差平方和法(method=ward)第三十五页,共120页。可以(ky)证明:半偏第三十六页,共120页。第四节 系统(xtng)聚类在SAS中的实现proc cluster data=city method=ward outtree=DD;Var x1-x8;id region;proc tree data=DD horizontal graphics;id region;title tree of cluster;run;第三十七页,共120页。实
10、验(shyn)三 聚类分析选取一组有实际意义的数据利用SAS的五种系统聚类方法将n个样本进行分类(fn li),要求:1)说明每一种方法的分类(fn li)结果2)利用主成分分析说明哪一种分类(fn li)结果更合理第三十八页,共120页。第四章 多元(du yun)正态分布第一节 多元正态分布(fnb)第二节 多元正态分布(fnb)的函数-卡方分布(fnb)第三节 多元正态分布(fnb)的参数估计第四节 WISHART分布(fnb)第五节 正态分布(fnb)均值向量的假设检验第三十九页,共120页。一元(y yun)正态分布一元(y yun)正态分布密 度 函 数(hnsh)形式特征函数形式
11、一般正态与标准正态之间的关系多个正态变量的线性组合仍为正态变量第四十页,共120页。第一节 多元(du yun)正态分布定义1 q维标准正态分布 设 独立同分布于 ,则称随机向量(xingling)服从q 维正态分布,记 密度函数:特征函数:第四十一页,共120页。定义2 p 维一般正态分布 设 ,B为 实数矩阵,为 维实数向量,则 是 维随机(su j)正态分布,记为:其中 为非负定阵。第四十二页,共120页。定理(dngl)1 若 服从 ,则 (1),(2)第四十三页,共120页。定理(dngl)2 若 服从 (1)令 ,为 ,为 则 服从 (利用特征函数证明)(2)服从第四十四页,共12
12、0页。定理3 若 服从 ,(1)服从 ,服从 ;(2)与 相互独立(dl)(简化成 服从 ,服从 的情形,通过特征函数证明)推论:若 不服从正态分布,则 不服从正态分用于验证(ynzhng)第四十五页,共120页。定理4 服从 为一元正态随机变量定理5 若 为正定(zhn dn)矩阵,则 服从 具有密度函数(证明要点:,)用于验证(ynzhng)第四十六页,共120页。多元(du yun)正态分布的四个等价定义n 其中n 为一元正态随机变量n 特征函数n 密度(md)函数多用于验证(ynzhng)多用于证明第四十七页,共120页。第二节 多元(du yun)正态分布的函数-卡方分布定义1 中心
13、 分布与矩阵表达(biod)设 独立同分布于 ,则若记 ,且 则第四十八页,共120页。定义2 非中心 分布(fnb)与矩阵表达设 ,且 ,则 服从自由度为p,非中心参数为的卡方分布(fnb),并记为:第四十九页,共120页。定理(dngl)1 若 服从 ,且 正定,则 (1)服从 ,其中 (2)服从用于构造(guzo)检验统计量并检验异常点第五十页,共120页。定理2 设 服从(fcng),服从(fcng)且相互独立,则 服从(fcng)定理3 设 服从(fcng),为 阶实对称阵且 ,则 服从(fcng)其中(对称幂等阵的性质:1.I-A是对称幂等的;2.A的特征值是1或0;3.R(A)=
14、tr(A)第五十一页,共120页。证明要点(yodin):若A是对称幂等的,则存在正交矩阵Q 使 若 服从 A是非负定阵 存在一个矩阵 ,R(B)=r,且第五十二页,共120页。定理4 (Cochran定理)已知 (1)服从 (2)为 阶实对称(duchn)阵;且 (3)则 服从 与 服从 且相互独立 (要点:)第五十三页,共120页。定理(dngl)5 设(1)(2),(3)非负定则 且与 相互独立第五十四页,共120页。作业(zuy)二(1)若 服从(fcng)(1)求 的分布,其中:(2)X中有无相互独立的分量?(3)的分布是什么?若 服从(fcng),A与B分别是 和 阶实矩阵,证明:
15、AX与BX相互独立 第五十五页,共120页。一元正态样本(yngbn)及其性质设 是来自(li z)的一个样本样本均值是总体均值的无偏估计,即 ;样本方差是总体方差的无偏估计,即 ;第五十六页,共120页。与 分别是 和 的极大(j d)似然估计其中 与 相互独立第五十七页,共120页。第三节 多元(du yun)正态分布的参数估计定理1 若 为正定矩阵(j zhn)且 ,则 为 的极大似然估计,即 定理2 当 时,的极大似然估计是第五十八页,共120页。定理3 与 分别是 和 的无偏估计,即定理4 若 和 分别是正态总体(zngt)的样本均值和样本离差阵,则 (1)与 相互独立第五十九页,共
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈尔滨工业大学 多元 统计分析 数学 建模 必备 教学内容
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内