应用多元统计分析作业(共15页).docx
《应用多元统计分析作业(共15页).docx》由会员分享,可在线阅读,更多相关《应用多元统计分析作业(共15页).docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上 多元统计分析 实 验 报 告实验课程名称 多元统计分析 实验项目名称 多元统计理论的计算机实现 年 级 2013 专 业 应用统计学 学生姓名 侯杰 成 绩 理 学 院实验时间: 2015 年 05 月07 日学生所在学院:理学院 专业:应用统计学 班级:姓 名侯杰 学 号4实验组 实验时间 16.05.07指导教师李建军实验项目名称多元统计理论的计算机实现实验目的及要求: 目的:熟悉R(或SPSS)软件,掌握多元统计分析中多元正态分布均值向量和协差阵的检验,判别方法,聚类分析,主成分分析,因子分析,相应分析内容。 要求:程序要有注释,尽量体现多元统计分析多元正态分
2、布均值向量和协差阵的检验,判别方法,聚类分析,主成分分析,因子分析,相应分析内容内容的基本原理。实验硬件及软件平台:计算机、 R、 网络实验内容(包括实验具体内容、算法分析、源代码等等): 指导教师意见:签名: 年 月 日代码及运行结果分析1、 均值检验问题重述:某医生观察了16名正常人的24小时动态心电图,分析出早晨3小时各小时的低频心电频谱值(LF)、高频心电频谱值(HF),数据见压缩包,试分析这两个指标的各次重复测定均值向量是否有显著差异。代码如下:Tsq.test-function(data,alpha=0.05) data-as.matrix(read.table(ch37.csv,
3、header=TRUE,sep=,) #读取数据 xdat-data,2:4; xbar-apply(xdat,2,mean); #计算LF指标的均值 ydat-data,5:7; ybar-apply(ydat,2,mean); #计算HF指标数据 xcov-cov(xdat); #计算LF样本协差阵 ycov-cov(ydat); #计算HF样本协差阵 sinv-solve(xcov+ycov);#求逆矩阵 Tsq-(16+16-2)*t(sqrt(16*16/(16+16)*(xbar-ybar)%*%sinv%*%sqrt(16*16/(16+16)*(xbar-ybar); #计算T
4、统计量 Fstat-(16+16-2)-3+1)/(16+16-2)*3)*Tsq; #计算F统计量 pvalue0.05) #结果输出 cat(均值向量不存在差异) else cat(均值向量存在差异); 运行结果及分析:通过运行程序,我们可以得到如下结果: Tsq.test() p值= 1.e-14 均值向量存在差异即LF与HF这两个指标的各次重复测定均值向量存在显著差异。2、 判别分析问题重述:银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄()、受教育程度()、现在所从事工作的年数()、未变更住址的年数()、收入()、负债收入
5、比例()、信用卡债务()、其它债务()等来判断其信用情况。数据见压缩包。根据样本资料分别用距离判别法、Bayes判别法和Fisher判别法建立判别函数和判别规则。某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。 代码如下:#距离判别法discrim.dist-function(x) data-read.csv(ch49.csv,header=T,sep=,); #读取数据 G1-data1:5,; G2-data6:10,; u1-apply(G1,2,mean); #计算信用好的样本数据均值 u2-apply(G2,2,mean);
6、 #计算信用不好的样本数据均值 s1-cov(G1); s2-cov(G2); s-s1+s2; xbar-(u1+u2)/2; alpha-solve(s)%*%(u1-u2); #计算判别系数alpha w=0) #结果输出 cat(该客户属于信用好的一类,n) else cat(该客户属于信用坏的一类,n)#费希尔判别法fisher.test-function(x) data-read.csv(ch49.csv,header=T,sep=,); #读取数据 G1-data1:5,; G2-data6:10,; n1-nrow(G1); n2-nrow(G2); u1-apply(G1,2
7、,mean); #计算信用好的一组的数据均值 u2-apply(G2,2,mean); #计算信用不好的一组的样本数据均值 s1-cov(G1); s2-cov(G2); E-s1+s2; B-n1*n2*(u1-u2)%*%t(u1-u2)/(n1+n1); alpha-eigen(solve(E)%*%B); vector-alpha$vectors,1; #提取费希尔判别函数系数 d1-abs(t(vector)%*%x-t(vector)%*%u1); #计算样本到第一组的费希尔判别函数值 d2-abs(t(vector)%*%x-t(vector)%*%u2); #计算样本到第二组的
8、费希尔判别函数值 if(d1 x discrim.dist(x)该客户属于信用好的一类费希尔判别的运行结果: x fisher.test(x)该客户属于信用好的一类 从上面的运行结果可以看出该客户属于信用好的一类,即已履行还贷责任。3、 聚类分析问题重述:下表(数据见压缩包)是某年我国16个地区农民支出情况的抽样调查数据,每个地区调查了反映每人平均生活消费支出情况的六个经济指标。试使用系统聚类法和K均值法对这些地区进行聚类分析,并对结果进行分析比较。代码如下:#系统聚类法data-read.csv(ch58.csv,header=T,sep=,); #读取数据Cludata-data,2:7;
9、Dismatrix-dist(Cludata,method=euclidean); #计算样本间的欧几里得距离Clu1-hclust(d=Dismatrix,method=single); #最短距离法Clu2-hclust(d=Dismatrix,method=complete); #最长距离法Clu3-hclust(d=Dismatrix,method=centroid); #重心法Clu4-hclust(d=Dismatrix,method=ward.D); #离差平方和法#绘出四种方法情况下的谱系图和聚类情况opar-par(mfrow=c(2,2);plot(Clu1,labels=
10、data,1);re1-rect.hclust(Clu1,k=5,border=red);box();plot(Clu2,labels=data,1);re2-rect.hclust(Clu2,k=5,border=red);box();plot(Clu3,labels=data,1);re3-rect.hclust(Clu3,k=5,border=red);box();plot(Clu4,labels=data,1);re4-rect.hclust(Clu4,k=5,border=red);box();par(opar);#绘出直观的分类情形opar-par(mfrow=c(2,2),las
11、=2);cut1-cutree(Clu1,k=5);plot(cut1,pch=cut1,ylab=类别编号,xlab=省市,main=聚类的成员,axes=FALSE);axis(1,at=1:16,labels=data,1,cex.axis=0.6);axis(2,at=1:5,labels=1:5,cex.axis=0.6);box();cut2-cutree(Clu2,k=5);plot(cut2,pch=cut2,ylab=类别编号,xlab=省市,main=聚类的成员,axes=FALSE);axis(1,at=1:16,labels=data,1,cex.axis=0.6);a
12、xis(2,at=1:5,labels=1:5,cex.axis=0.6);box();cut3-cutree(Clu3,k=5);plot(cut3,pch=cut3,ylab=类别编号,xlab=省市,main=聚类的成员,axes=FALSE);axis(1,at=1:16,labels=data,1,cex.axis=0.6);axis(2,at=1:5,labels=1:5,cex.axis=0.6);box();cut4-cutree(Clu4,k=5);plot(cut4,pch=cut4,ylab=类别编号,xlab=省市,main=聚类的成员,axes=FALSE);axis
13、(1,at=1:16,labels=data,1,cex.axis=0.6);axis(2,at=1:5,labels=1:5,cex.axis=0.6);box();#K均值聚类法data-read.csv(ch58.csv,header=T,sep=,); #读取数据Cludata-data,2:7;Cluk-kmeans(x=Cludata,centers=5,nstart=5); #用K均值聚类分成五类par(mfrow=c(2,1),las=2);cluster-Cluk$cluster; #保存聚类解plot(cluster,pch=cluster,ylab=类别编号,xlab=省
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 作业 15
限制150内