应用多元统计分析SAS作业第六章(共20页).docx
《应用多元统计分析SAS作业第六章(共20页).docx》由会员分享,可在线阅读,更多相关《应用多元统计分析SAS作业第六章(共20页).docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上6-10 今有6个铅弹头,用“中子活化”方法测得7种微量元素的含量数据(见表1)。(1) 试用多种系统聚类法对6个弹头进行分类;并比较分类结果;(2) 试用多种方法对7种微量元素进行分类。表1 微量元素含量数据 元素样品号Ag(银)(X1)Al(铝)Cu(铜)Ca(钙)Sb(锑)Bi(铋)Sn(锡)(X2)(X3)(X4)(X5)(X6)(X7)10.057985.5150347.1021.9108586174261.6920.084413.9700347.2019.71079472000244030.072171.153054.853.052386014459497
2、40.150101.7020307.5015.030122901461638055.744002.8540229.609.657809912661252060.213000.7058240.3013.910898028204135问题求解1对6个弹头进行分类对数据进行标准化变换,样品间距离定义为欧式距离,系统聚类的方法分别使用类平均法(AVE)、中间距离法(MID)、可变类平均法(FLE)和离差平方合法(WARD)。使用SAS软件CLUSTER过程对数据进行聚类分析(程序见附录1)。1.1类平均法图1 类平均聚类法相关矩阵特征值图图2 类平均聚类分析法聚类历史图由图2可知,NCL=1时半偏R2
3、最大且伪F统计量在NCL=2,5时和伪t方统计量在NCL=1,4时较大。因此,将6个弹头分为两类。SAS绘制的谱系聚类图如图3所示。图3 类平均聚类分析法谱系聚类图1.2中间距离法图4 中间距离聚类法相关矩阵特征值图图5 中间距离聚类法聚类历史图由图5可知,中间距离法与类平均法结果一致。因此,也将6个弹头分为两类。SAS绘制的谱系聚类图如图6所示。图6 中间距离聚类法谱系聚类图1.3可变类平均法图7可变类平均聚类法分析结果图图8 可变类平均聚类法聚类历史图由图8可知,可变类平均法()输出结果与前两种方法稍有不同,NCL=1时半偏R2最大且伪F统计量在NCL=2时次大,NCL=5时最大;而伪t方
4、统计量在NCL=1时最大。因此,分类结果与之前相同,将6个弹头分为两类。SAS绘制的谱系聚类图如图9所示。图9 可变类平均聚类法谱系聚类图1.4离差平方和法图10 离差平方和聚类法相关矩阵特征值图图11 离差平方和聚类法聚类历史由图11可知,离差平方和法输出结果与可变类平均法结果一致。SAS绘制的NCL=2时离差平方和法谱系聚类图和分类结果如下所示。图12 离差平方和聚类法谱系聚类图图13 离差平方和聚类法聚类结果图1.5 综合分析综上所述,四种分类方法得到的结果一致,都是将6个弹头分为两类。四种方法中,类平均法和中间距离法结果相近;可变类平均法和离差平方和法得到结果相近且更加准确(伪t方统计
5、量在NCL=1时最大)。2对7种元素进行分类同问题1,系统聚类的方法分别使用类平均法(AVE)、中间距离法(MID)、可变类平均法(FLE)和离差平方合法(WARD)。使用SAS软件CLUSTER过程对数据进行聚类分析(程序见附录2)。2.1 类平均法图14 7种元素类平均法聚类历史图由图14可知,NCL=1,2时半偏R2较大;伪F统计量在NCL=4,5,6时较大;而伪t方统计量在NCL=3,4时较大。因此,较合适的分法是将7种元素分为四类和五类。SAS绘制的谱系聚类图如下所示。图15 7种元素类平均法谱系聚类图2.2 中间距离法图16 7种元素中间距离法聚类历史图由图16可知,中间距离法聚类
6、结果中NCL=1,2时半偏R2较大;伪F统计量在NCL=4,5,6时较大;而伪t方统计量在NCL=3,4时较大。因此,与类平均法相同,较合适的分法是将7种元素分为四类和五类。SAS绘制的谱系聚类图如下所示。图17 7种元素中间距离法谱系聚类图2.3 可变类平均法图18 7种元素可变类平均法聚类历史图由图18可知,可变类平均法聚类结果与前两种方法结果相同,较合适的分法是将7种元素分为四类和五类。SAS绘制的谱系聚类图如下所示。图19 7种元素可变类平均法谱系聚类图2.4 离差平方和法图20 7种元素离差平方和法聚类历史图由图20可知,离差平方和法聚类结果与前三种方法结果也相同,较合适的分法是将7
7、种元素分为四类和五类。SAS绘制的NCL=4,5时的谱系聚类图和分类结果图如下所示。图21 7种元素离差平方和法谱系聚类图图22 分为四类时7种元素聚类结果图图23 分为五类时7种元素聚类结果图2.4综合分析综上所述,四种分类方法结果相同,合适的分法是将7种元素分为四类和五类。分为四类时,分类结果如下;分为五类时,分类结果如下。专心-专注-专业6-11 设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据见表2,试用几种系统聚类方法进行聚类分析,给出综合的分析结果,并与实际情况进行比较。表2 岩石化学成分的含量数据类型序号Cu
8、AgBi类型序号CuAgBi含矿12.580.900.95不含矿82.251.981.0622.901.231.0092.161.801.0633.551.151.00102.331.741.1042.351.150.79111.961.481.0453.541.850.79121.941.401.0062.702.231.30133.001.301.0072.701.700.48142.781.701.48问题求解1 多种系统聚类方法分析数据系统聚类的方法分别使用类平均法(AVE)、可变类平均法(FLE)和离差平方合法(WARD)。使用SAS软件CLUSTER过程对数据进行聚类分析(程序见附
9、录3)。1.1 类平均法图1 类平均法聚类历史由图1可知,类平均法聚类结果中NCL=1时半偏R2最大,NCL1时半偏R2明显减小且缓慢递减;伪F统计量在NCL=2时的值大于NCL=3时的值;而伪t方统计量在NCL=1时的值明显大于NCL=2时的值。因此,将14块岩石标本分为两组较为合适。SAS绘制的谱系聚类图及聚类结果图如下所示。图2 类平均法谱系聚类图图3 类平均法聚类结果图1.2 可变类平均法图4 可变类平均法聚类历史由图4可知,可变类平均法聚类结果同类平均法结果基本一致。因此,将14块岩石标本分为两组较为合适。SAS绘制的谱系聚类图如下所示,聚类结果与类平均法相同(见图3)。图5 可变类
10、平均法谱系聚类图1.3 离差平方和法图6 离差平方和法聚类历史由图6可知,离差平方和法聚类结果同前两种方法基本一致。因此,同样将14块岩石标本分为两组较为合适。SAS绘制的谱系聚类图如下所示,聚类结果见图8。图7 离差平方和法谱系聚类图图8 离差平方和法聚类结果2 综合分析综上所述,三种系统聚类法得到的聚类结果完全一致。分类结果如下。因此,可以发现样品6、13分类有误。样品13应当归为G1含矿类;而样品6应当归为G2不含矿。6-12 某城市的环保监测站于1982年在全市均匀地布置了16个监测点,每日三次定时抽取大气样品,测量大气中二氧化硫,氮氧化物和飘尘的含量。前后5天,每个取样点(监测点)对
11、每重污染元素实测15次,取15次实测值的平均作为该养点大气污染元素的含量数据见表3。试用几种系统聚类方法进行聚类分析,并给出综合的分析结果。表3 大气污染数据 污染元素样品号二氧化硫(X1)氮氧化物(X2)飘尘(X3)类别10.0450.0430.265220.0660.0390.264230.0940.0610.194240.0030.0030.102350.0480.0150.106360.2100.0660.263170.0860.0720.274280.1960.0720.211190.1870.0820.3011100.0530.0600.2092110.0200.0080.1123
12、120.0350.0150.1703130.2050.0680.2841140.0880.0580.2152150.1010.0520.181160.0450.0050.122问题求解1 系统聚类分析系统聚类的方法分别使用类平均法(AVE)和离差平方合法(WARD)。使用SAS软件CLUSTER过程对数据进行聚类分析(程序见附录4)。1.1 类平均法图1 类平均法聚类历史图由图1可知,类平均法聚类结果中NCL=1,2时半偏R 2分别为最大、次大;伪F统计量在NCL=3,4时分别为最大、次大(NCL6);而伪t方统计量在NCL=1,2时的值分别为最大、次大。因此,将16个样品划分为三组较为合适。
13、SAS绘制的谱系聚类图及聚类结果图如下所示。图2 类平均法谱系聚类图图3 类平均法聚类结果图1.2 离差平方和法图4 离差平方和法聚类历史图由图4可知,离差平方和法聚类结果与类平均法一致。NCL=1,2时半偏R 2分别为最大、次大;伪F统计量在NCL=3,4时分别为最大、次大(NCL6);而伪t方统计量在NCL=1,2时的值分别为最大、次大。因此,将16个样品划分为三组较为合适。SAS绘制的谱系聚类图及聚类结果图如下所示。图5 离差平方和法谱系聚类图图6 离差平方和法聚类结果图2 综合分析离差平方和法与平均法分类结果相同。原始的样品分组情况如表4所示。表4 样品原始分组情况样品号类别样品号类别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 SAS 作业 第六 20
限制150内