应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答).pptx
《应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答).pptx》由会员分享,可在线阅读,更多相关《应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答).pptx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 第六章第六章 聚类分析聚类分析 6-1 证明下列结论证明下列结论:(1)(1)两个距离的和所组成的函数仍是距离两个距离的和所组成的函数仍是距离;(2)(2)一个正常数乘上一个距离所组成的函数一个正常数乘上一个距离所组成的函数仍是距离仍是距离;(3)(3)设设d为一个距离为一个距离,c0 0为常数为常数,则则仍是一个距离仍是一个距离;(4)(4)两个距离的乘积所组成的函数不一定是两个距离的乘积所组成的函数不一定是距离距离;第1页/共38页2第六章第六章 聚类分析聚类分析(2)设设d是是距离距离,a 0为为正常数正常数.令令d*=ad,显然有显然有第2页/共38页3第六章第六章 聚类分析聚类分
2、析故故d*=ad是一个距离是一个距离.(3)设设d为一个距离为一个距离,c0 0为常数为常数,显然有显然有第3页/共38页4第六章第六章 聚类分析聚类分析故故d*是一个距离是一个距离.第4页/共38页5第六章第六章 聚类分析聚类分析第5页/共38页6第六章第六章 聚类分析聚类分析6-2 试证明二值变量的相关系数为试证明二值变量的相关系数为(6.2.2)式,夹角余式,夹角余弦为弦为(6.2.3)式式.证明:证明:设变量设变量Xi和和Xj是二值变量,它们的是二值变量,它们的n次观测值记次观测值记为为xti,xtj(t=1,n).xti,xtj 的值或为的值或为0,或为,或为1.由二值变由二值变量的
3、列联表(表量的列联表(表6.5)可知:变量)可知:变量Xi取值取值1的观测次数的观测次数为为a+b,取值取值0的观测次数为的观测次数为c+d;变量变量Xi和和Xj取值均为取值均为1的的观测次数为观测次数为a,取值均为取值均为0的观测次数为的观测次数为d 等等。利用两等等。利用两定量变量相关系数的公式:定量变量相关系数的公式:第6页/共38页7第六章第六章 聚类分析聚类分析第7页/共38页8第六章第六章 聚类分析聚类分析故二值变量的相关系数为:故二值变量的相关系数为:(6.2.2)第8页/共38页9第六章第六章 聚类分析聚类分析利用两定量变量夹角余弦的公式:利用两定量变量夹角余弦的公式:其中其中
4、故有故有第9页/共38页10第六章第六章 聚类分析聚类分析6-3 下面是5个样品两两间的距离阵试用最长距离法、类平均法作系统聚类,并画出谱系试用最长距离法、类平均法作系统聚类,并画出谱系聚类图聚类图.解解:用最长距离法用最长距离法:合并合并X(1),X(4)=CL4,并类距离并类距离 D1=1.第10页/共38页11第六章第六章 聚类分析聚类分析 合并合并X(2),X(5)=CL3,并类距离并类距离 D2=3.合并合并CL3,CL4=CL2,并类距离并类距离 D3=8.所有样品合并为一类所有样品合并为一类CL1,并类距离并类距离 D4=10.第11页/共38页12第六章第六章 聚类分析聚类分析
5、最长距离法的谱系聚类图如下最长距离法的谱系聚类图如下:第12页/共38页13第六章第六章 聚类分析聚类分析 合并合并X(1),X(4)=CL4,并类距离并类距离 D1=1.用类平均法用类平均法:第13页/共38页14第六章第六章 聚类分析聚类分析 合并合并X(2),X(5)=CL3,并类距离并类距离 D2=3.合并合并CL3,CL4=CL2,并类距离并类距离 D3=(165/4)1/2.所有样品合并为一类所有样品合并为一类CL1,并类距离并类距离 D4=(121/2)1/2.第14页/共38页15第六章第六章 聚类分析聚类分析类平均法的谱系聚类图如下类平均法的谱系聚类图如下:第15页/共38页
6、16第六章第六章 聚类分析聚类分析6-4 利用距离平方的递推公式利用距离平方的递推公式来证明当来证明当0,p0,q0,p+q+1时时,系统聚类中的类系统聚类中的类平均法、可变类平均法、可变法、平均法、可变类平均法、可变法、Ward法的单调性法的单调性.证明:证明:设第设第L次合并次合并Gp和和Gq为新类为新类Gr后后,并类距离并类距离DL Dpq,且必有且必有Dpq2Dij2.新类新类Gr与其它类与其它类Gk的距离平方的递的距离平方的递推公式推公式,当当0,p0,q0,p+q+1 时时 这表明新的距离矩阵中类间的距离均这表明新的距离矩阵中类间的距离均 Dpq DL,故有故有DL1 DL,即相应
7、的聚类法有单调性,即相应的聚类法有单调性.第16页/共38页17第六章第六章 聚类分析聚类分析 对于类平均法,因对于类平均法,因故类平均法具有单调性。故类平均法具有单调性。对于可变类平均法,因对于可变类平均法,因故可变类平均法具有单调性。故可变类平均法具有单调性。第17页/共38页18第六章第六章 聚类分析聚类分析 对于可变法,因对于可变法,因故可变法具有单调性。故可变法具有单调性。对于离差平方和法,因对于离差平方和法,因故离差平方和法具有单调性。故离差平方和法具有单调性。第18页/共38页19第六章第六章 聚类分析聚类分析6-5 试从定义直接证明最长和最短距离法的单调性试从定义直接证明最长和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 课后 习题 答案 详解 北大 高惠璇 第六 解答
限制150内