欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第7章聚类分析.课件电子教案教学教程.pptx

    • 资源ID:18236026       资源大小:2.61MB        全文页数:42页
    • 资源格式: PPTX        下载积分:9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第7章聚类分析.课件电子教案教学教程.pptx

    第7章 聚类分析及R使用多元统计分析及建模 王斌会 教授多元统计分析及R语言建模多元统计分析及R语言建模理解理解聚类分析的聚类分析的目的意义及统计思想目的意义及统计思想了解了解变量类型的几种尺度变量类型的几种尺度定义定义熟悉熟悉Q型和型和R型型聚类分析的统计量的定义聚类分析的统计量的定义了解了解六种系统聚类六种系统聚类方法及方法及它们的统一它们的统一公式公式掌握掌握R语言语言中六种方法的中六种方法的具体使用具体使用步骤步骤了解了解R语言语言中快速聚类中快速聚类的基本思想和的基本思想和用法用法多元统计分析及R语言建模聚类分析聚类分析的目的和的目的和意义意义聚类分析聚类分析中所使用的几种尺度的中所使用的几种尺度的定义定义初步掌握选用聚类初步掌握选用聚类方法方法与与相应相应距离距离的的原则原则六种系统聚类方法的定义及其基本性质六种系统聚类方法的定义及其基本性质R语言程序中有关聚类分析的算法语言程序中有关聚类分析的算法基础基础掌握掌握R语言中语言中kmeans聚类的方法和聚类的方法和用法用法7 聚类分析及R使用l基本概念聚类分析法(Cluster Analysis)是研究“物以类聚”的一种现代统计分析方法,在众多的领域中,都需要采用聚类分析作分类研究。l分析方法7 聚类分析及R使用 7 聚类分析及R使用 【例7.1】两个变量、九个样品数据及其散点图7 聚类分析及R使用7 聚类分析及R使用距离矩阵距离矩阵相关矩阵相关矩阵7 聚类分析及R使用相关系数矩阵:相关系数矩阵:cor(X)7 聚类分析及R使用7 聚类分析及R使用 先将个样品分成类,每个样品自成一类,然后每次将具有最小距离的两类合并,合并后重新计算类与类之间的距离,这个过程一直继续到所有的样品归为一类为止,并把这个过程做成一张系统聚类图。系统聚类法的基本思想7 聚类分析及R使用类类间间距距离离计计算算方方法法(1)最短距离法()最短距离法(single)(2)最长距离法()最长距离法(complete)(3)中间距离法()中间距离法(median)(4)类平均法()类平均法(average)(5)重心法()重心法(centroid)(6)离差平方和法()离差平方和法(Ward)类间距离计算公式类间距离计算公式7 聚类分析及R使用7 聚类分析及R使用系统聚类法过程(1)计算n个样品两两间的距离(2)构造n个类,每类包含1个样品(3)合并距离最近两类为新类(4)计算新类与各类距离,若类个数为1,转到第5步,否则回到第3步(4)绘制系统聚类图(5)确定类的个数和样品名称例7-1数据的系统聚类最短距离法(采用欧氏距离)例7-1数据的系统聚类最长距离法(采用欧氏距离)例7-1数据的系统聚类7 聚类分析及R使用系统聚类R语言步骤一、计算距离一、计算距离阵阵: dist二二、进行系统、进行系统聚类聚类: hclust三三、绘制聚类、绘制聚类图图: plot四四、画分类、画分类框框: rect.hclust五、确认分类五、确认分类结果结果: cutree【例7.2】续例3.1,研究全国31个省、市、自治区2007年城镇居民生活消费的分布规律,根据调查资料做区域消费类型划分。7 聚类分析及R使用l概念 kmeans法是一种快速聚类法,这种算法的基本思想是将每一个样品分配给最近中心(均值)的类中。l 原理 kmeans算法以k为参数,把n个对象分为k个类,使类内具有较高的相似度,类间的相似度较低。7 聚类分析及R使用相似度计算是根据类中对象的均值mean来进行7 聚类分析及R使用【例7.3】kmeans算法的R语言实现及模拟分析:模拟正态随机变量7 聚类分析及R使用7 聚类分析及R使用模拟模拟10个变量个变量2000个样品个样品的正态随机矩阵的正态随机矩阵7 聚类分析及R使用l系统聚类分析的特点l综合性l形象性l客观性l关于kmeans算法 kmeans算法只有在类的均值被定义的情况下才能使用 对于“噪声”和孤立点是敏感的,这种数据对均值影响极大7 聚类分析及R使用l关于变量变换l平移变换l极差变换l标准差变换l主成分变换l对数变换7 聚类分析及R使用

    注意事项

    本文(第7章聚类分析.课件电子教案教学教程.pptx)为本站会员(知****量)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开