数据挖掘数据集.pptx
《数据挖掘数据集.pptx》由会员分享,可在线阅读,更多相关《数据挖掘数据集.pptx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、引例统计学奥卡姆剃刀 以尽量少的因子去解释现象,减少中间过程。误差会以乘积的方式扩大引入因子会使主题偏移第1页/共20页辛普森悖论 分组中具有优势,总评中却是劣势。爱荷华州的一位居民移居到阿拉巴马州,结果提高了这两个州的平均智商。分组兼顾权重定量因子细化分析第2页/共20页数据挖掘的三种基本数据集 数据集事物数据集时序/序列数据集多维属性数据集第3页/共20页4事物数据集ID WORKID TIME WORK第4页/共20页描述性结果模式以描述性语言及规则等展现形式关联规则序列规则If-then 规则集第5页/共20页时序数据集值时间序列数据集值值第6页/共20页预测性结果模式以各种回归式、方
2、程式、检验结果等无偏预测值展现l线性、多项式、泊松、岭脊等回归类lARIMA、X-11、WOLD分解等时间序列模式l嵌入式网状结构、过拟合网状神经等学习模式第7页/共20页ARIMA平稳时间序列预测-举例某地年最低气温时序数据绘制时序图平稳性和纯随机性检验定阶参数估计模式化及预测第8页/共20页ARIMA时间序列预测-举例预测效果图第9页/共20页多维属性数据集属性/值目标有目标值则是有监督性第10页/共20页分类性结果模式各种机器学习lK中心、两阶段、邻近、系统等无监督聚类l分类树、逻辑回归、神经网等监督性分类模式第11页/共20页监督性分类性-举例信贷风险预测 数据来源于银行信贷部门对用户
3、贷款信息的记录,包括客户基本信息、信用信息、是否拖欠等。希望通过对以往客户数据的分析来对新客户评价信用,降低风险。待分析数据数据仓库处理后数据模式模式变换后数据 知识知识数据抽取数据预处理数据挖掘数据变换解释评价建模数据集第12页/共20页2023/3/25监督性分类性-举例界面化流程图第13页/共20页2023/3/25监督性分类性-举例结果输出模型比较预测的0/实际所有的0第14页/共20页2023/3/25监督性分类性-举例结果输出最优模型树第15页/共20页2023/3/25监督性分类性-举例结果输出分类 将打分文件输入待预测数据集,对新数据产生分类。第16页/共20页文本数据集文本只有单列文本?第17页/共20页企业决策支持信息系统企业决策支持信息系统ODS数据仓库统计分析数据挖掘决策支持1st Qtr2nd Qtr3rd Qtr4th QtrPowerPlayFileEditDataValuesDisplayTextLegendLocation 1992 All Products Age groups Revenue($000)OLAP查询报表产品服务DB第18页/共20页谢谢第19页/共20页2023/3/25感谢您的观看!第20页/共20页
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘
限制150内