2023年新版数据仓库与数据挖掘实验报告.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2023年新版数据仓库与数据挖掘实验报告.pdf》由会员分享,可在线阅读,更多相关《2023年新版数据仓库与数据挖掘实验报告.pdf(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 数据挖掘大作业院(系)名称:信 息 技 术 学 院专 业 年 级:1 1 级网络工程(物联网方向)学 号:学 生 姓 名:朱玉目 录目 录.错误!未定义书签。第1章 数据仓库和数据挖掘简介。错误!未定义书签。1.1数据简介.错误!未定义书签。1.2数据挖掘技术.错误!未定义书签。第2章创建数据仓库。错误!未定义书签。2.1 数据.错误!未定义书签。2.1.1数据属性结构.错误!未定义书签。2.1.2数据库的相关解决。错误!未定义书签。2.1 .3实验的开发平台,错误!未定义书签。2.2数据库的结构模块简介.2第3章 数据挖掘过程。错误!未定义书签。3.1 关联规则.错误!未定义书签。3.1.
2、1关联规则挖掘过程图解。错误!未定义书签。3.1.2决策树挖掘过程图解。错误!未定义书签。3.1.3聚类分析挖掘过程图解.错误!未定义书签。3.2数据集挖掘结果。错误!未定义书签。3.2.1超市交易关联规则的挖掘结果。错误!未定义书签。3.2.2影响小学生自控能力调查数据集决策树的挖掘结果.错误!未定义书签。3.2.3影响小学生自控能力因素调查数据集聚类分析的挖掘结果.错误!未定义书签。第四章数据仓库和数据挖掘总结。错误!未定义书签。4.1关联规则总结。错误!未定义书签。4.2决策树总结。错误!未定义书签。4.3聚类分析总结。错误!未定义书签。第1章数据仓库和数据挖掘简介1.1 数据简介我的数
3、据集是由两个不同的数据库组成,由于做关联规则的时候,影响小学生自控能力的因素分析调查分析数据库,不具有关联规则一对多的条件,因此,我用了课本上的的超市交易数据集。所以做关联规则的超市数据集,在这里我就不多介绍了。做决策树,聚类分析所用的数据集影响小学生自控能力的因素分析调查分析数据库重要父母文化限度,家庭经济状况,教师规定,民族,年纪,年龄,师生关系,是否单亲,是否是独生子女,爱好,性别,姓名,学号,性格,自控能力属性组成。此表是用来调查影响小学生自控能力的因素有哪些。此数据集做决策树的目的是,可以根据小学生的基本情况大体了解他的自控能力。此数据集做聚类分析,可以从中挖掘出小学生基本情况的分类
4、。1.2 数据挖掘技术关联规则、决策树.、聚类分析。第2章 创建数据仓库2.1 数据2.1.1数 据属性结构如 表2-1 22所小。表2-1超市数据交易表列名数据类型允许空闹 题nchar(lO)口?Itemsnchar(lO)列名额据类型允许空门 画nchar(lO)SB表 2-2影响小学生自控能力的因素分析调查表列名 数据类型 期nvarchar(255)字号float姓名nvarchar(255)年龄float性别nvarchar(255)民族nvarchar(255)是否单亲nvarchar(255)是否是独生子女nvarchar(255)父母文化程度nvarchar(255)家庭经济
5、状况nvarchar(255)是否为班委nvarchar(255)教师要求nvarchar(255)师生关系nvarchar(255)兴趣nvarchar(255)性格nvarchar(255)自控能力nvarchar(255)许切口团团团国团囹画团切画2 画画口2.1.2数据库的相关解决1.创建数据库2.数据集导入3.设立主键4.创建数据库关系图2.1.3 实验的开发平台1.实 验 设 备:PC2.重 要 开 发 软 件:SQL S e v e r 202 33.辅 助 软 件:Office2.2数据库的结构模块简介本 数 据 库 有 两 个 数 据 集 组 成,超市交易数据集和影响小学生自
6、控能力的因素分析调查表两个数据集。超市交易中有ID和Items两个属性;影响小学生自控能力的因素分析调查表数据集中有年级、学号、姓名、年龄、性别、民族、是否单亲、是否独生子女、父母文化限度、家庭经济状况、是否为班委、教师规定、师生关系、爱好、性格、自控能力等属性。第3章数据挖掘过程3.1关联规则3.1.1 关联规则挖掘过程图解1.商业智能项目创建过程图解E目 一 巨金超市交易关联,晚 关 方 案“总市交易关联规则”(1个项目)二T数据源3 S 3 S源视图心多造数据集-匕 1 2 5 1 5,优 角色:7程序集;:杂 项2.数据源的创建过程图解连接管理器确定 麻肖帮助3.数据源视图创建过程图解
7、解决方案资源管理器-超市交易关联规4 x _ l R方一决方案二超市交易关联规则”71?项 目)超市交易关联规则(=)-匕 数据源%超市交易数据源|二 e源视图匕 多维魏g集|.L 会|一匕 睡勒-匕 角色”一 程序集:白 颗?数据源视图向导 欢迎使用数据源性图向导使 用 此 向 导 创 建 新 的 娄 萌 源 视 图.从关萦数据库的表和视图中创建数据源视图.、数据源徨供与关系数据库的简单连接.可以使用M源视图执行更多高级功能,如滚存元书娓、添力深系、创建计算如设置逻辑演.,不再显示此页下 完曲E)取消4.数据集挖掘结构创建过程图解起苜2 嶙关方案 超市交易关联规则(1个项目)3-j超市交易关
8、联规则点.匕数据源:超市交易数据源.d s$匕傩 源 视 图:i七)超市交易数据视|一 口多维数据集;g维度匕?角色程序集匕杂项A数据挖掘向导 L M W指定定型数据指定分析中所用的列./4表/列B 1 TID唱R福TIDDealItems键 日 输 入 国 可 S B El团 团0 J为当前谓的可预测内容提供施入建议:建议 完成(F)|取消数据挖亮向导指定列的内容和数据类型指定挖掘结构列的内容和数据类型.E?圜日烈TIDDealItemsText内容类型 数据类1Key检 辎 序 列 的 连 续 或 离 腿 揭髅 完成(B|取消解决方案资源管理器-解决方案 超市 4 X豆 解 决 方 案 常
9、 晟 易 关 赦 则;目 厂向上超市交易关瞰则g -D 源|:.超 故 易 台 源.ds自-匕 姆 源视图:再 超市交易55视图dsv|-2多燃数据集|.口 3自-O板WI匚A超市交易颉 结 恢dmm 白 角色|.&蟒 集 5.设立算法参数A算法参数参数凹:1默认值范围I MAXIMUMJTEMSET_COUNTiI 200000I n.)MAXIMUMJTEMSET_SIZE30,500MAXIMUM_SUPPORT1.0(0.0,.)MINIMUM-IMPORTANCE-999999999()MIN1MUMJTEMSET_SIZE11,500MINIMUM-PROBABILITY)-50.
10、40.0,1,0MINIMUM.SUPPORT/030.030.0,.)说明:指定要生成的最大项集数.如果不加以指定,算法将生成所有可能的项集.添加 删除 确定 取消 帮助回M B*6.解决挖掘结构过程图解产 处理进唐|。卜回3.1.2决策树挖掘过程图解决策树的挖掘过程与关联规则基本上相同,但有些是不同的,因此,我把不同过程的图解在下面给出。1.创建挖掘结构过程中挖掘数据所用的列的选项2.算法参数设立3.1.3聚类分析挖掘过程图解聚类分析的挖掘过成与决策树、关联规则也基本上相同,因此,我把不同过程的图解和决策树同样也在下面给出。1.挖掘数据集时所用到的属性0EEO0EnEnEE0Qn0团团团切
11、胡BEg lnI a n键表/列B 卡 影响学生自控能力的因素分析调查表a 父母文化程度 家庭经济状况豆I 教府要求民族年级省 年龄局 师生关系a 是否单亲包是否是独生子女U 是否为班委凳兴趣姓名,痛性格言字号得 自怜as力国7i口?I2.算法参数设立、算法参数参数凹:值默认值范围CLUSTER-COUNT1010)CLUSTER.SEED00,.)CLUSTERING.METHOD41123,4MAXIMUMJNPUT,ATTRIBUTES2550.65535MAXIMUM.STATES1501000,2,65535MINIMUM.SUPPORT1(0,.)MODELUNG.CARDINAU
12、TY101,50一SAMPLE,S1ZE500000,(100,.)说明:指定算法支持的最大属性状态数.如果属性的状态数大于该最大状态数,算法将使用该属性的最常见状态,并将剩余状态视为不存在.Enterprise Edition添加 删除 确定 取消 帮助(H)3.2数据集挖掘结果3.2.1超市交易关联规则的挖掘结果1 .项集4挖 摄 结 构|大 住 则 理 市商函查薛一3住监隹确性囹去 挖 掘 横 卦 题超市交月谢8结构.dmm 设计超电交易X98祝图.dsv 设计 a关 X2.钻取超市交月谢8结构.dm m (ifii+1是市交易JR3题 图.dsv 梭计 侬 页 X融挖 峻 构 式住掘横
13、型 信挖 掳 侬 缰 看 话|定 挖掘准谕性图去 S后 掘 侬 枝 刎 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _挖第侯皇:|国帝女旦热也盘 .e 1 2 9 :比 。8八美景娘则叠 J项集II!如即:;吃根同最低支持!谛送项集最小项案大小:0:显示演 示 面
14、 嗨显示长名祢最大行效:2001支持8775大小 顶集232n ilkteaSa,breadbread,n ilktea,m lkcrotn,broad,n ilkcrn,broadcreant%bread,*ilkcrean,n ilk超市交JB颜 结 构.dm m l设计】超 市 交 易 回 睚dsv 设计 磔 页 X4岗 膜 构|大代胡横型 宓图8胭 查 看 器|)珈 准 确 性图去 与代掳慎型预则_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
15、_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _m m s t:即 交 后*绐 y:叵 叵 吧r:三 爰 克 忑 昼 j顶 筌 规 则 依 赖 关 系 障最小野军:最低重衰性显示长名访-于60:浦选姐则:R:而囹咏最大行数:厩康松确而标2000 年规则croon二现有的-iilk=现有的-*=现有的,bread=现 有 的-ilk =现有的 =现有的,ek=现 有 的-brad=现有的crc#n:现 存 的-bread=现有的bread=-tea=现有的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 新版 数据仓库 数据 挖掘 实验 报告
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内