数据挖掘课设要求(共6页).docx





《数据挖掘课设要求(共6页).docx》由会员分享,可在线阅读,更多相关《数据挖掘课设要求(共6页).docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上数据挖掘课设要求目标课程设计是在数据挖掘过程中加强理论和方法的系统方法和实践方法。 在“数据挖掘课程设计”中,提供了一些模拟的实际应用程序数据集,并计划了一些课程设计项目。 通过进行课程设计,学生将掌握以下技术:1.通过数据库技术处理实际的应用程序数据;2.具有基本监督学习方法的大数据挖掘步骤;3.评估分类器的策略;4.影响分类器性能的主要方面;5.解决数据挖掘中实际应用问题的主要工具。项目1:监督学习算法之间的比较1.数据集请参阅附属文件:adult.train,adult.test和adult.desctiption。adult.train文件用于训练,adult
2、.test用于测试,adult.desctiption用于描述数据中的属性。数据缺少标为“?”的值2.任务(1)数据预处理。 将数据从文件迁移到oracle等数据库,然后通过数据库技术处理数据。 删除缺少值的元组。(2)利用训练数据建立预测模型。 基本的监督学习方法(例如朴素贝叶斯分类,ID3,C4.5,CART,BPANN)分别用于训练分类器。(3)不同分类器之间的准确性比较项目2:调查噪声数据的影响1.数据集请参考项目1的数据。2.任务(1)数据预处理。 不要删除缺少值的元组。 而是在同一列中用适当的值替换丢失的值,例如平均值,回归值或通过数据插补技术得出的其他值。(2)使用C4.5建立预
3、测模型。(3)通过C4.5对两组数据之间有无值和有值缺失的分类器之间的精度比较。项目3:模拟应用1.字母识别应用简介字符图像基于20种不同的字体,并且这20种字体中的每个字母都被随机扭曲以产生20,000个唯一刺激的文件。每个刺激转换为16个数字属性。这些过程生成的字符图像的示例在图中提供。然后逐个像素扫描每个字符图像,以提取16个数字属性。这些属性表示像素分布的原始统计特征。为了实现紧凑性,然后将每个属性线性缩放到从0到15的整数值范围。最后一组值足以提供26个类的完美分离。也就是说,没有任何特征向量映射到一个以上的类。属性(缩放到0-15范围之前)是:(1)最小矩形框中心的水平位置(从图像
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 要求

限制150内