大数据解析与应用导论 (38).pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《大数据解析与应用导论 (38).pdf》由会员分享,可在线阅读,更多相关《大数据解析与应用导论 (38).pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据解析与应用导论Introduction to Big Data Analytics and Application第十一章 案例分析二手车交易价格预测1.糖尿病的血糖预测2.工业蒸汽量预测3.4.双盲降噪自编码器实现降噪5.心电数据分析11.1 二手车交易价格预测二手车交易价格预测数据由Datawhale提供,是来自某交易平台的二手车交易记录。每条记录包括30项属性,以及交易价格price。数据量:数据量:15w条训练集数据,5w条测试集数据。目标:目标:输入样本属性,预测该样本的交易价格(本质是常规的回归问题)数据中有含义不明的特征训练集数据有,测试集数据没有(预测对象)注意范围限制赛
2、题链接:https:/ 二手车交易价格预测二手车交易价格预测(2)整体思路)整体思路40%工作量20%工作量 交叉构造 特征筛选数据分析与预处理特征工程单模型训练+调参模型融合40%工作量 数据概览 纵向清洗 异常值 缺失值数据建模的工作量并不算大,但相对的,数据处理是极为关键的步骤!11.1 二手车交易价格预测二手车交易价格预测(3)数据概览)数据概览连续型变量类别型变量 连续型变量在训练集与测试集上的分布情况大致相同,降低了任务难度 部分样本的 power 为0或超出了600,此处视为异常值 训练集上的 price 等变量具有明显的长尾分布特点,对数化后的效果会更好 seller 和 of
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据解析与应用导论 38 数据 解析 应用 导论 38
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内