数据采集与预处理教学大纲.docx
《数据采集与预处理教学大纲.docx》由会员分享,可在线阅读,更多相关《数据采集与预处理教学大纲.docx(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据采集与预处理课程标准课程名称:数据采集与预处理课程代码:课程类型:专业核心课程学 分:4计划学时:64实践课时比例:50%主要授课方式:理实一体化考核方式:上机操作适用专业:大数据技术与应用专业,云计算技术与应用专业,软件技术专业1.概述1.1课程地性质本课程是大数据技术与应用专业,云计算技术与应用专业,软件技术专业地专业核心课程,是校 企融合系列化课程,该课程学习内容以任务驱动为主线,围绕企业级应用进行工程任务设计。1.2 课程设计理念本课程遵循应用型本科与高等职业教育规律,以大数据技术与应用实际工作岗位需求为导向选 取课程内容,完成了数据采集与预处理平台搭建,网络爬虫实践,日志数据采集
2、实践与数据预处理实践 等完整地数据采集与预处理应用案例,课程目地是培养学生具备大数据分析应用工程所需数据采 集与预处理地综合职业能力;坚持开放性设计原那么,吸收企业专家参与,构建以工作任务为载体地 工程化课程结构;课程教学实施教,学,做一体,坚持理论为实践服务地教学原那么,通过模拟企业大数 据采集与预处理应用业务进行组织,锻炼学生地实践操作能力。1.3 课程开发思路通过岗位技能地工程化以及大数据采集与预处理任务地序列化,对内容体系结构进行了适当调 整与重构,以适应教学课程安排。以工程案例及其任务实现为驱动,凭借翔实地操作步骤与准确地说 明,帮助学生迅速掌握大数据采集与预处理地有关知识与技能,并
3、且充分考虑学习操作时可能发生地 问题,并提供了详细地解决方案,突出岗位技能训练。2. 课程目地本课程地培养目地是使学生以大数据分析岗位需求为依托,以实际工作任务为导向,理清大数据 采集与预处理中常用工具地作用及应用,培养学生大数据采集与预处理地实际操作技能。3. 1知识目地本课程本书以任务驱动为主线,围绕企业级应用进行工程任务设计,完成了数据采集与预处理平 台搭建,网络爬虫实践,日志数据采集实践与数据预处理实践等完整地数据采集与预处理应用案例,要 求学生系统掌握 scrapy,Flume,pig,kettle,Pandas,openrefine 与 urllib,selenium 基本库与 B
4、eautifulSoup 解 析库等地有关技术知识,熟悉企业典型应用案例,熟悉数据采集与预处理地常用与典型操作。4. 2素质目地(I)培养学生动手能力,自主学习新知识地能力(2)培养学生团队协作精神5. 3能力目地通过该课程地学习,学生能利用所学地有关技术,能根据企业具体大数据分析业务,结合采集地海量数据,针对性地进行数据地预处理,学会数据采集与预处理地常用与典型操作。6. 课程内容与要求根据专业核心课程目地与涵盖地工作任务要求,确定课程内容与要求,说明学生应获得地知识, 技能与态度。学习情境工作任务知识要求技能要求学时安排数据采集 与预处理 概述认识数据采集技术,熟 悉数据采集平台熟悉数据采
5、集地来源与 采集地方法。学会数据采集平台地 搭建。6认识数据预处理技术了解原始数据存在地主 要问题;熟悉数据预处 理地作用与工作任务。学会数据处理工具平 台地搭建。6网络爬虫 实践使用urllib爬取北京公交线路信息熟悉urllib基本库与BeautifulSoup 解析库地 使用方法使用urllib基本库与 BeautifulSoup 解析库, 学会北京公交线路有 关信息地爬取。4使用selenium爬取淘 宝网站信息熟悉Selenium基本库与 pyquery解析库地使用 方法使用Selenium基本库 与pyquery解析库,学 会淘宝网站信息地爬 取。4使用scrapy爬取北京 公交信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 采集 预处理 教学大纲 doc
限制150内