数据采集与预处理-课程标准-教学大纲.docx
《数据采集与预处理-课程标准-教学大纲.docx》由会员分享,可在线阅读,更多相关《数据采集与预处理-课程标准-教学大纲.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据采集与预处理课程标准课程名称:数据采集与预处理课程代码:课程类型:专业核心课程学 分:4计划学时:64实践课时比例:50%主要授课方式:理实一体化考核方式:上机操作适用专业:大数据技术与应用专业、云计算技术与应用专业、软件技术专业1 .概述课程的性质本课程是大数据技术与应用专业、云计算技术与应用专业、软件技术专业的专业核心课程,是校 企融合系列化课程,该课程教学内容以任务驱动为主线,围绕企业级应用进行工程任务设计。1. 2课程设计理念本课程遵循应用型本科和高等职业教育规律,以大数据技术与应用实际工作岗位需求为导向选取 课程内容,完成了数据采集和预处理平台搭建、网络爬虫实践、日志数据采集实践
2、和数据预处理实践 等完整的数据采集与预处理应用案例,课程目标是培养学生具备“大数据分析”应用工程所需数据采 集与预处理的综合职业能力;坚持开放性设计原那么,吸收企业专家参与,构建以“工作任务”为载体 的“工程化”课程结构;课程教学实施教、学、做一体,坚持理论为实践服务的教学原那么,通过模拟 企业大数据采集与预处理应用业务进行组织,锻炼学生的实践操作能力。1 . 3课程开发思路通过岗位技能的工程化以及大数据采集与预处理任务的序列化,对内容体系结构进行了适当调 整与重构,以适应教学课程安排。以工程案例及其任务实现为驱动,凭借翔实的操作步骤和准确的 说明,帮助学生迅速掌握大数据采集与预处理的相关知识
3、与技能,并且充分考虑学习操作时可能发 生的问题,并提供了详细的解决方案,突出岗位技能训练。2 .课程目标本课程的培养目标是使学生以大数据分析岗位需求为依托,以实际工作任务为导向,理清大数据 采集与预处理中常用工具的作用及应用,培养学生大数据采集与预处理的实际操作技能。2. 1知识目标本课程本书以任务驱动为主线,围绕企业级应用进行工程任务设计,完成了数据采集和预处理平 台搭建、网络爬虫实践、日志数据采集实践和数据预处理实践等完整的数据采集与预处理应用案例, 要求学生系统掌握 scrapy、Flume、pig kettle、Pandas openrefine 和 urllib、selenium 基
4、本库 和BeautifulSoup解析库等的相关技术知识,熟悉企业典型应用案例,熟悉数据采集与预处理的常用 与典型操作。2 . 2素质目标(1)培养学生动手能力、自主学习新知识的能力(2)培养学生团队协作精神. 3能力目标通过该课程的学习,学生能利用所学的相关技术,能根据企业具体大数据分析业务,结合采集的 海量数据,针对性的进行数据的预处理,学会数据采集与预处理的常用与典型操作。3 .课程内容和要求根据专业核心课程目标和涵盖的工作任务要求,确定课程内容和要求,说明学生应获得的知识、 技能与态度。学习情境工作任务知识要求技能要求学时安排数据采集 与预处理 概述认识数据采集技术,熟悉数据采集平台熟
5、悉数据采集的来源和 采集的方法。学会数据采集平台的 搭建。6认识数据预处理技术了解原始数据存在的主 要问题;熟悉数据预处 理的作用和工作任务。学会数据处理工具平 台的搭建。6网络爬虫实践使用urllib爬取北京公交线路信息熟悉url lib基本库和BeautifulSoup 解析库的使用方法使用urllib基本库和 BeautifulSoup 解析 库,学会北京公交线 路相关信息的爬取。4使用selenium爬取淘宝网站信息熟悉Selenium基本库和pyquery解析库的使用方法使用Selenium基本库和pyquery解析库,学会淘宝网站信息的爬取。4使用scrapy爬取北京熟悉Scrap
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 采集 预处理 课程标准 教学大纲
限制150内