《数据采集与网络爬虫》理论教学大纲.docx
《《数据采集与网络爬虫》理论教学大纲.docx》由会员分享,可在线阅读,更多相关《《数据采集与网络爬虫》理论教学大纲.docx(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据采集与网络爬虫理论 教学大纲(Data collection and Web crawlers)课程代码:0600074总学时:32学时(其中:讲课16学时、实验16学时、讨论0学时)先修果程:高翎:学、黜科学与曲据技术导触、C语言程序设计、(python程 序设计等。一、课程性质数据采集与网络爬虫是数据科学与大数据技术专业的必修课程、主干课程、 核心课程,是大数据采集、存储、分析与应用中最重要环节“采集”的具体技术化课 程,是Internet技术和计算机技术及数据处理相结合的数据类课程。课程包含 Internet技术、Python编程技术、数据分析理论教学,充分应用python的各种资源
2、/ 包以多种方式采集网络数据,并结合已经学习过的可视化方法进行分析处理,是实践 性极强的课程。二、课程目的本课程主要针对大数据技术与应用、数据科学、计算机与电子信息等专业3年级 以上本科生,主要讲解互联网大数据采集技术及各种典型爬虫的技术,并结合相关的 开源包使用Python进行实现,以加深学生对所学内容的理解。通过本课程教学,使学 生对互联网大数据采集技术有一个全面的了解,掌握基本的信息内容采集、提取和分 析方法,并且具备一定的针对具体信息采集需求的实际运用和解决能力。三、课程任务要求理解互联网大数据采集的技术体系、主要技术;掌握各种典型爬虫的技术原 理、技术框架、实现方法、主要开源包的使用
3、;通过本课程的学习,使学生学会使用 Python在静态网页、动态网页、需要登录后才能访问的网页、PC客户端、APP中爬取 数据,将理论与实践相结合,为将来从事数据爬虫、分析研究工作奠定基础。U!本课程内容涵盖了对学生在“基本理论”、“基本技能”和“职业素质”三个层 次的培养。以网页爬虫开发岗位必备的开发技能为重点并具备相应的理论基础的同 时,注重综合职业素质的养成,课程采用启发诱导式教学,鼓励学生“勤于 思考, 勤于动手”。五、基本要求1、基本理论要求:(1)掌握爬虫程序设计理念;(2)掌握数据提取与存储思想;(3)掌握scrapy爬虫框架设计思想。2、基本技能要求:(1)熟练掌握ullib网
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据采集与网络爬虫 数据 采集 网络 爬虫 理论 教学大纲
限制150内