《数据采集与网络爬虫》实验教学大纲.docx
《《数据采集与网络爬虫》实验教学大纲.docx》由会员分享,可在线阅读,更多相关《《数据采集与网络爬虫》实验教学大纲.docx(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据采集与网络爬虫实验教学大纲(Data collection and Web crawlers)课程代码:0600074总学时:32学时(其中:讲课16学时、实验16学时、讨论0学时)先修课程:高翎学、侬据科粘灿据技术导潜、C语言程序设计、python 程序设计等。一、目的随着互联网技术的飞速发展,以及国家产业信息化进程的大力推进下,在大数 据时代背景下,产生了对基于Web网站的数据的大量需求。快速、稳定、健 壮、 分布式的爬虫程序呼之欲出。作为大数据“采集-存储-分析-应用中首要环节的“采集”,是大数据的第一环 节,是非常重要的学科,如果没有采集数据,就得不到可供加工研究的数据对象。本课程
2、的实验教学目的是:1)引导学生对各类网站、各类网页的结构进行研究; 2)让学生熟练掌握运用Python和各类资源/包以多种方式采集网络数据;3)结合数据 处理的相关包和工具实现数据处理。通过自己设计和动手操作,从实验中学习、探索 和发现数据源,爬取数据,分析数据,激发学生学习爬取数据应用数据的兴趣。二、要求1 .知识要求(D 理解爬虫程序设计理念; 学习数据提取与存储方法;(3)掌握scrapy爬虫框架设计技巧;掌握对爬取的数据进行正确的数据分析。2 .能力要求(1)熟练使用ullib下载网页;(2)学会BeautifulSoup工具包选择数据;(3)掌握scrapy网页爬取的工作流程;(4)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据采集与网络爬虫 数据 采集 网络 爬虫 实验教学 大纲
限制150内