《Python网络爬虫技术(第2版)(微课版)》教学大纲.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《Python网络爬虫技术(第2版)(微课版)》教学大纲.docx》由会员分享,可在线阅读,更多相关《《Python网络爬虫技术(第2版)(微课版)》教学大纲.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Python网络爬虫技术教学大纲课程名称:Python网络爬虫技术课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论24学时,实验40学时)总学分:4.0学分一、课程的性质数字经济时代,数字资源已经成为互联网竞争和经营的生产要素和核心竞争力,而如何 获取数据资源并基于此产出有价值的数据,已成为重要的资源配置。数据企业能够收集、获 取的数据越多,越可能在行业竞争中具有优势地位。行业的发展带动岗位的需求,越来越多 的爬虫工程师岗位涌现,工作中对爬虫技术的需求也越来越多。网络爬虫技术是数据分析、 数据挖掘、人工智能等技术的数据基础,是从互联网上批量获取数据的重要技术之一,特开 设
2、Python网络爬虫技术课程。二、课程的任务通过本课程的学习,掌握使用Python基本语法完成爬虫任务编写,使用Requests库向 指定网址发送请求,Xpath或Beautiful Soup库对静态网页进行解析,Selenium库爬取动态 页面;使用JSON文件、MySQL数据库、MongoDB数据库对爬取下来的数据进行存储;使 用表单登录方法、Cookie登录方法实现模拟登录;使用HTTP Analyzer和Fiddler工具抓包, 并分析终端协议;使用Scrapy框架进行网页内容爬取,理论结合实践,每个章节中都配有 多个案例,为学生将来从事数据采集、数据爬取的工作、研究奠定基础。三、课程
3、学时分配序号教学内容理论学时实验学时其它1第1章了解爬虫与Python爬虫环境222第2章爬虫基础知识准备243第3章 简单静态网页爬取一一获取某企业官网基本信息6104第4章爬取动态网页一获取图书基本信息685第5章模拟登录一一登录某企业官网246第6章终端协议分析一一获取某音乐PC客户端和APP数据267第7章使用Scrapy爬虫爬取某企业官网新闻动态46总计2440四、教学内容及学时安排1.理论教学序 号章节名称主要内容教学目标学时1了解爬虫与 Python爬虫环 境1 .爬虫的概念2 .爬虫的分类3 .爬虫的合法性与robots协议4 .网站反爬虫的目的与手段5 .爬取策略制定6 .爬
4、虫需要用到的编程环境、工具介 绍1 .掌握爬虫的概念 和分类2 ,了解爬虫的法律 问题3 .掌握爬虫robots协 议以及该协议的常 见字段4 .了解反爬虫的目 的和常用手段5 .掌握制定爬虫策 略的方法6 .了解爬虫相关库 及环境配置的方法22爬虫基础知识 准备1 . 了解网页开发技术2 . 了解网页的结构3 . 了解网页的分类4 . 了解网页的数据结构5 .熟悉HTTP请求方法与过程6 .熟悉常见HTTP状态码7 .熟悉HTTP头部信息8 .熟悉 Cookie1 . 了解常用的网页 开发技术2 .掌握网页的结构 和常用的标签,并能 完成简单的网页创 建3 . 了解不同类型网 页的区别,并能
5、加以 区分4 ,掌握网页中常用 的数据结构5 .掌握HTTP请求 方法和过程,并能分 析HTTP协议中的 头部信息23简单静态网页 爬取获取 某企业官网基 本信息1 ,使用Chrome浏览器查看网页2 .使用urllib3库实现HTTP请求3 .使用Requests库实现HTTP请求4 .使用Xpath解析网页5 .使用Beautiful Soup库解析网页6 ,使用正则表达式解析网页7 .将数据存储为JSON文件8 .将数据存储到MySQL数据库1 .掌握Chrome浏览 器开发者工具的使 用方法2 .掌握使用urllib 3 和Requests库实现 HTTP请求的流程3 .掌握Xpath
6、的基 本语法和常用函数4,掌握创建 Beautiful Soup 对象 的方法5 ,掌握正则表达式 解析网页的常用方 法6 .掌握使用JSON 模块和PyMySQL库 存储数据的方法64爬取动态网页获取图书 基本信息1 .逆向分析判断网页类型2 ,逆向分析获取动态网页信息3 .使用Selenium库打开浏览器对象 并访问页面4 . Selenium库进行元素选取、交互、 页面操作、等待5 . MongoDB数据库和MySQL数据 库的区别6 .将数据存储到MongoDB数据库1 ,掌握逆向分析定 位动态数据所在网 址的方法2 .掌握 Selenium 库 的安装和配置方法3 .掌握 Selen
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python网络爬虫技术第2版微课版 Python 网络 爬虫 技术 微课版 教学大纲
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内