工信版(中职)数据采集技术(初级)项目6:项目实战 网络爬虫教学课件.pptx
《工信版(中职)数据采集技术(初级)项目6:项目实战 网络爬虫教学课件.pptx》由会员分享,可在线阅读,更多相关《工信版(中职)数据采集技术(初级)项目6:项目实战 网络爬虫教学课件.pptx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、YCF(中职)数据采集技术(初级)项目6:项目实战 网络爬虫教学课件CONTENTS任务一:爬取手机端数据任务二:爬取浪潮优派信息项目情景零经理:小张,Python模块中爬取网络数据的内容学习完成之后,需要你使用所学的技术爬取一些网站?小张:爬取什么内容?经理:爬取网站的标题、图片、路径等等!小张:网站多种多样,爬取哪类的呢?经理:爬取一个豆瓣电影网,还有需要练习一下手机端数据爬取。小张:也就是爬取手机端和PC端?经理:是的。一种是通过所学的内容直接爬取,一种借助网页分析工具。小张:好的,保证完成任务。小张和经理谈完话后,开始调研手机端数据采集分析软件有哪些,并决定使用fiddler软件进行手
2、机端网页分析,除此之外分析豆瓣电影网,并把爬取的数据进行保存。本项目是练习request、urllib等模块,学习步骤为:步骤一:Fiddler抓包工具配置及使用获取手机端数据内容。步骤二:爬取爬取浪潮优派信息,并保存在文件中。学习目标零【知识目标】掌握Fiddler抓包工具的使用掌握手机端数据的获取掌握网站的分析方法掌握网络数据的爬取流程【技能目标】能够使用Fiddler对网站进行抓包能够使用Requests模块进行手机端数据的爬取能够使用Requests模块进行浪潮优派网站数据的爬取能够把爬取的数据进行保存任务描述任务一:爬取手机端数据壹使用Requests库与抓包工具(拦截查看网络数据包
3、内容的软件)的结合实现一个APP页面内容的爬取。能够通过Fiddler抓包工具配置及使用获取APP数据内容及相关信息,之后使用Requests库相关方法通过链接地址实现APP内数据的爬取。爬取思路如下:1.安装Fiddler抓包工具。2.使用Fiddler抓包工具进行网站分析。3.分析网站。任务步骤任务一:爬取手机端数据壹第一步:下载抓包工具。这里使用Fiddler抓包工具,点击下载按钮后,根据相关提示信息完成内容填写即可实现Fiddler下载,效果如下图所示。任务步骤任务一:爬取手机端数据壹第二步:Fiddler安装。双击下载好的软件安装包,之后点击“I Agree”“Install”按钮即
4、可安装Fiddler工具。安装完成效果如下图所示。任务步骤任务一:爬取手机端数据壹第三步:Fiddler工具配置。打开刚刚安装完成的Fiddler软件,效果如下图所示。任务步骤任务一:爬取手机端数据壹点击上图中“Tools”菜单下的“Options”按钮进入工具配置界面,效果如下图所示。任务步骤任务一:爬取手机端数据壹点击图中“Connections”按钮,之后进行端口号的配置,效果如下图所示。任务步骤任务一:爬取手机端数据壹第四步:手机配置。由于抓取的是手机APP数据,因此需要在同一局域网内进行手机网络的配置,进入手机WiFi修改界面,设置手动代理并进行主机IP和端口号的配置,效果如下图所示
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工信版中职数据采集技术初级项目6:项目实战 网络爬虫教学课件 工信版 数据 采集 技术 初级 项目 实战 网络 爬虫 教学 课件
限制150内