Python面试题总结.docx
《Python面试题总结.docx》由会员分享,可在线阅读,更多相关《Python面试题总结.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结Python 面试题总结可编辑资料 - - - 欢迎下载精品名师归纳总结资料仅供参考1. Python 线程池原理?我懂得为线程池是一个存放许多线程的单位,同时仍有一个对应的任务队 列。整个执行过程其实就是使用线程池中已有有限的线程把任务队列中的任务做完。这样做的好处就是你不需要为每个任务都创立一个线程,由于当你创立第 100 个线程来执行第 100 个任务的时候,可能前面已经有50 个线 程终止工作了。 超过最大值的线程能够排队,但她们要等到其它线程完成后才启动。因此重复利用线程来执行任务,削减系统资源的开销。2. Python 合并字典,相同 key 的 value 如何相
2、加? 利用 collections.Counter 可轻松办到 x = apple:1, banana:2 y = banana:10, pear:11 from collections importCounterX,Y =Counter x,Counter y z = dictX+ Y zapple:1,banana:12,pear:11另一种写法from collections importCounterdictCounter x+Counter y合并两个字典的方法方法 1:dictMerged1=dictdict1.items+dict2.items方法 2: dictMerged2=
3、dictdict1, *dict2 方法 2 等同于:dictMerged=dict1.copy dictMerged.updatedict2 或者dictMerged=dictdict1dictMerged.updatedict23. 说明 GUI 和 GPL ?可编辑资料 - - - 欢迎下载精品名师归纳总结资料仅供参考GUI图形用户 界面(GraphicalUserInterface,简称GUI,又称图形 用户接口)是指采纳图形方式显示的运算机操作用户界面。GPLGNU通用公共许可证 GPL 同其它的自由软件许可证一样,许可社会公众享有:运行、复制软件的自由,发行传播软件的自由,获得软件
4、源码的自由,改进软件并将自己作出的改进版本向社会发行传播的自由。4. 简述爬虫的基本步骤和流程? 网络爬虫的基本工作流程如下:1. 第一选取一部分细心选择的 URL 。2. 将这些 URL 放入待抓取 URL 队列。3. 从待抓取 URL 队列中取出待抓取在URL ,(解析 DNS,而且得到主机的ip ,)并将 URL 对应的网页下载下来,储备进已下载网页库中。另外,将这些URL 放进已抓取 URL 队列。4. 分析已抓取 URL 队列中的 URL 和其中的有价值的数据,将新的URL , 放入待抓取 URL 队列,将数据储备起来,从而进入下一个循环。5. 你们公司的业务中,并发能达到多少?6.
5、 如何循环抓取一个网站的 1000 张图片? 流程大致是这样找到全部页数-遍历全部的页数-遍历当前页的全部相册 给每个相册建立一个目录 -遍历当前相册的全部图片 遍历此相册的全部页 遍历当前页的全部照片并找到图片的 url-获得图片 url就存起来 , 然后经过图片 url下载图片。-引用计数当图片下载量达到 1000 张时,停止爬取。7. 假如对方网站能够反爬取,封 ip 怎么办?1、放慢抓取速度,减小对于目标网站造成的压力。可是这样会削减单位时间类的抓取量。2、其次种方法是经过设置代理 IP 等手段,突破反爬虫机制连续高频率抓取。可是这样需要多个稳固的代理IP。代理 IP 能够搜寻到免费的
6、,可是可能不太稳固,也有收费的,可是不肯定划算,也可能不是长期之计。一般的基于 ADSL拨号的解决方法可编辑资料 - - - 欢迎下载精品名师归纳总结资料仅供参考一般,在抓取过程中遇到禁止拜访,能够重新进行ADSL 拨号,猎取新的 IP, 从而能够连续抓取。可是这样在多网站多线程抓取的时候,假如某一个网站的抓取被禁止了,同时也影响到了其它网站的抓取,整体来说也会降低抓取速度。一种可能的解决方法同样也是基于 ADSL 拨号,不同的是,需要两台能够进行ADSL 拨号的服务器,抓取过程中使用这两台服务器作为代理。假设有 A、B 两台能够进行 ADSL 拨号的服务器。爬虫程序在 C 服务器上运行,使用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python面试题总结 Python 试题 总结
限制150内