Python爬虫的面试题及答案精选

2019-04-0422:35:31后端程序开发Comments3,844 views字数 1236阅读模式

Python面试题:你所理解的python爬虫?

爬虫顾名思义,就是像虫子一样,爬在Internet这张大网上。如此,我们便可以获取自己想要的东西。既然要爬在Internet上,那么我们就需要了解URL,法号“统一资源定位器”,小名“链接”。其结构主要由三部分组成:(1)协议:如我们在网址中常见的HTTP协议。(2)域名或者IP地址:域名,如:,IP地址,即将域名解析后对应的IP。(3)路径:即目录或者文件等。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

Python面试题:什么是cookie?

Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。上海Python培训举个例子:比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么上海Python培训建议我们可以利用Urllib库保存我们登录的Cookie,然后再抓取其他页面,这样就达到了我们的目的。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

Python面试题:链表和顺序表储存时各自有什么优点?

回答时,上海Python培训建议从两个方面来回答(顺序表存储和链表存储),然后可以细分之优缺点,顺带再举个例子:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

1.顺序表存储:原理:顺序表存储是将数据元素放到一块连续的内存存储空间,存取效率高,速度快。但是不可以动态增加长度。优点:存取速度高效,通过下标来直接存储;缺点:1.插入和删除比较慢,2.不可以增长长度;比如:插入或者删除一个元素时,整个表需要遍历移动元素来重新排一次顺序。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

2.链表存储:原理:链表存储是在程序运行过程中动态的分配空间,只要存储器还有空间,就不会发生存储溢出问题;优点:插入和删除速度快,保留原有的物理顺序,比如:插入或者删除一个元素时,只需要改变指针指向即可;缺点:查找速度慢,因为查找时,需要循环链表访问。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

Python面试题:是否了解网络的同步和异步?

同步:提交请求->等待服务器处理->处理完毕返回 这个期间客户端浏览器不能干任何事;异步: 请求通过事件触发->服务器处理(这是浏览器仍然可以作其他事情)->处理完毕。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

Python面试题:你是否了解MySQL数据库的几种引擎?

回答时,上海Python培训小编建议可以直接从InnoDB来讲,如果讲好了这一个引擎,其他只需再列举一两种就可以了。InnoDB是一个健壮的事务型存储引擎,这种存储引擎已经被很多互联网公司使用,为用户操作非常大的数据存储提供了一个强大的解决方案。然后上海Python培训建议再讲几个主要场合使用更方便的点:1.更新密集的表。InnoDB存储引擎特别适合处理多重并发的更新请求。2.事务。InnoDB存储引擎是支持事务的标准MySQL存储引擎。3.自动灾难恢复。与其它存储引擎不同,InnoDB表能够自动从灾难中恢复。4.外键约束。MySQL支持外键的存储引擎只有InnoDB。5.支持自动增加列AUTO_INCREMENT属性。一般来说,如果需要事务支持,并且有较高的并发读取频率,InnoDB是不错的选择。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/11198.html

  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/bc/11198.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定