美文网首页
Scrapy 框架中的用户代理池和常用设置(二十八)

Scrapy 框架中的用户代理池和常用设置(二十八)

作者: 梦捷者 | 来源:发表于2019-08-02 19:07 被阅读0次

一、用户代理池的设置和类的编写

  • 在settings.py文件中进行设置,其变量是一个列表,列表中为UA代理。
  • 编写随机UA代理中间件类来随机选择UA代理

二、 设置优先级的常用设置

1、命令行选项(优先级最高)

2、设置per-spider

3、项目设置模块

4、各命令默认设置

5、默认全局设置(低优先级)

三、常用项目设置

1、BOT_NAME---项目名称。

2、CONCURRENT_ITEMS-----item处理最大并发数,默认100。

3、CONCURRENT_REQUESTS----下载最大并发数。

4、CONCURRENT_REQUESTS_PER_DOMAIN---单个域名最大并发数。

5、CONCURRENT_REQUESTS_PER_IP---单个ip最大并发数。

相关文章

网友评论

      本文标题:Scrapy 框架中的用户代理池和常用设置(二十八)

      本文链接:https://www.haomeiwen.com/subject/bhsrdctx.html