美文网首页
scrapy设置随机请求头的两种方法

scrapy设置随机请求头的两种方法

作者: june雨上 | 来源:发表于2018-01-25 21:29 被阅读0次

1.在settings.py中设置USER_AGENT_LIST

需要先导入random模块

然后在meddlewares.py中创建RandomUserAgentMiddleWare()类.重写scrapy内置的UserAgentMiddleware.

这种最后需要在settings.py中设置DOWNLOAD_MIDDLEWARES,将系统默认的随机请求头给禁掉,再添加我们自己定义的随机UserAgent

2.通过pip install fake-useragent,从而直接通过fake_useragent第三方库来随机生成请求头.

需要先导入UserAgent

from fake_useragen timport UserAgent

需要在settings.py中设置

# 用于配置随机user-agent的类型,如果值是random,表示任意随机一个;如果配置的是chrome,则只随机chrome中的user-agent.

RANDOM_UA_TYPE ='chrome'

最后同上面一样需要在settings.py中设置DOWNLOAD_MIDDLEWARES,将系统默认的随机请求头给禁掉,再添加我们自己定义的随机UserAgent

相关文章

网友评论

      本文标题:scrapy设置随机请求头的两种方法

      本文链接:https://www.haomeiwen.com/subject/pwsbaxtx.html