美文网首页
scrapy(五) middleware

scrapy(五) middleware

作者: 秦琴er | 来源:发表于2018-06-26 14:45 被阅读0次

Downloader Middleware处理的过程主要在调度器发送requests请求的时候以及网页将response结果返回给spiders的时候,所以从这里我们可以知道下载中间件是介于Scrapy的request/response处理的钩子,用于修改Scrapy request和response。(用于伪装)

scrapy模块图

我们要做就是通过代理中间件来实现ip的伪装,在middleares.py中写如下的中间件类:

import logging

class ProxyMiddleare(object):

    logger = logging.getLogger(__name__)

    def process_request(self,request, spider):

        self.logger.debug("Using Proxy")

        request.meta['proxy'] ='http://221.7.49.209:53281'

        request.headers['User-Agent'] = agent

        return None

相关文章

网友评论

      本文标题:scrapy(五) middleware

      本文链接:https://www.haomeiwen.com/subject/vdsuyftx.html