Downloader Middleware处理的过程主要在调度器发送requests请求的时候以及网页将response结果返回给spiders的时候,所以从这里我们可以知道下载中间件是介于Scrapy的request/response处理的钩子,用于修改Scrapy request和response。(用于伪装)

我们要做就是通过代理中间件来实现ip的伪装,在middleares.py中写如下的中间件类:
import logging
class ProxyMiddleare(object):
logger = logging.getLogger(__name__)
def process_request(self,request, spider):
self.logger.debug("Using Proxy")
request.meta['proxy'] ='http://221.7.49.209:53281'
request.headers['User-Agent'] = agent
return None
网友评论