Scrapy爬虫模拟登录github

作者: 幼姿沫 | 来源:发表于2021-03-17 11:37 被阅读0次

scrapy爬虫框架模拟登录github

携带cookies  /  以及在响应中自动查找action跳转的内容和网址


填写用户名和错误密码在session中携带相关信息formdata和cookies

在源码中也可找到session中相关数据

在element元素中也可找到相关元素说明可以作为初始网址

在element中找到post_data的数据提取相关xpath就可以进行表单请求也就是post请求


表单数据的action就可直接带着用户名密码直接登录

用 scrapy.formRequest .from_response

scrapy.formRequest .from_response

response 自动地从response中寻找form表单

formdata  表单数据 用户名密码

自动找到form   action地址 添加用户名和密码

callback调用直接查找的内容 和在网页中可以提取出来的数据

将cookie添加到headers中,之后也会请求成功,因为有之前携带的cookies

退出用户之后重新携带headers:cookie也不会登陆成功

相关文章

网友评论

    本文标题:Scrapy爬虫模拟登录github

    本文链接:https://www.haomeiwen.com/subject/efgroktx.html