对网页有些了解的朋友应该都知道并不是所有网页的页面内容都在页面源码中,大多数网页源码中只有页面结构而无数据,显示的数据是通过Ajax刷新得到的。此时我们爬虫就需要通过工具获取我们访问页面是页面发出的Ajax请求,通过该请求直接得到数据即可。下面介绍通过谷歌浏览开发者工具获取Ajax请求的方式:
打开开发者工具
a.快捷键F12
b.如图所示:
点击右上角隐藏符号
点击右上角隐藏符号
选择更多工具中的开发者工具
选择更多工具中的开发者工具
c.Ctrl+Shit+l组合快捷键打开
获取Ajax请求
切换到Network中的XHR,滚动鼠标使页面发出Ajax请求,在下方即可接收到。
得到效果
在新的页面打开该请求
在新的页面打开该请求
得到页面刷新内容
得到页面刷新内容
验证所得数据
使用json在线转换格式之后验证所得内容是否为页面内容(删除标志Ajax的请求标志/**/jQuery21107596235543928755_1540470690163(和);)
在此给出一个比较好用的链接
验证结果
此时我们便得到了Ajax请求刷新出来的数据。











网友评论