美文网首页Java 杂谈python爬虫
20行代码的爬虫爬取1000张车模

20行代码的爬虫爬取1000张车模

作者: 躺着写代码 | 来源:发表于2019-07-30 00:58 被阅读35次

近日,团队内部需要做一次爬虫技术的分享,决定手写一个美女图片爬取程序。第一次写文章,希望大家能够多多指教,也能够相互学习。立帖为证!!!


目的:

1、提高大家的学习兴趣

2、展现出自我强大编程功底(哈哈)

技术:

1、java8  (stream、Lambda)

2、webmagic爬虫框架

3、xpath、jsoup文档解析


源码:

说明:

1、startUrl为7160网站的分类入口地址

2、dir是你需要存放路径

3、目录下拆分32子目录,避免单个文件数太多

源码地址:https://github.com/jiamin13579/spider-demo

相关文章

网友评论

    本文标题:20行代码的爬虫爬取1000张车模

    本文链接:https://www.haomeiwen.com/subject/ovpwrctx.html