PRO-006:实现爬取一个页面图片的小程序

PRO-006:实现爬取一个页面图片的小程序

作者: 杨强AT南京 | 来源:发表于2019-01-18 14:51 被阅读37次

PRO-006:实现爬取一个页面图片的小程序
使用Java写一个简单爬虫爬取单页面
python爬虫小项目
jsoup爬NBA图
堪称史上最强的代码采集B站全部视频！python 帮你
python爬虫(2)-抓图片
webmagic selenium 爬取动态页面
python爬虫
python-爬虫学习（文字、图片、视频）
python爬虫学习（文字、图片、视频）

本主题实现请求一个首页，并爬取首页中jpg，png图像的程序。本主题使用的技术：

requests请求页面内容的模块

正则表达式

os目录操作

cv2中图像解码与保存操作API

一、代码

import re
import requests
import os
import cv2
import numpy as np

url = 'http://www.huanqiu.com'
session = requests.Session()
response = session.get(url)
content = response.content.decode('UTF-8')
regex = r'src="(\b.*?\.jpg\b|\b.*?\.png\b|)"'
result = re.findall(regex, content, re.M)   # 多行模式

# 文件名正则表达式
img_regex = r'.+/(.+)$'
save_path = 'images'
if not os.path.exists(save_path):
    os.makedirs(save_path)
    

for img  in result:
    img_content = session.get(img)
    # print(img_content.content)
    # 解析出文件名
    result = re.findall(img_regex, img, re.M)   
    buffer = cv2.imdecode(np.frombuffer(img_content.content, np.uint8), 1)    
    # 注意不能写gif文件
    print(os.path.join(save_path,result[0]))
    cv2.imwrite(os.path.join(save_path,result[0]), buffer)     # 保存
print('---over---')

二、执行效果

环球网下载后的图片

相关文章

PRO-006:实现爬取一个页面图片的小程序
本主题实现请求一个首页，并爬取首页中jpg，png图像的程序。本主题使用的技术：requests请求页面内容的模块...
使用Java写一个简单爬虫爬取单页面
使用Java爬虫爬取人民日报公众号页面图片使用Java框架Jsoup和HttpClient实现，先看代码爬取目标...
python爬虫小项目
第一个爬虫小程序，从网络上学习的。实现了给定链接，爬取上面的图片代码如上，需要注意的是：1.AttributeE...
jsoup爬NBA图
回顾上一篇爬取NBA新闻，爬图片与新闻相差不大。文章最后提到爬取图片的Java代码，接着上篇文章开始：在图集页面...
堪称史上最强的代码采集B站全部视频！python 帮你
小编有发过b站爬取图片的视频，关注小编可以找到小编发的b站爬取图片的视频哦！跟爬取b站视频代码是差不多的哦！
python爬虫(2)-抓图片
环境：python3.6目标：爬取HTML页面的图片，保存到本地
webmagic selenium 爬取动态页面
我们都知道很多数据都可以通过爬虫进行爬取，如果我们爬取的是一个简单的页面，那么很轻松就可以实现了，如果要爬取动态页...
python爬虫
目前该代码只是实现了当前页面所有出现的url中的图片爬去，并没有做第几页的爬取。但是天狗网页实在是太慢了。。建议大...
python-爬虫学习（文字、图片、视频）
爬虫-文字爬取爬虫-图片爬取爬虫-视频爬取
python爬虫学习（文字、图片、视频）
爬虫-文字爬取爬虫-图片爬取爬虫-视频爬取

网友评论

本文标题：PRO-006:实现爬取一个页面图片的小程序

本文链接：https://www.haomeiwen.com/subject/hesndqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|PRO-006:实现爬取一个页面图片的小程序|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！