2.Python 爬虫 happy一下

作者: Bllose | 来源:发表于2019-07-07 11:39 被阅读0次

2.Python 爬虫 happy一下
Python3爬虫抓取东方财富网股票数据并实现MySQL数据库存
爬虫介绍
如何愉快的使用concurrent.futures
happy一下
01.python 注释&变量&基本数据类型
教你实现python爬虫平台的架构和框架的选型一一
下班了，happy一下……
用requests和正则表达式爬取豆瓣新书的信息
反虫与反爬虫二三事

看图说话。附带源码。

感兴趣的可以拷过去，然后修改“print(alt +" : " + url)”, 想干什么干什么。。（●>∀<●）

程序截图

import urllib.request# 用于发送http请求，获取网页信息

from bs4import BeautifulSoup# 用于解析网页

import time# 用于控制访问速度

# 1、获取网页，分析想获取的数据规则

# 2、通过如上规则，使用BeautifulSoup批量获取

# 3、通过如上规则，遍历整个网站的每一个页面

urlPreFix ="https://www.sex.com/"

targetUrl = urlPreFix

# 用于提取资源目标url

def geturls(target):

target = BeautifulSoup(target, 'html.parser')

for imgin target.find_all('img', src='/images/t.png'):

alt = img.attrs['alt']

url = img.attrs['data-src']

print(alt +" : " + url)

counter =1

while counter <57:

print('当前执行URL:' + targetUrl)

html = urllib.request.urlopen(targetUrl)

geturls(html)

counter +=1

targetUrl = urlPreFix +"/?page=" +str(counter)

print('休眠5秒...')

time.sleep(5)

2.Python 爬虫 happy一下
看图说话。附带源码。感兴趣的可以拷过去，然后修改“print(alt +" : " + url)”, 想干什么干...
Python3爬虫抓取东方财富网股票数据并实现MySQL数据库存
1. 环境： windows10 python3 mysql 5.7 2.Python爬虫抓取网页数据并保存到本地...
爬虫介绍
1.什么是爬虫一段自动抓取互联网信息的程序，从互联网上抓取对于我们有价值的信息。 2.Python爬虫架构 Py...
如何愉快的使用concurrent.futures
use concurrent.futures on the happy way 写在前面最近写爬虫用多线程和...
happy一下
今天朋友过生日，跟大家一起出来玩，感觉还挺开心的，也难得有这样的机会。通过朋友之间的交流，感觉也可以学到很多。比...
01.python 注释&变量&基本数据类型
1.python 注释 2.python 变量
教你实现python爬虫平台的架构和框架的选型一一
首先来看一下一个爬虫平台的设计，作为一个爬虫平台，需要支撑多种不同的爬虫方式，所以一般爬虫平台需要包括 1、爬虫规...
下班了，happy一下……
期末来临，课程全部结束，进入紧张的复习中，白天上班满脑子想的都是怎样让孩子们听懂，理解，会灵活变通运用，真的是绞尽...
用requests和正则表达式爬取豆瓣新书的信息
最近在看崔庆才老师的爬虫视频，这里借鉴一下视频的代码做一个豆瓣新书的爬虫，主要是熟悉一下爬虫的流程，不用解析库是想...
反虫与反爬虫二三事
爬虫，反爬虫，反反爬虫……魔高一尺，道高一丈。无穷无尽的进化抗争史。入门级反爬虫：验证一下Headers里面的一...