美文网首页
爬取糗事百科无图段子

爬取糗事百科无图段子

作者: 狼牙战士 | 来源:发表于2017-07-11 09:08 被阅读0次

** 有需要交流的联系QQ:2544100193 **

Snip20170711_16.png

代码

from urllib import request
import re
req = request.Request('https://www.qiushibaike.com/8hr/page/3/?s=4998909')
req.add_header('User-Agent','Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12) AppleWebKit/602.1.50 (KHTML, like Gecko) Version/10.0 Safari/602.1.50')
with request.urlopen(req) as f:
    print('Status:',f.status,f.reason)
    for k,v in f.getheaders():
        print('%s:%s'%(k,v))
    html = f.read().decode('utf-8')
    re_x = re.compile(r'<span>.*?</span>')
    content = re.findall(re_x,html)
    for item in content:
        if not re.search("img",item):
            print(item)

查看网页源码

Snip20170711_15.png

打印结果

Snip20170711_14.png

相关文章

网友评论

      本文标题:爬取糗事百科无图段子

      本文链接:https://www.haomeiwen.com/subject/jtyphxtx.html