美文网首页
使用requests,lxml爬取百思不得姐

使用requests,lxml爬取百思不得姐

作者: PaparAzzii | 来源:发表于2017-08-03 14:14 被阅读0次

# -*- coding:utf-8 -*-

import requests

import smtplib

from email.mime.text import MIMEText

from email.header import Header

from lxml import etree

#不得姐

url = "http://www.budejie.com/text/"

page = requests.get(url)

html = page.text

selector = etree.HTML(html)

# 第三方 SMTP 服务

mail_host="smtp.163.com"  #设置服务器

mail_user="########"    #用户名

mail_pass="######"  #口令

#邮箱

sender = '########@163.com'

receivers = ['#########@qq.com']

#头像

uimg = selector.xpath('//div[@class="u-img"]/a/img/@src')

#昵称

uname = selector.xpath('//a[@class="u-user-name"]/text()')

#内容

ucontent = selector.xpath('//div[@class="j-r-list-c-desc"]/a/text()')

#发邮件

message = MIMEText('不得姐更新提示', 'plain', 'utf-8')

message['From'] = Header("不得姐", 'utf-8')

message['To'] =  Header("我的APP", 'utf-8')

subject = '不得姐更新'

message['Subject'] = Header(subject, 'utf-8')

#一旦从不得姐获取不到信息,立即发送邮件

if not uimg or uname or ucontent:

try:

smtpObj = smtplib.SMTP()

smtpObj.connect(mail_host, 25)    # 25 为 SMTP 端口号

smtpObj.login(mail_user,mail_pass)

smtpObj.sendmail(sender, '#########@163.com', message.as_string())               ##这里本来应该填写receviers,但是发现发送失败,可能是因为QQ邮箱的smtp没有启动。所以还是让邮箱自己发给自己吧。

except smtplib.SMTPException:

print "error"

相关文章

网友评论

      本文标题:使用requests,lxml爬取百思不得姐

      本文链接:https://www.haomeiwen.com/subject/ybvulxtx.html