在Urllib中使用XPath

在Urllib中使用XPath

作者: 薛落花随泪绽放 | 来源:发表于2017-11-05 21:02 被阅读12次

在Urllib中使用XPath
15、web爬虫讲解2—urllib库中使用xpath表达式—B
urllib中使用xpath
Python爬取图片（使用urllib2）
Python基础库使用(一)
爬虫12：解析器lxml
python爬虫之XPath解析
xpath使用笔记
爬虫request库的get,post，https跳过验证
爬虫解析库XPath使用

在Urllib中，我们一样可以使用XPath进行信息提取，此时，需要首先安装lxml模块，然后将网页数据通过lxml下的etree转化为treedata的形式

#在Urllib模块下使用XPath表达式
import urllib.request
from lxml import etree
data=urllib.request.urlopen("http://www.baidu.com").read().decode("utf-8","ignore")
treedata=etree.HTML(data)
title=treedata.xpath("//title/text()")
if(str(type(title))=="<class 'list'>"):
    pass
else:
    title=[i for i in title]
print(title[0])

>>> len(data)
111240
>>> len(treedata)
2
>>> type(data)
<class 'str'>
>>> type(treedata)
<class 'lxml.etree._Element'>
>>> type(title)
<class 'list'>
>>> title
['百度一下，你就知道']

相关文章

在Urllib中使用XPath
在Urllib中，我们一样可以使用XPath进行信息提取，此时，需要首先安装lxml模块，然后将网页数据通过lxm...
15、web爬虫讲解2—urllib库中使用xpath表达式—B
【百度云搜索，搜各种资料:http://www.81ad.cn】在urllib中，我们一样可以使用xpath表达...
urllib中使用xpath
Python爬取图片（使用urllib2）
上篇文章使用 XPath 提取网页信息之后，将链接中的内容下载至本地，需要使用到 urllib2 。更多见：李...
Python基础库使用(一)
python 基本库的使用（一）使用 urllib 在 Python 2 中，有 urllib 和 urllib...
爬虫12：解析器lxml
在python中，主要使用 lxml 库来进行xpath获取（在框架中不使用lxml，框架内直接使用xpath即可...
python爬虫之XPath解析
XPath 简介： XPath 是一门在 XML 文档中查找信息的语言什么是 XPath? XPath 使用路径...
xpath使用笔记
xpath学习笔记 xpath简介 xpath 用于在XML文档中通过元素和属性进行导航xpath 使用路径表达式...
爬虫request库的get,post，https跳过验证
在python3中，整合了urllib，urllib2。。。等等python3中使用urllib.request来...
爬虫解析库XPath使用
爬虫解析库XPath使用 1.XPath简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 用于...

网友评论

python爬虫学习

本文标题：在Urllib中使用XPath

本文链接：https://www.haomeiwen.com/subject/atmhmxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

python爬虫学习

热点阅读

python爬虫学习

关于我们|服务条款|联系我们|在Urllib中使用XPath|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！