美文网首页
爬虫(Xpath)

爬虫(Xpath)

作者: 小明坐地铁 | 来源:发表于2018-11-22 19:55 被阅读0次

什么是XPath?

  • XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。

XPath 开发工具
1.开源的XPath表达式编辑工具:XMLQuire(XML格式文件可用)
2.Chrome插件 XPath Helper
3.Firefox插件 XPath Checker

选取节点: XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

xml:是一个可扩展的标记语言,语法和html和相像,里面的节点可以自己定义,被设计的目的用来进行数据的传输和保存

用法:使用etree.HTML可以将html文档源码,转为一个element对象,然后才能使用xpath语法

最常用的路径表达式:
notename :查找出html所有标签名为notename的节点
/ : 表示从根节点开始查找(相对性的)
//: 从任意位置匹配出你想要的节点
. :选取当前节点
.. :选取当前节点的父节点
@ : 表示选择属性
text() :取标签的文本内容
notename[1] : 取标签名为notename的第一个节点
notename[last()] : 取标签名为notename的最后一个节点

相关文章

  • 爬虫解析库XPath使用

    爬虫解析库XPath使用 1.XPath简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 用于...

  • Python爬虫(十三)_案例:使用XPath的爬虫

    本篇是使用XPath的案例,更多内容请参考:Python学习指南 案例:使用XPath的爬虫 现在我们用XPath...

  • XPath轴方法 - 捕捉
  • 标签内容但不捕获
  • 下的<
  • XPath轴(XPath Axes)可定义某个相对于当前节点的节点集: 1. 爬虫xpath遇到的问题:抓取

  • 爬虫系列(十):使用xpath做爬虫

    案例:使用XPath的爬虫 现在我们用XPath来做一个简单的爬虫,我们尝试爬取某个贴吧里的所有帖子,并且将该这个...

  • xpath 资料

    xpath路径表达式笔记 学爬虫利器XPath,看这一篇就够了 有感4月份,看过的python基础和爬虫相关的知识...

  • 爬虫 xpath

    一:回顾正则 find、rfind、replace 字符串处理函数只能处理固定的字符串baby hello 不能处...

  • 爬虫(Xpath)

    什么是XPath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可...

  • 爬虫xpath

    什么是xpath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可...

  • 爬虫 - XPath

    哎,还是要整理一下这枯燥的基础知识,,,没办法,逃不掉喽 我们回顾一下网页爬虫的整个思路: 先爬取整个网页,也就是...

  • 爬虫(xpath)

    什么是XPath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可...

网友评论

      本文标题:爬虫(Xpath)

      本文链接:https://www.haomeiwen.com/subject/csdrqqtx.html