美文网首页
常用的xpath

常用的xpath

作者: tkpy | 来源:发表于2018-08-01 17:28 被阅读0次

xpath的模糊查询

//div[contains(text(),"history-loadmore") and not(contains(@class, "history-loadmore hide"))]

选取同级节点

# 同级节点下个节点
//div[@class='listpage']/span/following-sibling::a[1]
# 同级节点上个节点
//div[@class='address-row']/table/tbody/tr[@id='submitTime']/preceding-sibling::tr[1]

获取父级节点

//div[@class='page-box house-lst-page-box']/parent::div

xpath定位

# 大于1
//li[position()>1]
# 倒数第一个
//li[last()]
# 倒数第二个
//li[last()-1]

列表时间筛选

//span[@class='light' and number(translate(text(),'更新时间-',''))>20171204]/../../../../h3/a/@href

xpath获取标签

    content_html = html.xpath("//div[@class='show-content-free']")
    content_html = etree.tostring(content_html[0], encoding='UTF-8', pretty_print=False, method='html')
    content_html = content_html.decode()

xpath的string()方法

content_text = html.xpath("string(//div[@class='show-content-free'])")[0]

使用xpath获取标签

        content_html = response.xpath("//div[@class='txt_con']")
        content_html = etree.tostring(content_html[0], encoding='UTF-8', pretty_print=False, method='html')
        content_html = content_html.decode()

requests获取标签的所有内容

        content_text = response.xpath("//div[@id='ctrlfscont']")
        content_text = content_text[0].xpath('string(.)').encode('utf-8').strip().decode()

相关文章

  • xpath , beautifulsoup4 , pyquery

    xpath xpath 语法 xpath的使用: 常用的语法: 使用bs4 文档解析器常用的两种 获取文本内容 p...

  • XPath

    Xpath常用规则

  • XPath Helper使用

    XPath常用插件:XPath Helper XPath Helper是一个浏览器插件,能在element中定位元...

  • XPath 用法总结

    xpath常用方法 常用定位元素的方法 一些常用函数

  • selenium使用Xpath+JavaScript+jQuer

    我们先了解一下Xpath基础语法,如下: xpath常用函数: 一.Xpath的定位方法(复制路径的定位经常会经常...

  • 常用的xpath

    xpath的模糊查询 选取同级节点 获取父级节点 xpath定位 列表时间筛选 xpath获取标签 xpath的s...

  • xpath

    什么是xpath? 什么是xml? xpath语法的路径表达式(常用) bs4_usod(Beautifulsou...

  • 2019-01-18srcrapy框架xpath和css选择器语

    python 爬虫: srcrapy框架xpath和scc选择器语法 Xpath基本语法 一、常用的路径表达式: ...

  • XPATH

    XPath常用规则/ 从当前节点选取直接子节点// ...

  • XPath 的常用方式

    我们知道 xpath 是一门语言,它可以在 XML 文档中查找信息,并且支持HTML,通过元素和属性行为提取信息,...

网友评论

      本文标题:常用的xpath

      本文链接:https://www.haomeiwen.com/subject/qsmrvftx.html