美文网首页
xpath 如何获得script标签中的html内容

xpath 如何获得script标签中的html内容

作者: 隐墨留白 | 来源:发表于2019-06-12 21:38 被阅读0次

一般来说在HTML文本中<script></script>标签内都是JS代码,但是也有在script标签中写入html代码的。今天就遇到了这个问题。搞得很是懵逼。其实也不是特别难,就是脑子转不过弯。
script同样是HTML中的一个标签,可以直接取得它的内容。但是不能直接用xpath获取script下的标签内容。

#先解析获取到的网页源码
html = etree.HTML(response)
#获取script的内容,获得的结果是str类型
data = html.xpath('//script[@class="xxxx"]\text()')[0]
#或者 data = html.xpath('//script[@id="xxxx"]\text()')[0]
#再次对获取到的html内容进行解析
data_html = etree.HTML(data)
#ok ,现在可以对内容进行xpath匹配了

相关文章

  • xpath 如何获得script标签中的html内容

    一般来说在HTML文本中 标签内都是JS代码,但是也有在script标签中写入html代码的。今天就遇到了这个问...

  • JavaScript

    1.JavaScript script标签script标签可以放在html中的任何地方,一般建议放在head标签中...

  • JS笔记-001-基本实现

    HTML 中的脚本必须位于 标签之间。 脚本可被放置在 HTML 页面的...

  • 2.在HTML中使用JavaScript

    1. script元素 向HTML中插入JavaScript的主要方法,就是使用script标签 HTML 4.0...

  • 09-数据提取-xpath和lxml模块

    XPath是在HTML/XML中查找信息的语言lxml模块 XPath xpath节点关系 每个xml标签都叫做节...

  • JavaScript高级程序设计读书笔记(二)之在HTML中使用

    向HTML文件中插入js就要使用