美文网首页
07、BeautifulSoup库详解

07、BeautifulSoup库详解

作者: 即将拥有八块腹肌的程序猿 | 来源:发表于2019-08-13 19:30 被阅读0次

1、什么是BeautifulSoup?

灵活又方便的网页解析库,处理高效、支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取。

2、安装方式

pip3 install beautifulsoup4

3、用法详解

初识beautifulsoup 基本使用方法 运行结果

3.1、标签选择器

选择特性:只返回匹配的第一个结果

选择元素 获取名称 获取属性 获取内容 嵌套选择

使用contents返回所有子节点的列表

子节点和孙节点

使用children返回子节点的迭代器

子节点

使用descendants获取子孙节点的迭代器

子孙节点 获取父节点

最后会返回整个文档的内容

获取祖先节点 获取兄弟节点

3.2、标准选择器

只使用标签选择器有时候是远远不够的,所以可以使用标准选择器。

标准选择器 第一个参数 嵌套使用 第二个参数 attrs的等价方式

返回text的内容:

第四个参数 find方法 其他类似的方法

3.3、CSS选择器

CSS选择器 嵌套选择 获取属性 获取内容

4、总结

总结

相关文章

网友评论

      本文标题:07、BeautifulSoup库详解

      本文链接:https://www.haomeiwen.com/subject/amqudctx.html