1、什么是BeautifulSoup?
灵活又方便的网页解析库,处理高效、支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取。
2、安装方式
pip3 install beautifulsoup4
3、用法详解



3.1、标签选择器
选择特性:只返回匹配的第一个结果





使用contents返回所有子节点的列表

使用children返回子节点的迭代器

使用descendants获取子孙节点的迭代器


最后会返回整个文档的内容


3.2、标准选择器
只使用标签选择器有时候是远远不够的,所以可以使用标准选择器。





返回text的内容:



3.3、CSS选择器




4、总结

网友评论