select详解
Document 继承自 Element 类。select方法将返回一个Elements集合。
1.通过标签名来查找:
测试代码:
select写法:
下面的例子都按照上面的格式来写,就不进行重复的标注了。
2.通过id来查找:
3.通过class名来查找:
4.利用标签内属性名查找元素:
5.利用标签内属性名前缀查找元素:
6.利用标签内属性名+正则表达式查找元素
对正则表达式不了解的同学下去一定要学习正则表达式哦,因为它在爬虫中可是很重要的。
7.利用标签文本包含某些内容来查找:
8.利用标签文本包含某些内容+正则表达式来查找:
当然select还有其他强大的功能,如果对select感兴趣的同学可以查看select API,我只是列出了获取网页特定内容所需要的select的基本语法,基本上对于大部分的爬虫需求来说已经足够了。
下来给大家展示一个使用select获取特定元素值的代码:
上面的代码可以看到select的用法与前面讲的没有什么区别。对于Element 这个类来说,如果我们要获取一个标签中的属性值或文本内容可以这样来做:










网友评论