美文网首页
猫眼电影Top100数据爬取,使用requests和xpath

猫眼电影Top100数据爬取,使用requests和xpath

作者: 和菜头编程 | 来源:发表于2021-06-07 23:35 被阅读0次

记录一下学习python爬虫的入门例子

1、爬取的网页源代码如下:

2、代码部分如下,只爬取了电影名字,如果要爬取其他数据,可以自行补上

import requests

from lxmlimport etree

url='https://maoyan.com/board/4'

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

req=requests.get(url=url,headers=headers)

print(req.text)

tree=etree.HTML(req.text)

#爬取第一个电影的名字

element=tree.xpath('//dl[@class="board-wrapper"]/dd[1]//p[@class="name"]/a/@title')

print(element)

#爬取第一页的所有电影名称

name=tree.xpath('//p[@class="name"]/a/@title')

print(name)

声明:本代码仅用于个人学习,不用于商业用途

相关文章

网友评论

      本文标题:猫眼电影Top100数据爬取,使用requests和xpath

      本文链接:https://www.haomeiwen.com/subject/dbgnehtx.html