正则>>豆瓣电影排行榜

作者: 郭祺迦 | 来源:发表于2018-09-27 12:41 被阅读0次

正则>>豆瓣电影排行榜
好看的印度电影豆瓣高分近年，印度十佳电影排行榜,不可错过的印度电
《肖申克的救赎》——经典屏幕23年的秘密
【爬虫】使用scrapy模拟登录豆瓣并爬取最新电影
国产电影经典之作，至今无人超越
小爬虫之爬取豆瓣电影排行榜
爬取豆瓣电影TOP250 - 完整示例代码
Python爬虫解析网页的三种方法，lxml、Beautiful
Python爬虫之解析网页！
这十大美食电影, 豆瓣可没有恶评, 不信请自鉴(内含观影地址)

import urllib.request

import urllib.parse

def main():

# 开始页码

start_page = int(input("开始页码:"))

# 结束页码

end_page = int(input("结束页码:"))

# 处理url

url = 'https://movie.douban.com/top250?'

# 每页显示的个是25个

for page in range(start_page, end_page + 1):

request = handle_request(url, page)

handle_response(request)

# 处理url

def handle_request(url, page):

page = (page - 1) * 25

data = {

'start': page

}

# 对data数据进行处理

data = urllib.parse.urlencode(data)

# 拼接路径

url += data

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'

}

request = urllib.request.Request(url=url, headers=headers)

return request

def handle_response(request):

response = urllib.request.urlopen(request)

html = response.read().decode("utf8")

print(html)

if __name__ == '__main__':

main()

正则>>豆瓣电影排行榜
import urllib.request import urllib.parse def main(): #...
好看的印度电影豆瓣高分近年，印度十佳电影排行榜,不可错过的印度电
好看的印度电影豆瓣高分近年，印度十佳电影排行榜,不可错过的印度电影排行榜印度电影排行前10名：《偶滴神啊》、《误...
《肖申克的救赎》——经典屏幕23年的秘密
《肖申克的救赎》，一部1994年的电影，常年占据经典电影排行榜的一席之位！豆瓣评分：9.6分…各种必看电影排行榜，...
【爬虫】使用scrapy模拟登录豆瓣并爬取最新电影
任务：使用scrapy爬取豆瓣电影排行榜页最新电影10个，包含名字，评分，链接。环境：Python 2.7.9 ...
国产电影经典之作，至今无人超越
你知道在豆瓣上评分最高的国产电影是哪部吗?就是这部由七十多万人打出9.5分的电影，豆瓣电影排行榜排行第二。如果...
小爬虫之爬取豆瓣电影排行榜
1.技术路线 python 3.6.0 scrapy 1.4.0 2.任务爬取豆瓣电影排行榜电影相关信息 2.1...
爬取豆瓣电影TOP250 - 完整示例代码
目标网站：https://movie.douban.com/top250爬取目的：豆瓣电影排行榜前250的电影的电...
Python爬虫解析网页的三种方法，lxml、Beautiful
常用的类库为lxml，BeautifulSoup，re(正则) 以获取豆瓣电影正在热映的电影名为例,url='ht...
Python爬虫之解析网页！
常用的类库为lxml,BeautifulSoup,re(正则) 以获取豆瓣电影正在热映的电影名为例,url='ht...
这十大美食电影, 豆瓣可没有恶评, 不信请自鉴(内含观影地址)
豆瓣电影评分，素来是我等凡夫俗子找电影的一大利器，哪怕是站在电影院售票队伍中，还是要抽空扫一眼豆瓣排行榜。所谓恶评...