美文网首页Python中文社区大数据 爬虫Python AI Sql
如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

作者: 程序员夏天 | 来源:发表于2020-08-07 16:54 被阅读0次

环境:windows python3.7

文末有最新python资料下载地址以及视频

思路:

1、先选取你要爬取的电影

2、用vip解析工具解析,获取地址

3、写好脚本,下载片断

4、将片断利用电脑合成

需要的python模块:

##第一个模块不要安装,第二个模块需要安装

1、from multiprocessing import Pool

2、import requests

##模块安装方法

用windows命令行终端

pip install requests

一、先选取你要****爬****的电影,本例随便找了个VIP电影,复制地址

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

二、用vip解析工具解析,获取地址

** (一)进行上网搜索,点击VIP解析**

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

(二)、粘贴电影地址,点击播放

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

(三)、按下F12或者右击点检查,进入开发者工具界面,点击网络,复制地址

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

三、写好脚本,利用爬虫下载****片断

##描述:该脚本目前适合下载爱奇艺,腾迅视频VIP视频##作者:小刘##电话:有事请写评论##注意:只适全python爬虫的学习者,不适合专门去看电影的爱好者##导入的两个模块,其中requests模块需要自行下载from multiprocessing import Poolimport requests##定义一个涵数def demo(i):    ##定义了一个url,后面%3d就是截取后面三位给他加0,以防止i的参数是1的时候参数对不上号,所以是1的时候就变成了001    url="https://vip.okokbo.com/20180114/ArVcZXQd/1000kb/hls/phJ51837151%03d.ts"%i    ##定义了请求头信息    headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36"}    ##构建自定义请求对象    req=requests.get(url,headers=headers)    ##将文件保存在当前目录的mp4文件中,名字以url后十位数起名    with open('./mp4/ {}'.format(url[-10:]), 'wb') as f:        f.write(req.content)##程序代码的入口if __name__=='__main__':    ##定义一个进程池,可以同时执行二十个任务,不然一个一个下载太慢    pool = Pool(20)    ##执行任务的代码    for i in range(100):        pool.apply_async(demo, (i,))        pool.close()    pool.join()

** 四、将片断利用电脑合成**

(一)、复制电影存放的路径

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

(二)、用进入windows命令行模式,粘贴地址

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

** (三)、复制该目录下所有以.ts结尾的文件,复制成一个文件*

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

(四)、进行合并

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

(五)、进行验证

如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

热文推荐:

全网首发!python学习路线项目案例整合

image.png

相关文章

网友评论

    本文标题:如何利用python爬虫爬取各大网站VIP电影?小白都能看懂

    本文链接:https://www.haomeiwen.com/subject/efzfdktx.html