08_知乎

作者: 过桥 | 来源:发表于2017-06-02 15:39 被阅读252次

简述

本节继续实现知乎关注对象用户信息,主要使用 json 解析,cookie 模拟等手段实现。

目标对象

依旧是知乎轮子哥关注对象

使用包

import codecs
import json
import time, os #定时抓取
import requests 
import datetime #精确时间

主要实现方式

Paste_Image.png

通过抓包分析,确定目标json,尝试直接抓取,返回封装错误

{'error': {'message': '请求头或参数封装错误', 'code': 100, 'name': 'AuthenticationInvalidRequest'}}

尝试直接使用已登录cookie抓取

cookies = {}

raw_cookies = '自己的key,可通过F12浏览器,查看替换'

for line in raw_cookies.split(':'):
    key,value = line.split('=', 1)
    cookies[key] = value

def download_page(url):
    return requests.get(url,cookies=cookies, headers={
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36'
    }, timeout=120).json()

返回json解析

Paste_Image.png

总结

本次实现过程中主要涉及cookie模拟(还可扩展自行实现模拟登录,获取cookie),其他递归操作、文件输出、图片另存均于之前示例一致,只能算简单复习。

Paste_Image.png

源码:
spider_www.zhihu.com_following_json

相关文章

  • 08_知乎

    简述 本节继续实现知乎关注对象用户信息,主要使用 json 解析,cookie 模拟等手段实现。 目标对象 依旧是...

  • 知乎?知乎!

    跌入坑里的人, 都是想闯出一番名堂的人, 是冲劲也好, 抑或是错误的折腾, 都是欲望的天性, 无论怎样, 皆是剑走...

  • 知乎,知乎?

    知乎当然是个非常好的平台,否则我也不会选择去那里写东西了。可是我发现很多朋友希望能在那里找到人生的答案,得到生活的...

  • 知乎知乎...知否知否...

    孵化..煅造..中医范儿青年..

  • 知乎变了?知乎没变

    文|邻章 外部投资涌入、用户规模不断提升、内部商业化探索加速,正让知乎成为了一个靶子。业界有关其用户质量、平台氛围...

  • 知乎

    你个老狐狸,不跟价值观不同的人共处,不跟生活习惯不同的人共住一室,简直是一种痛苦。以后出差自己住

  • 知乎

  • 知乎

    很多时候,是你有了责任,有了目标,才会让自己更强大,而不是自己强大了再做某事。永远让事情推些自己走才好。

  • 知乎

    总屏蔽说实话的人

  • 知乎?

    自以为能独立思考,其实还是被其他人忽悠,左右了我的思想。相机不用装肩带,iPhone后台不用清理。这些乍看上去很自...

网友评论

    本文标题:08_知乎

    本文链接:https://www.haomeiwen.com/subject/qyiefxtx.html