美文网首页JSON大前端node
服务端nodejs抓取jsonp接口数据

服务端nodejs抓取jsonp接口数据

作者: 天問_专注于大前端技术 | 来源:发表于2022-04-07 16:35 被阅读0次

众所周知,jsonp 接口返回的是一段 js 脚本,在浏览器中使用 script 标签引入、加载成功后,会直接执行其中的 callback 方法,以参数的形象直接返回真正有用的接口数据,以此达到跨域请求的目的。但是如果在非浏览器环境(node执行环境)中怎么来抓取呢,本文就主要介绍一下,服务端nodejs抓取jsonp接口数据 的思路方法和踩过的坑。

Node+Axios Jsonp

前言

出于好奇,最近在研究使用 node 程序分析股票的数据,看看能不能找到一些规律。
但前提是要获取一批数据,所以查看了几个相关的网站平台,通过开发者工具的 network 查看,其中接口数据基本都是使用 jsonp 格式的。

温馨提示: 不要过度频繁爬取数据,可能涉及网络安全问题。

方法思路

  1. node 服务端使用 axios 获取 jsonp 返回的内容
  2. 使用 typeof 查看返回内容的类型
  3. 解析 jsonp 返回的内容、执行其中的 callback 方法

关键在于这第三步,在 node 环境中如何动态的执行这一段 String 类型的代码。

Node环境动态执行脚本

  1. eval()

直接调用,使用本地作用域。

function test() {
  let x = 10, y = 20;
  let sum = eval('x + y')
  console.log(sum);  // 30
}
  1. Function

eval 不同的是,Function 创建的函数只能在全局作用域中运行。
test() 执行会报错:ReferenceError: x is not defined

// 报错
function test() {
  let x = 10, y = 20;
  let fn = new Function('return x + y')
  let sum = fn()
  console.log(sum) // ReferenceError: x is not defined
}

// 正常执行
global.x = 10
global.y = 20
function test() {
  let fn = new Function('return x + y')
  let sum = fn()
  console.log(sum) // 30
}
  1. vm.runInThisContext (推荐)

vmnode 的核心模块,vm 可以使用 v8Virtual Machine contexts 动态地编译和执行代码,而代码的执行上下文与当前进程隔离。
被执行的代码无法获取本地作用域,只能在当前的 global 对象的上下文中编译并执行 code

const vm = require('vm')

global.x = 10
global.y = 20
function test() {
  let sum = vm.runInThisContext('x + y')
  console.log(sum) // 30
}

完整代码实现

// index.js

const vm = require('vm')
const axios = require('axios')

// 在 global 对象上挂载对应的 callback 方法
global.jQuery11230971606670044967_1649312313646 = function(res) {
  // jsonp 接口返回的数据
  console.log(res)
  // do something
}

async function getData() {
  let { data } = await axios({
    url: 'https://push2.eastmoney.com/api/qt/clist/get?cb=jQuery11230971606670044967_1649312313646&fid=f62&po=1&pz=10&pn=1&np=1&fltt=2&invt=2&fs=m%3A90+t%3A3&stat=1&fields=f12%2Cf14%2Cf2%2Cf3%2Cf62%2Cf184%2Cf66%2Cf69%2Cf72%2Cf75%2Cf78%2Cf81%2Cf84%2Cf87%2Cf204%2Cf205%2Cf124&ut=b2884a393a59ad64002292a3e90d46a5'
  })
  
  // 查看返回内容的类型
  console.log(typeof data)
  
  // 执行 callback
  vm.runInThisContext(data)
}

// 调用抓取数据的方法
getData()

特别提醒:
浏览器环境与 Node 执行环境挂载全局对象是有区别的。
在浏览器环境中,全局作用域可以使用 var 来声明一个变量或方法,会自动挂载到 window 对象上;
但是在 Node 环境中,每个文件或者模块,都会被封闭在一个单独的作用域,因此不管在哪里声明的变量,相对于当前模块或文件,都是在局部作用域,不会自动挂载到全局 global 对象中,如果要使用必须手动去挂载。

欢迎访问:天问博客

相关文章

  • 服务端nodejs抓取jsonp接口数据

    众所周知,jsonp 接口返回的是一段 js 脚本,在浏览器中使用 script 标签引入、加载成功后,会直接执行...

  • 用JSONP抓取数据

    jsonp,vue,前端很多网站都是用jsonp传输数据的,可以抓取这些数据。提供一个封装好的jsonp方法。首先...

  • 2018-06-27

    JSONP 应用 服务端JSONP格式数据 假设客户期望返回JSON数据:["customername1","cu...

  • 实现跨域的方法

    不同域下的接口获取数据,可以使用jsonp和cors。(ie10以下可以使用jsonp获取数据) jsonp实现跨...

  • vue音乐APP03:jsonp promise化

    1.JSONP的用途和原理 使用JSONP主要是目的通过动态创建Script,动态拼接url,进而抓取数据,实现跨...

  • nodeJS数据抓取

    工具 chokidar 文件监听 shelljs 执行命令行 cheerio html页面解析 非常nice的解析...

  • 免费的HTTP接口代理,可解决跨域问题

    可以做到 让不支持跨域的远程数据接口支持跨域。让不支持JSONP的远程数据接口支持JSONP(添加参数&callb...

  • 【Linux】Linux网络抓包工具tcpdump和ngrep简

    本文主要参考Linux tcpdump命令详解ngrep命令 做服务端开发时经常需要抓取服务器接口的数据包,查看接...

  • Vue与服务端通讯

    Vue.js 本身没有提供与服务端通讯的接口,但是通过插件的形式实现了基于 Ajax、Jsonp 等技术的服务端通...

  • React 获取数据 axios插件 fetch-jsonp插件

    react获取服务器APi接口的数据: 远程测试API接口: get请求: jsonp请求地址:

网友评论

    本文标题:服务端nodejs抓取jsonp接口数据

    本文链接:https://www.haomeiwen.com/subject/pmkssrtx.html