美文网首页
一种基于实时大数据的图指标解决方案

一种基于实时大数据的图指标解决方案

作者: 京东云开发者 | 来源:发表于2023-03-21 12:47 被阅读0次

作者:京东科技 尚建平

1. 现有技术

在电商、金融风控领域,使用图来建模,将大量的人员和事件编织成一张庞大的图关系网络,构建图指标来识别异常人员和群体风险行为,目前图指标现有实现方式是基于离线数据或t+1数据构建图关系网络,图指标由业务人员或需求人员根据业务需要提出具体需求由开发人员临时开发、测试、部署、上线。

2. 现有技术的缺点

第一,图指标时效性差,无法实时更新图关系数据,在某些时效性强的场景下图指标不可用。

第二,创建、修改图指标流程繁琐,业务及需求人员无法单独实现,需开发人员临时开发。

第三,图指标相关元数据没有统一管理及分类,无法查看、修改、复用、追溯。

3. 本发明技术方案

3.1 本发明所要解决的技术问题(即发明目的)

第一,接收实时大数据流,实时构建图关系网络,图指标可基于实时图关系数据查询。

第二,业务及需求人员对图指标可视化创建、测试、上线,无需开发人员参与。

第三,图指标相关元数据进行统一管理及分类,可灵活查看、修改、复用、追溯。

3.2 本发明的完整技术方案

3.2.1 系统原理图、结构说明图或流程图

31.png

图1-系统原理图

3.2.2 技术方案详细描述

如图2-系统流程图所示,方案详细描述如下:

步骤1:实时图指标平台获取用户设计图指标相关的元数据信息,包括数据源、图模型、图指标等元数据。数据源信息描述了接入数据源类型和数据源字段信息,图模型信息描述图关系网络的构建模型及构建数据的字段映射信息,图指标信息描述图指标计算逻辑信息。

步骤2:实时图指标平台根据数据源信息接收外部实时流数据。数据源主要是可构建图关系网络的人员及事件信息,包括用户登入、注册、订单交易、风险决策等数据源。

步骤3:实时图指标平台将接收的实时流数据进行清洗、转换、分流。将接收的数据源中无效的数据及非法数据清除,并根据不同图模型数据要求对数据进行转换、分流。

步骤4:实时图指标平台根据图模型信息及数据字段映射信息,将实时数据流转换生成可插入图关系数据的类SQL。将人员及事件信息转换成用类SQL表示的用户、设备等节点及用户与设备节点之间关联的登入、注册等边数据。

步骤5:实时图指标平台通过对nebula图数据库各图空间执行类SQL将图关系数据插入更新至nebula图数据库。通过实时插入更新类SQL表示的节点及关联边数据,将大量的人员和事件编织成一张庞大的图关系网络,并实时更新。

步骤6:实时图指标平台接收外部系统查询图指标结果请求及入参,查询用户可视化配置的图指标相关元数据信息。如查询用户x近30天内使用过的所有设备关联的注册金白条用户数量。

步骤7:实时图指标平台将可视化配置的图指标元数据信息转换成用类SQL表示的图指标计算逻辑。如从用户x节点查找近30天登入、注册等边关联出的所有设备,再反向查找这些设备被多少注册过金白条的用户使用过。

步骤8:实时图指标平台通过对nebula图数据库执行查询类SQL,获取图指标查询结果,根据业务情况调整图指标阈值,识别异常人员和群体风险行为。如用户x近30天内使用过的所有设备关联的注册金白条用户数量大于5时,那么识别出用户x是风险用户。

32.png

图2-系统流程图

3.3 本发明希望保护的技术创新点

本发明通过接收实时大数据流,实时构建图关系网络,实现图指标数据实时查询。

本发明通过可视化配置维护图指标相关信息,实现图指标及相关元数据统一管理、快速部署上线。

相关文章

  • 实时计算无线数据分析

    案例与解决方案汇总页:阿里云实时计算产品案例&解决方案汇总 本文为您介绍实时计算在无线数据分析中的应用。阿里云实时...

  • 实时数仓|基于Flink1.11的SQL构建实时数仓探索实践

    实时数仓主要是为了解决传统数仓数据时效性低的问题,实时数仓通常会用在实时的OLAP分析、实时的数据看板、业务指标实...

  • 如何构建可视化的营销数据大屏?

    数据可视化大屏是数据展现最直观最全面的方式之一,对于企业重要数据指标的展示和实时数据的监测,是目前极佳的方案。 对...

  • 文件查找locate和find 命令

    一、locate 命令基本用法:locate是一种基于数据库的模糊、非实时文件查找命令,它不是基于磁盘的,所以需要...

  • 系统间交互--传递信息

    实时性要求高的,使用http接口,实时性要求不高的,,可以用中间数据库, http接口就是一种基于http服务的a...

  • 图数据库简介

    图数据库简介 ​ 图数据库(Graph Database)是基于图论实现的一种新型NoSQL数据库。它...

  • 为什么要做数据服务

    数据实时化(实时同步和流式处理能力) 数据资产标准化通过构建完备的元数据体系,各维度指标,形成全链路的元数据管理体...

  • OGG数据同步

    一 、安装OGG OGG 是一种基于日志的结构化数据复制软件 OGG 能够实现大量交易数据的实时捕捉,变换和投递,...

  • 生产实践 | 基于 Flink 的短视频生产消费监控

    本文详细介绍了实时监控类指标的数据流转链路以及技术方案,大多数的实时监控类指标都可按照本文中的几种方案实现。 短视...

  • 极简数据看板设计方案

    数据看板是目前企业比较能接受的指标查看解决方案,指标看板具有整体美感、指标数据清晰、自定义化较强、变更快捷等优势。...

网友评论

      本文标题:一种基于实时大数据的图指标解决方案

      本文链接:https://www.haomeiwen.com/subject/xddmrdtx.html