美文网首页点滴收录
20190130 数仓相关整理

20190130 数仓相关整理

作者: 佳兰小筑 | 来源:发表于2019-01-30 14:44 被阅读0次

文章内容均整理至微信公众号连岳,如有侵权,请联系删除。

你了解你的数据吗
https://mp.weixin.qq.com/s?__biz=MzUyMjI4MzE0MQ==&mid=2247483895&idx=1&sn=88e2cc3f5d523da88a8ea15a4629a3ec&scene=19#wechat_redirect

数据接入,数据的核心维度,数据质量监控

你知道自己的系统数据接入量是多少吗?
你知道数据的分布情况吗?
你知道自己常用的数据有什么隐藏的坑吗?

既然你知道系统的数据接入量,那你知道每天的数据量波动吗?波动量在多大范围内是正常情况?
你知道的数据分布情况是什么样子的?除了性别、年龄和城市的分布,还有什么分布?
在偌大的数据仓库中,哪些数据被使用最多,哪些数据又无人问津,这些你了解吗?
在最常用的那批数据中,有哪些核心的维度?有相同维度的两个表之间的数据口径是否也一样?


核心维度分布主要是指数据中那些比较重要的列的内容分布,比如说用户最基本的年龄、性别和城市信息,这是最常用的数据分布,再引申一点的话会涉及到一些业务内容,比如说各省份的人的订单情况、不同时间段男女活跃信息对比,等等。如果有用户画像表的话还应包括各种画像中的维度分布。
因此,我们来做一个大概的划分的话,那就是三部分内容:1.基础资料;2.业务行为;3.用户画像。这三部分能帮助我们来理解用户是什么样子的?更好的懂业务,能促进更深入地理解数据。




相关文章

  • 20190130 数仓相关整理

    文章内容均整理至微信公众号连岳,如有侵权,请联系删除。 你了解你的数据吗https://mp.weixin.qq....

  • 数仓相关文章索引(1)

    基本常识 数据仓库的源数据类型 数据仓库的多维数据模型 BI数据仓库数据分层 即席查询 算法架构 浅谈数据仓库的基...

  • 今日学习思路(1.12)

    一、关于数仓的理解: 数仓就是从基础数据里拆出一组数据进行单独的管理,所有跟统计相关的内容都从这个维度去取,效率高...

  • 大数据数仓经典最值得阅读书籍推荐

    从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一...

  • 数据仓库(13)大数据数仓经典最值得阅读书籍推荐

    从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一...

  • 大数据入门(一)—— 数据仓库(数仓)基本概念

    前言: 最近做需求的时候,涉及到了数仓相关的知识。简单介绍下数仓的一些基本概念。以及,了解下大数据开发的一些基本流...

  • 数仓与数仓建模

    一、数据仓库 **英文名称为Data Warehouse,可简写为[DW]或DWH。是为企业[https://ba...

  • 数仓建设规范

    本文将全面讲解数仓建设规范,从数据模型规范,到数仓公共规范,数仓各层规范,最后到数仓命名规范,包括表命名,指标字段...

  • 美团实时数仓建设

    实时数仓和传统数仓的对比 实时数仓和传统数仓的对比主要可以从四个方面考虑:●第一个是分层方式,离线数仓为了考虑到效...

  • 成品仓的管理诊断201706191103

    成品仓的管理异常,简单总结如下: 1、现象: 成品仓的入库数、发货数、客收数、退货数、退库数不准 2、后果: 班组...

网友评论

    本文标题:20190130 数仓相关整理

    本文链接:https://www.haomeiwen.com/subject/zqccsqtx.html