美文网首页
数据仓库分层

数据仓库分层

作者: 傻疯子 | 来源:发表于2021-12-03 23:15 被阅读0次
分层的目的

1.方便了解表之间的关系,可以将各层的作用明确,方便开发和使用。
2.可以减少重复开发,存放中间处理过的数据,同时也能保证数据处理的一致性。
3.出现问题时能及时定位问题,只需要修改对应作用层级,重跑当前层级和下游任务即可修复。

数仓分层思路

一般来说数仓可以分为ods、dwd、dws、app层,再加个dim层

ods层存放源数据,即将采集过来的数据原样保存。即可以是关系型数据库的数据,也可以是其他格式如json数据。

dwd层存放从ods层清洗后的数据。将各种非关系数据转换为关系型数据,同时对数据做一定规范清晰。

dws层进行轻度汇总,可以形成大宽表,也可以根据需要按一定条件进行聚合。

app层主要存处理后方便直接使用的数据。通过前期已经处理过的数据,只需要根据最终使用需要做最终处理即可。

dim层用来建立维度表。

分层和使用情况根据实际情况而定,不需要拘泥于形式,而是要方便数据开发和规范。

数仓分层命名

数仓分层有一个目的是为了方便理解和开发,那么做好数仓命名能起到关键性作用。

就最基本而言,在不同层级的数据库和表之前加上对应的层级,比如ods层就以ods_XXX命名。
person

然后可以在表明上加上相应的主题,如ods_person_XXX,也还可以实际需要在主题后面加上修饰词或者说是子主题。

然后可以在表名的最后加上表的粉表规则,比如ods_person_member_user_di,表示分区中存取的当日增量的会员用户数据。

相关文章

  • 数据仓库设计

    数据仓库--事实表 数据仓库--事实表和维度表 DW数据仓库分层模型设计 如何优雅地设计数据分层 ODS DW D...

  • 数仓相关文章索引(1)

    基本常识 数据仓库的源数据类型 数据仓库的多维数据模型 BI数据仓库数据分层 即席查询 算法架构 浅谈数据仓库的基...

  • 5000字长文分享!数据仓库的建设与框架终于有人给讲明白了

    数据仓库,这个几乎是所有大数据开发面试必问的话题。比如数据仓库的分层架构?为什么需要数据仓库建模?数据仓库建模的原...

  • 数据仓库分层

    ODS:Operation Data Store 原始数据(一般不建议全部存储,可按实际需求) DWD(数据清洗/...

  • 数据仓库分层

    分层的目的 1.方便了解表之间的关系,可以将各层的作用明确,方便开发和使用。2.可以减少重复开发,存放中间处理过的...

  • 数仓实战01:数仓分层

    1.为什么分层 1.1 数仓分层: 1.2 为什么分层 2.数据集市和数据仓库概念 3.数仓命名规范 3.1 表命...

  • 数据仓库系列10- 数据仓库规范

    一. 数据模型架构原则 1.1 数据仓库分层 分层的好处: 清晰数据结构; 数据血缘追踪; 减少重复开发; 数据关...

  • 浅谈数仓建设中的分层

    作者介绍 数据仓库@唐刚 “数据人创作者联盟”成员。 01数仓为什么要分层 数仓分层的原因也即是分层的好处体现在下...

  • 数据仓库模型分层

    PS:无法复制表格样式,只能截图了

  • 数据仓库分层架构

    数据仓库只是中间集成化数据管理的一个平台。 源数据ODS 日志,数据库数据,文档数据,其他 数据无任何更改,不对外...

网友评论

      本文标题:数据仓库分层

      本文链接:https://www.haomeiwen.com/subject/iltvxrtx.html