美文网首页
简谈对于数仓、数据集市的划分与理解

简谈对于数仓、数据集市的划分与理解

作者: cn華少 | 来源:发表于2021-09-11 22:32 被阅读0次

简谈对于数仓的划分与理解

内容

数据仓库其实有很多名称,有人称作数仓、有人称作数据湖、有人称作数据池,我理解的本质是各个系统、各个数据源的数据汇总到一起,经过抽取、清洗、整理、沉淀几个步骤后形成的符合于用户标准的数据集。数据仓库主要用于我们进行智能决策、数据呈现、数据共享等场景的数据源。
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。
在数据治理过程中,数仓的构建我认为可合并为数据来源层,通常初步过来在ODS层,这期间通过ETL等一系列技术进行实现。再使用一系列清洗、整合工具算法进行最终整合为我们具体可用的沉淀数据,存储在DW层,即数据仓库。而基于数据仓库清洗后形成的有效的、可被理解的这类数据通常存储至DM层,即数据集市。数据集市和数据仓库都可以为我们的终端产品赋能,提供数据支撑。

本文参考:DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解

本文声明:
88x31.png
知识共享许可协议
本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。

相关文章

网友评论

      本文标题:简谈对于数仓、数据集市的划分与理解

      本文链接:https://www.haomeiwen.com/subject/dsaawltx.html