美文网首页
数据仓库工具箱—需要避免的常见的维度建模错误

数据仓库工具箱—需要避免的常见的维度建模错误

作者: 熊猫学猿 | 来源:发表于2022-06-30 06:31 被阅读0次

1违反事实和纬度的一致性要求

如果两个或更多的事实表与同一个纬度关联,则必须以高度负责的精神确保这些维度具有同一性或仔细选择各自的子集。当确认跨多个事实表的维度具有一致性后,就可以在不同的数据源之间进行钻取操作

2希望用户查询规范化的原子数据

最低级别的数据最适合于纬度设计且应该将其作为维度设计的基础,聚集数据失去了某些多维性。不能利用聚集数据建立维度模型并希望用户能够无缝地下钻到第三范式数据以了解细节,规范化模型有助于在ET L过程中准备数据,但是绝不能用于向商业用户表示数据

3使用报表设计维度模型

纬度模型与预期的报表没有任何关系。相反,维度模型是度量过程的模型,数字度量构成了事实表的基础。适合事实表的维度其内容应该是描述变量的环境,维度模型需要牢牢的基于度量过程的实际,而不是基于用户如何选择定义报表

4忽视对事实粒度的声明并混淆事实粒度

所有的维度设计应该始于对建立数字性能度量的业务过程的阐述。其次必须精确的定义数据的粒度,以最原子化的方式建立事实表。粒度级别将能够优雅的抵御随意的攻击。第三使围绕这些度量构建的维度,具有同样的粒度,保持粒度一致是设计维度模型的关键步骤

5使用操作型键连接维度和事实

维度的操作型键或智能键应该由简单的整数型从1到N顺序排列的代理键替换,其中N是纬度表的总行数

6使用更多的硬件解决所有的性能问题

聚集或者获取汇总表,是一种提高查询性能的低成本方式

7忽略对维度变化进行跟踪的需要

用户通常希望能够理解纬度表属性中至少某个子集的变化所带来的影响

8将层次划分为多个维度

层次是一种级联的多对一关系序列。例如多个产品上卷到一个品牌,多个品牌上卷到一个分类,如果某个维度以最低级别粒度来表示,例如产品,则层次中所有更高级别可以在产品行中以唯一值表示

9限制使用冗长的描述符以节省空间

总试图保持对纬度容量的控制,事实上在每个数据仓库中,纬度表从几何上看总是比事实表小很多。在每个维度中尽量提供描述性文本的详细描述。纬度表中的文本属性为B I运用提供的浏览、约束或过滤的参数,并为报表提供了行和列的表头

10在事实表中放入文本属性

涉及度量环境的描述性文本属性应该放入维度表中

相关文章

  • 数据仓库工具箱—需要避免的常见的维度建模错误

    1违反事实和纬度的一致性要求 如果两个或更多的事实表与同一个纬度关联,则必须以高度负责的精神确保这些维度具有同一性...

  • 数据仓库

    《数据仓库工具箱 维度建模权威指南 第3版.pdf》

  • 数据仓库建模——维度建模

    数据仓库的建模方法有很多种,常见的有维度建模法、范式建模法、实体建模法等,下面主要介绍一下维度建模法。 维度建模的...

  • 数据仓库维度建模法案例

    概述 维度建模法(Dimensional Modeling)是数据仓库建模中比较常用的方法,最常见的数据模式包括 ...

  • 每天一句话-数仓书籍

    关于数据仓库的书籍,推荐一本那就是 《数据仓库工具箱:维度建模的完全指南》,但这本书的中文翻译,真的是烂

  • 离线数仓二

    数据仓库维度模型设计 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工...

  • 数仓建模 - 维度 vs 关系

    数据仓库模型建设 模型概念 维度建模 关系建模 建模实现对比 模型选择 Data Vault 简介 数据仓库模型建...

  • Kimball维度建模技术总结

    Kimball维度建模技术几乎已经成为数据仓库建模的最佳实践。维度建模的基本概念总结。 收集业务需求 在建模工作前...

  • 数据建模的理解操作

    维度建模是专门应用于分析型数据库 数据仓库 数据集市建模的方法。数据集市可以理解为是一种"小型数据仓库"。 维度建...

  • 传统数据仓库在大数据平台上的进化

    模型的进化 一、传统数仓的3NF模型&维度模型 数据仓库建模中维度建模和3NF建模并不是OR的关系,它们更像是上下...

网友评论

      本文标题:数据仓库工具箱—需要避免的常见的维度建模错误

      本文链接:https://www.haomeiwen.com/subject/wmxfbrtx.html