美文网首页python数据分析人工智能机器学习程序员Hadoop
数据仓库快速入门教程10-星型模式和雪花模式

数据仓库快速入门教程10-星型模式和雪花模式

作者: python测试开发 | 来源:发表于2019-06-30 11:08 被阅读5次

什么是多维模式?

多维模式专门用于建模数据仓库系统。这些模式旨在满足为分析目的(OLAP)设计的超大型数据库的独特需求。

数据仓库架构的类型:

以下是三种主要类型的多维模式,每种模式都有其独特的优势。

  • 星图
  • 雪花图
  • 银河

什么是星型模式?

星型模式是最简单的数据仓库模式。它被称为星型模式。在星型模式中,星形的中心可以有一个事实表和相关维度表的数量。也称为Star连接模式,并且针对查询大型数据集进行了优化。

image.png

事实表位于中心,其中包含每个维度表的键,如Deal_ID,Model ID,Date_ID,Product_ID,Branch_ID和其他属性,如销售单位和收入。

星图的特点:

  • 星型模式中的每个维度都使用唯一的一维表来表示。
  • 维度表包含一组属性。
  • 维度表使用外键连接到事实表
  • 维度表未相互连接
  • 事实表将包含键和衡量标准
  • Star模式易于理解并提供最佳磁盘使用率。
  • 维度表未规范化。例如,在上图中,Country_ID没有像OLTP设计那样的国家查找表。
  • BI工具广泛支持该架构

什么是雪花架构?

Snowflake Schema是Star Schema的扩展,它增加了额外的维度。它被称为雪花,因为它的图形类似于雪花。

维度表是标准化的,它将数据拆分为其他表。在以下示例中,Country进一步标准化为单个表。

image.png

雪花图式的特点:

  • 雪花模式的主要好处是它使用更小的磁盘空间。
  • 更容易实现维度添加到架构中
  • 由于多个表,查询性能降低
  • 使用雪花模式时您将面临的主要挑战是,由于查找表越多,您需要执行更多维护工作。
Star Schema Snow Flake Schema
维度的层次结构存储在维度表中。 层次结构分为不同的表。
它包含由维度表包围的事实表。 一个由维度表包围的事实表,它们又由维度表包围

在星型模式中,只有单个连接创建事实表和任何维度表之间的关系。雪花模式需要许多连接才能获取数据。
简单的DB设计。 |非常复杂的DB设计。
非规范化数据结构和查询也运行得更快。 |规范化数据结构。
高水平的数据冗余 |非常低级别的数据冗余
单维表包含聚合数据。 |数据拆分为不同的维度表。
多维处理速度更快。 |由于复杂的连接,多维数据集处理可能会很慢。
使用Star Join Query Optimization提供性能更高的查询。表可以连接多个维度。 |Snow Flake Schema由集中式事实表表示,不太可能与多个维度相关联。

什么是Galaxy架构?

Galaxy Schema包含两个共享维度表的事实表。它也被称为Fact Constellation Schema。该模式被视为一组星星,因此命名为Galaxy Schema。

image.png

如上图所示,有两个事实表。在Galaxy架构中,共享维称为Conformed Dimensions。

Galaxy Schema的特点:

  • 此架构中的维度根据不同层次结构分为不同的维度。
  • 例如,如果地理有四个层次的层次结构,如地区,国家,州和城市,那么Galaxy架构应该有四个维度。
  • 此外,可以通过将一星级模式拆分为更多Star方案来构建此类模式。
  • 此模式中的维度很大,需要根据层次结构级别进行构建。
  • 此模式有助于聚合事实表以便更好地理解。

参考资料

什么是星团模式?

image.png

Snowflake架构包含完全展开的层次结构。但是,这会增加架构的复杂性并需要额外的连接。另一方面,星型模式包含完全折叠的层次结构,这可能导致冗余。因此,最佳解决方案可能是这两种模式之间的平衡,即星团模式设计。

重叠的维度可以在层次结构中找到。当实体充当两个不同维度层次结构中的父级时,会发生分支。然后,叉实体被识别为具有一对多关系的分类。

摘要

  • 多维模式专门用于建模数据仓库系统

  • 星型模式是最简单的数据仓库模式。它被称为星型模式,因为它的结构类似于星星。

  • Snowflake Schema是Star Schema的扩展,它增加了额外的维度。它被称为雪花,因为它的图形类似于雪花。

  • 在星型模式中,只有单个连接创建事实表和任何维度表之间的关系。
    星型模式包含由维度表包围的事实表。

  • Snow flake架构由维度表包围,维度表又由维度表包围
    雪花模式需要许多连接才能获取数据。

  • Galaxy Schema包含两个共享维度表的事实表。它也被称为Fact Constellation Schema。

  • 星型群集架构包含Start schema和Slow flake schema的属性。

相关文章

  • 数据仓库快速入门教程10-星型模式和雪花模式

    什么是多维模式? 多维模式专门用于建模数据仓库系统。这些模式旨在满足为分析目的(OLAP)设计的超大型数据库的独特...

  • 数据挖掘课后习题 第4章

    4.3 (a)三种数据仓库建模模式:星形模式,雪花模式,事实星座模式(b)星形模式: (c)上卷:沿time维上的...

  • 行为模式10-行为模式总结

    行为模式10-行为模式总结 行为模式总共有11个设计模式: 观察者模式(Observer) 中介者模式(Media...

  • Dimension table & Fact Table

    Dimension table 维度表是数据仓库星型模式中的一张表。数据仓库是使用由事实和维度表组成的维度数据模型...

  • 数据仓库中星型模型和雪花模型

    参考:理解数据仓库中星型模型和雪花模型 在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构 ...

  • 《终身成长》笔记

    为什么要有成长型思维模式? 人的思维模式分为固定型思维模式和成长型思维模式。相比固定型思维模式,成长型思维模式对自...

  • 我们一起成长11

    今天学习了管理模式里面的第三种和第四种模式 力量型模式和威猛型模式 力量型的管理方式是和平和型的模式互换,力量型需...

  • 23种设计模式总结一

    23 种经典设计模式共分为 3 种类型,分别是创建型、结构型和行为型。 一、创建型设计模式 创建型设计模式包括:单...

  • Nodejs实现23种设计模式-1.简单工厂模式

    Nodejs实现24种设计模式--简单工厂模式 导语:24种设计模式,分为三大类,创建型、结构型和行为型。这些模式...

  • 从What-型和Why-型思维模式到黄金思维圈

    一、两种思维模式 针对同一件事,我们都有两种思维模式:What-型思维模式和Why-型思维模式。 What-型思维...

网友评论

    本文标题:数据仓库快速入门教程10-星型模式和雪花模式

    本文链接:https://www.haomeiwen.com/subject/vtfpcctx.html