美文网首页
第九章 事实表设计之累计快照事实表

第九章 事实表设计之累计快照事实表

作者: 被爱的天青色 | 来源:发表于2019-02-23 23:01 被阅读33次

累计快照事实表的主要用于研究事件之间时间间隔,当然并不仅限于此,还有一些特殊用途,可以在实际工作中灵活运用。

设计特点

1)数据不断更新:不同于前面说的两种事实表,累计快照事实表中的数据实例会定期更新。

多事务事实表
累积快照事实表

如上图所示多事务事实表中一条交易记录会每天有一条数据来记录整个交易过程;而累积快照事实表只会有一条记录,数据会一致更新直到过程结束。

2)适用于业务过程有明确的起止时间的短生命周期场景,如交易订单、物流订单。长生命周期的实体记录完全可以由周期快照表实现,如商品、用户。

3)业务的流程不是只有一种,如交易流程可能是

① 下单、支付、发货、确认

② 下单、关闭订单

③  。。。

对于不同过程,要设计统一的结束标志,没有的业务时间置空




样例设计


有时需要将每个过程时间间隔作为事实放在表中,如下单到支付时间间隔、支付到发货时间间隔、发货到确认时间间隔,方便下游直接使用


物理实现

1)全量表:一般是日分区,每天存储前一天的全量数据和当天增量数据进行合并,保证每条数据的最新状态,此方式适用于数据量不大的情况

2)全量变化表:累积事实表用于保存生命周期短的实例,所以可以根据业务实体从开始到结束的最大时间间隔,如交易业务最大时间跨度200天,每天保存的是过去200天的全量数据,200天之前的数据存储在归档表中。适用于数据量大的场景

3)以业务结束时间分区:每天分区中存放的是当天结束的业务,然后用一个非常大的分区(如 3000-12-31)保存所有至今未结束的记录,这种方式不会浪费存储资源

相关文章

  • 第九章 事实表设计之累计快照事实表

    累计快照事实表的主要用于研究事件之间时间间隔,当然并不仅限于此,还有一些特殊用途,可以在实际工作中灵活运用。 设计...

  • 数仓入门基础-8-模型设计

    1.事实表模型设计 事实表有三种类型 : 事务事实表、周期快照事实表和累积快照事实表。事务事实表用来描述业务过程,...

  • 维度建模:事实表

    维度建模数仓领域中的事实表大致分以下三种: a. 事务事实表b. 周期快照事实表c. 累计快照事实表 一、事务事实...

  • 第九章 事实表设计之周期快照事实表

    想象以下场景,需要统计一个季度的商品成交量怎么取做?如果用一个季度内的事实事务表进行计算,虽然可以得出结果但是效率...

  • 2019-07-10

    事实表有三种类型:事务事实表、周期快照事实表和累积快照事实表。 事务事实表用来描述业务过程,跟踪空间或时间上某点的...

  • 数据仓库事实表种类

    1.事务性事实表 2.周期性快照事实表 3.积累性快照事实表 4.无事实的事实表 5.聚集事实表或OLAP多维数据...

  • 数据仓库工具箱——总线矩阵

    累计快照事实表用于定义过程开始,结束以及期间的可区分的里程碑 事实表主要包括三种基本类型:事务周期快照累积快照 通...

  • 事实表分类及使用场景

    事实表分类 一、周期快照事实表 周期快照事实表中的每行汇总了发生在某一标准周期的多个度量事件,即使周期内没...

  • 漫谈事实表如何设计(四)

    一.累积型快照事实表的应用场景介绍 针对电商交易,设计了交易下单/支付/确认收货事务事实表, 用于统计下单/支付/...

  • 漫谈事实表如何设计(三)

    一.周期性快照事实表的特性 1.1用快照采样状态快照事实表以预定的间隔采样状态度量(周期可以是天,周,月,季度,年...

网友评论

      本文标题:第九章 事实表设计之累计快照事实表

      本文链接:https://www.haomeiwen.com/subject/rpdmyqtx.html