一、MPP架构MPP是系统架构角度的一种服务器分类方法。 目前商用的服务器分类大体有三种: 1、SMP(对称多处理...[作者空间]
概述: 简述数据仓库、数据湖、数据中台的相关概念。 一、数据仓库: 1、定义: 数据仓库之父 W.H.Inmon ...[作者空间]
1、什么是数据湖? 数据湖是一种技术系统,可以大批量并且廉价的分析结构化和非结构化数据资产。 其实很简单,数据湖的...[作者空间]
(1)为什么要分层 作为一名数据的规划者,我们肯定希望自己的数据能够有秩序地流转,数据的整个生命周期能够清晰明确被...[作者空间]
前言 举例说明 一、SCD问题的几种解决方案 以下为解决缓慢变化维问题的几种办法: 保留原始值 改写属性值 增加维...[作者空间]
前言 一、为什么要分层 分层的主要原因是在管理数据的时候,能对数据有一个更加清晰的掌控,详细来讲,主要有下面几个...[作者空间]
前言 今天给大家分享下数仓中的模型设计,一个好的数仓项目首先看一下它的架构以及他所用到的模型,它们使用的模型也都...[作者空间]
关于数据仓库的概念、原理、建设方法论,网上已经有很多内容了,也有很多的经典书籍,本文更想聊聊企业数据仓库项目上的架...[作者空间]
一、概要 大数据平台由底层至上可分为:原始数据层、数据仓库、数据应用层。 二、原始数据层——ODS(Operati...[作者空间]
1.数据仓库概念 (1)数据仓库是为企业所有决策制定过程,提供所有系统数据支持的战略集合。(2)通过对数据仓库中数...[作者空间]
本文的主要内容不是介绍现有的比较流行的主要行业的一些数据模型,而是将笔者在数据仓库建设项目中的一些经验,在这里分享...[作者空间]
原创 辛华 辛一 一实施内容 企业需要持续深化数据治理管理工作,围绕数据价值发掘利用、数据质量提升以及管理落实过程...[作者空间]
前面我们介绍了3大类核心转换场景。 【ETL】系列四:核心转换场景—单表间直转 【ETL】系列五:核心转换场景-字...[作者空间]
前面我们介绍了2大类核心转换场景。 【ETL】系列四:核心转换场景—单表间直转 【ETL】系列五:核心转换场景-字...[作者空间]
猫眼技术团队https://juejin.im/post/5d5be159f265da03970bbc3a 数据仓...[作者空间]
这节主要说Kettle的数据库连接方式和常见问题的解决方案。 你可能会问,数据库连接有什么好说的?一看就会呀,为什...[作者空间]
上文提到了进入ETL2.0阶段,开始了基于Kettle的二次开发。关于Kettle,回顾一下: Kettle是一款...[作者空间]
如何找出藏在这些数据背后的规律,利用这些数据来给公司创造价值,是在互联网时代需要面对的问题。 数据分析是指使用适当...[作者空间]
有不少没涉及过数仓的同学问我一些比较基础的问题,为了更好的理解前面讲到的一些理论,写一个小小的demo体会一下~~...[作者空间]