什么是缓慢变化维?缓慢变化维有多少种处理方法?缓慢变化维,即同一维表中属性随时间发生变化,那对于这种变化的维度,在...[作者空间]
简介:Doris(原百度 Palo)是一款基于大规模并行处理技术的分布式 SQL 数据库,由百度在 2017 年开...[作者空间]
Map Reduce 执行过程是数仓hql调优所必须熟知的,也是初高级数仓工程师面试基本必问的一块内容,所以为了面...[作者空间]
保留表(Preserved Row table) 在outer join中需要返回所有数据的表叫做保留表,也就是说...[作者空间]
有不少没涉及过数仓的同学问我一些比较基础的问题,为了更好的理解前面讲到的一些理论,写一个小小的demo体会一下~~...[作者空间]
缓慢变化维的提出是因为维度的属性并不是静态的,他会随着时间线延长发生缓慢的变化。常用的三种处理方式: 1.重写维度...[作者空间]
最近终于有点时间了,东拼西凑的设计了一个日期维表,也是数仓设计时比较常用的。表结构如下: dt string CO...[作者空间]
现在有一张用户消费信息表,求问连续三天登录用户有多少个,用户连续交易的总额、连续登陆天数、连续登陆开始和结束时间、...[作者空间]
hive窗口函数基本面试面sql必考项目,这里画一下重点猴,那现在就操练起来~窗口函数格式: 窗口说明:n PRE...[作者空间]
1. reduce 个数设置 方法1.调整hive.exec.reducers.bytes.per.reducer...[作者空间]
1.hive sql >> 五星 在大多数的工作中,主要用的语言就是sql,说难不难,只要做的多了,基本就可以...[作者空间]
1.事实表模型设计 事实表有三种类型 : 事务事实表、周期快照事实表和累积快照事实表。事务事实表用来描述业务过程,...[作者空间]
数仓规范,看似是无关紧要,实则是数仓实施最重要要素,也是衡量数仓标准的重要条件,有了规范,才能尽可能避免一些坑。 ...[作者空间]
个人博客:https://renwula.github.io/,本系列基于互联网公司数仓,使用hive搭建数仓 ...[作者空间]
星型模型与雪花模型,应该是数仓面试者最喜欢提的问题,也是比较容易理解的概念。 1.星型架构是一种非正规化的结构,多...[作者空间]
事实表,发生在现实世界中操作型时间,其产生的可度量数值,存储在事实表中,例如交易订单表。一般有以下几种事实特性: ...[作者空间]
三范式(3NF): 第一范式[https://baike.baidu.com/item/%E7%AC%AC%E4...[作者空间]
百度百科的定义: 数据仓库,英文名称为Data Warehouse,可简写为DW[https://baike.ba...[作者空间]