PS:无法复制表格样式,只能截图了[作者空间]
编译:诚历,阿里巴巴计算平台事业部 EMR 技术专家,Apache Sentry PMC,Apache Commo...[作者空间]
前一段时间,有描述过数据仓库的一些概念,但是还没说完,慢慢补充自己的一些想法吧。行文有点乱,见谅。 数据仓库,是为...[作者空间]
参考:浅墨散人:如何减少"导数"需求 前言 做数据的同学经常会遇到导数需求,各种临时导数. 本文主要也是本人工作中...[作者空间]
继续介绍大数据系列岗位的要求,今天是数据仓库岗位,数据仓库岗位在“大数据”这仨字出来之前就已经存在好多年,...[作者空间]
随着社会快速的发展,仓储配送在人们生活中发挥着越来越重要的作用。当然仓储配送的前提是先要有仓库然后才是仓储接...[作者空间]
SQL开发神器DataGrip配置要显示的表。数据仓库庞大,数以万计的表,而具体到某个开发任务中一般只涉及一小部分...[作者空间]
一、各行业使用的分层模型 不同的行业使用的分层也有所不同,但思想都差不多 1.电信通讯 stage层 ->bdl层...[作者空间]
ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。...[作者空间]
Sakila样本数据库介绍 Sakila样本数据库是MySQL官方提供的一个虚拟的DVD出租连锁店数据库,提供了一...[作者空间]
前面有篇文章讲过DataGrip的强大,作为数据仓库,甚至任何需要写sql的人手中利器。最近,需要在hive上开发...[作者空间]
最近公司招聘数仓模型师,略难招。但是也不能因为环境差而降低要求。 1、这是面试的第几家公司?2、对职位的理解,和自...[作者空间]
再次考察 DG 前,一直认为 Teradata 公司的Teradata SQL Assistant是数据仓库sql...[作者空间]
现在所谓的大数据,AI,之类其实都不是什么新鲜事物,只不过现在的人太能喊口号。这些无非是操作大量数据,或者在大量数...[作者空间]
数据仓库上下游表间数据质量检查产生于下游表生成过程中,也是下游表本身的数据质量控制问题,上下游的关系并不仅限于数据...[作者空间]
通过阅读本文,可以让你快速了解数仓如何分层,合理,实用。笔者坚持原创,根据实践总结,希望对新手有所帮助。 分层案例...[作者空间]
http://blog.csdn.net/u011239443/article/details/52623602《...[作者空间]
为什么分桶 (1)获得更高的查询处理效率。桶为表加上了额外的结构,Hive在处理有些查询时能利用这个结构。具体而言...[作者空间]
为什么做分区 分区表将数据组织成分区,主要可以提高数据的查询速度。 如果把一年或者一个月的日志文件存放在一个表下,...[作者空间]
Table t has 2 columns:id INT;value CHAR(1);Column id star...[作者空间]