近年来随着数据分析这个概念的火热,不少企业都想通过数据分析来有效提高企业管理、效益以及辅助决策。但是现实往往都是残...[作者空间]
春运的时候,12306会偶尔崩溃。其实,12306真的很厉害,对于它来说,几乎每天都是双11,但是它很少出现宕机的...[作者空间]
项目背景 有个关于分布式链路追踪呢项目,公司微服务460个左右,zipkin 日增数据约1.6T,约25亿左右数据...[作者空间]
心血来潮,写篇文章记录下个人大数据方面的经历。 0X01 背景 在2016年初,开始接触大数据,那时候对大数据完全...[作者空间]
错误方式 wget http://download.oracle.com/otn-pub/java/jdk/8u1...[作者空间]
在VMWare14 上安装了3台Centos7 虚拟主机,使用的NAT网络模式。 遇到的一个问题:3台虚拟机主机通...[作者空间]
SQL开发神器DataGrip配置要显示的表。数据仓库庞大,数以万计的表,而具体到某个开发任务中一般只涉及一小部分...[作者空间]
ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。...[作者空间]
前面有篇文章讲过DataGrip的强大,作为数据仓库,甚至任何需要写sql的人手中利器。最近,需要在hive上开发...[作者空间]
最近公司招聘数仓模型师,略难招。但是也不能因为环境差而降低要求。 1、这是面试的第几家公司?2、对职位的理解,和自...[作者空间]
现在所谓的大数据,AI,之类其实都不是什么新鲜事物,只不过现在的人太能喊口号。这些无非是操作大量数据,或者在大量数...[作者空间]
数据仓库上下游表间数据质量检查产生于下游表生成过程中,也是下游表本身的数据质量控制问题,上下游的关系并不仅限于数据...[作者空间]
1. 简介 当RegionServer接收客户的write请求后,会在memstore中不断的堆积。直到达到flu...[作者空间]
HBase� is the Hadoop database ,当你需要random、realtime read/w...[作者空间]
HBase最新稳定版本是2017年7月份的1.2.6版本。很多用户还是0.92.x 。尽管版本不同,原理确是相似的...[作者空间]
通过阅读本文,可以让你快速了解数仓如何分层,合理,实用。笔者坚持原创,根据实践总结,希望对新手有所帮助。 分层案例...[作者空间]
废话不说,直接上模板,拿去,不谢。 公共参数 key : 业务IDevent: 事件类型time: 事件事件,lo...[作者空间]
Java 基础思维导图,让 Java 不再难懂 - 工具资源 - 掘金思维导图的好处 最近看了一些文章的思维导图,...[作者空间]