1.背景介绍 异常检测可以定义为“基于行动者(人或机器)的行为是否正常作出决策”,这项技术可以应用于非常多的行业中...[作者空间]
目录 1. 美团离线计算平台架构都有哪些框架? 2. 为什么要使用Spark架构? 3. spark推广过程中需要...[作者空间]
spark依赖环境 1. jdk 1.8 2. scala 2.11 3. hadoop 2.7(本文用...[作者空间]
为了用python实现mapreduce,我们先引入下面两个个知识 sys.stdin() itertools之g...[作者空间]
很多初学者在萌生向大数据方向发展的想法之后,不免产生一些疑问,应该怎样入门?应该学习哪些技术?学习路线又是什么? ...[作者空间]
今天,在GitHub上偶然看到了Kailash Ahirwar作者的一个项目cheatsheets-ai,该项目包...[作者空间]
在前篇几十条业务线日志系统如何收集处理?中已经介绍了Flume的众多应用场景,那此篇中先介绍如何搭建单机版日志系统...[作者空间]
文·blogchong 首先,如题,这篇依然是写给那些从其他领域跨界到大数据领域的朋友的,当然,初入大数据领域,或...[作者空间]
简介 在上一次的数据平台实践①中,对基于Flume,Kafka和Spark Streaming的数据平台组合做了介...[作者空间]
蜻蜓点水 Flume——数据采集 如果说,爬虫是采集外部数据的常用手段的话,那么,Flume就是采集内部数据的常用...[作者空间]
一、环境部署 hadoop集群2.7.1zookeerper集群kafka集群:kafka_2.11-0.10.0...[作者空间]
前言 最近在专注Spark开发,记录下自己的工作和学习路程,希望能跟大家互相交流成长本文章更倾向于实战案例,涉及框...[作者空间]
原文链接:『 Spark 』5. 这些年,你不能错过的 spark 学习资源 写在前面 本系列是综合了自己在学习s...[作者空间]
今天一大早就看到了一篇文章,叫【大数据对于运维的意义】。该文章基本上是从三个层面阐述的: 工程数据,譬如工单数量,...[作者空间]