大数据

作者: 维天有汉 | 来源:发表于2018-08-14 22:04 被阅读0次

1、 大数据的原理,本质

        大量的数据如何存储? 分布式文件系统(分布式存储)

        大量的数据如何计算? 分布式计算

2、Java和大数据的关系

      (1)Hadoop: 基于Java语言开发

      (2)Spark: 基于Scala语言开发,Scala基于Java语言开发

3、学习大数据的需要基础和路线

      (1)学习大数据需要的基础:

          Java基础(JavaSE)——类、继承、l/O、反射、泛型……

          Linux基础(Linux的基本操作)创建文件、目录、VI编辑器……

        (2)学习路线

            1、Java基础和Linux基础

            2、Hadoop的学习:体系结构、原理、编程

第一阶段: HDFS、MapReduce、HBace(NoSQL数据库)

第二阶段: 数据分析引擎——Hive、Pig

                  数据采集引擎——Sqoop、Flume

第三阶段: HUE : Web管理工具

                  Zookeepr: 实现Hadoop的HA

                  Oozie: 工作流引擎

            3、Spark的学习

第一阶段: Scala编程语言

第二阶段: Spark Core——基于内存,数据的计算

第三阶段: Spark SQL——类似Oracle中的SQl语句

第四阶段: Spark Streaming——进行实时计算(流失计算)比如: 自来水厂

             

   

相关文章

  • 大型网站java中间件,总的来说就是cobar,roketmq,

    关键词记录 请求数据包小,返回数据大 ,差别不大 请求数据包大,返回数据小,差别大 代理 ----》热备 服务自治...

  • 数据大屏

    一、是什么 “可视化+实时+足够大” 将数据通过可视化形式实时显示在足够大的屏幕上。如图1所示: 二、为什么(作用...

  • 数据大屏 - guandata智能数据可视化分析

    数据大屏可视化可更直观更智能的决策场景体验,通过数据大屏实时监测企业数据,洞悉运营增长,助力智能高效决策。 数据大...

  • 海量数据找前k大

    海量数据找前k大 参考1 海量数据找前k大

  • 大数据是什么

    一、大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对...

  • hadoop框架学习笔记一 2020-04-01

    1.1大数据概论 主要解决海量数据存储和海量数据的分析计算问题 1.2大数据的特点 * volume(大量) *v...

  • 报告总统(下)

    一、大数据时代的数据收集、分析 大数据之所以为”大“,有两个层面:其一、数据量大,海量数据;其二、分析规模大:由于...

  • 数据分析-003-数据指标

    数据指标 "对当前业务有参考价值的统计数据。" 三大数据 我们大致可以把数据分成三大类: 用户数据、行为数据、业务...

  • 一篇文章,让你对大数据有全新的掌握

    一、大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进...

  • java

    数据类型分为:8大基础数据类型和3大引用数据类型。 基础数据类型和引用数据类型的区别: 1,基本数据类型变量声明之...

网友评论

      本文标题:大数据

      本文链接:https://www.haomeiwen.com/subject/kmubbftx.html