美文网首页
hadoop介绍

hadoop介绍

作者: 霍运浩 | 来源:发表于2019-02-26 13:37 被阅读0次

可大可小

使用大数据

hadoop生态圈或框架 平台

高并发 ==多线程

集群 == 分布式 多进程 把进程分布到不同机器 将会涉及网络通信 很麻烦

因此 hadoop诞生了

hadoop 数据存储 hdfs

         数据分析 mapreduce  分析模型   

        资源调度 yern

       离线批量处理

        实时流计算  

        迭代内存分析

站内搜索 ==、百度

磁盘阵列

    是由很多价格较便宜的[磁盘](https://baike.baidu.com/item/%E7%A3%81%E7%9B%98),组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上

爬虫 --> 存储 --》分析 --》 索引 --查找


image.png

原始方法 通过共享文件夹来海量存储
hdfs ------


image.png
mapredue
image.png

map在 datasnode 处理

相关文章

  • Hadoop学习-安装

    一、hadoop介绍及其环境介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布...

  • HADOOP入门

    1. HADOOP****背景介绍 ** 1.1 ****什么是HADOOP** HADOOP是apache旗下的...

  • 《十小时入门大数据》学习笔记之初识Hadoop

    笔记内容概括 Hadoop概述1.1 Hadoop名字的由来1.2 Hadoop介绍1.3 Hadoop能做什么 ...

  • hadoop介绍

    https://www.cnblogs.com/wxisme/p/6270860.html https://www...

  • hadoop介绍

    以下内容是我的学习笔记,网络课程的笔记。出处 Hadoop实现了一个分布式文件系统(Hadoop Distribu...

  • Hadoop介绍

    用途:数据挖掘、日志分析、商务智能、搜索引擎..... 官网介绍:The Apache™ Hadoop® proj...

  • Hadoop 介绍

    1、NameNode介绍 Namenode 管理着文件系统的Namespace。它维护着文件系统树(filesys...

  • hadoop介绍

    可大可小 使用大数据 hadoop生态圈或框架 平台 高并发 ==多线程 集群 == 分布式 多进程 把...

  • Hadoop介绍

    Overview Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 主要解决,海量数据的存储和海...

  • Hadoop教程:Hadoop介绍

    Hadoop是一个用java编写的Apache开源框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。...

网友评论

      本文标题:hadoop介绍

      本文链接:https://www.haomeiwen.com/subject/ymjayqtx.html