美文网首页
数据产品经理术语_hadoop

数据产品经理术语_hadoop

作者: sharon_qwer | 来源:发表于2020-01-09 16:35 被阅读0次

1)是什么

① Hadoop是由Apache基金会所开发的分布式系统基础架构,封装了复杂的分布式底层细节,使开发人员低门槛地开发分布式程序,充分利用集群的威力进行高速运算和存储。

② Hadoop是一个针对于大数据的存取、计算、加工、分析,由多个工具构成的解决方案

③ 提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序,但是延迟大,响应缓慢,运维复杂

2)为解决什么问题

随着互联网数据量增多,数据产生速度增快,数据类型多样性提高,之前的集中式的数据处理系统显露出了很多问题。

① 原有系统存储容量有限,无法承载每日TB甚至PB级的数据量。

② 原有系统适合处理简单数据,对于音视频、图片等多种类型的文件支持一般。

③ 原有系统应对故障的能力弱。

④ 原有系统对机器要求高,构建成本高。

Hadoop构建了可以运行在多个廉价小型机的分布式系统架构,以低成本的方案解决了上述问题,从而得到了行业中大量的应用。

3)工作原理

① 示意图

Hadoop中的核心设计包括两点:HDFS和MapReduce。图中白色块属于HDFS,黑色块属于MapReduce

4)优点

① 大数据文件,非常适合上T级别的大文件或者一堆大数据文件的存储,如果文件只有几个G甚至更小就没啥意思了。

② 文件分块存储,HDFS会将一个完整的大文件平均分块存储到不同计算器上,它的意义在于读取文件时可以同时从多个主机取不同区块的文件,多主机读取比单主机读取效率要高得多。

③ 流式数据访问,一次写入多次读写,这种模式跟传统文件不同,它不支持动态改变文件内容,而是要求让文件一次写入就不做变化,要变化也只能在文件末添加内容。

④ 廉价硬件,HDFS可以应用在普通PC机上,这种机制能够让给一些公司用几十台廉价的计算机,就可以撑起一个大数据集群。

⑤ 硬件故障,HDFS认为所有计算机都可能会出问题,为了防止某个主机失效读取不到该主机的块文件,它将同一个文件块副本分配到其它某几个主机上,如果其中一台主机失效,可以迅速找另一块副本取文件。

5)缺点

HDFS不适合用在:要求低时间延迟数据访问的应用,存储大量的小文件,多用户写入,任意修改文件

6)适用场景

搜索、日志处理、推荐系统、数据分析、视频图像分析、数据保存等

相关文章

  • 数据产品经理术语_hadoop

    1)是什么 ① Hadoop是由Apache基金会所开发的分布式系统基础架构,封装了复杂的分布式底层细节,使开发人...

  • 数据产品经理术语_数据集市

    1)定义 DM(Data Market):数据集市,小型数据仓库;面向部门、单个主题或特定应用,且之间互不影响 2...

  • 数据产品经理术语_数据仓库

    1)定义 DW(data warehouse):数据仓库,面向分析的存储系统,存储企业各种数据 2)数据仓库的特点...

  • 数据产品经理分类

    数据产品经理四大分类:数据仓库产品经理、大数据平台产品经理、数据应用类产品经理、数据模型产品经理

  • 数据产品经理术语_ODS操作型数据

    1)定义 ODS(Operation Data Store):操作型数据,存储各大业务型数据库ETL后的数据,是最...

  • 第二课《什么是数据产品经理》

    什么是「数据产品经理」? 数据产品经理 ≠ 产品经理 + 数据分析 「数据产品经理」是做什么的? 直面的讲:负责数...

  • 产品经理术语大全

    前言:术语对于PM而言更像是工具。了解基本的产品术语,能够更好地进行沟通与提升工作效率。 KOL:关键意见领袖(K...

  • 如何自学数据产品经理

    数据产品经理是啥? 数据产品经理是负责数据产品的产品经理(好拗口,但就是酱) 数据产品:淘宝指数,百度指数,生意参...

  • 2022-02-11为了面试数据产品经理,我也是拼了

    最近频频面试数据产品经理,以及高级数据产品经理,作为一个普通产品经理,也是慌得一批。 数据产品经理,顾名思义,既要...

  • 产品经理提升高级学习学习再学习

    产品经理的高级进阶视频课程,包括商业产品经理、B端产品经理、中台产品经理、策略产品经理、数据产品经理等实战训练营应...

网友评论

      本文标题:数据产品经理术语_hadoop

      本文链接:https://www.haomeiwen.com/subject/dfbyactx.html