美文网首页
大数据集群的角色划分和组网方案

大数据集群的角色划分和组网方案

作者: duzhongli | 来源:发表于2019-03-29 12:04 被阅读0次

第一篇:为大数据集群正确的选择硬件》,主要从基于工作负载的角度(IO-bound工作负载型,还是 CPU-bound工作负载型),分析了如何选择高性价比的合适硬件。本篇说的是大数据集群的角色划分和组网方案。

1,组网方案

    在典型配置下,集群采用双平面组网,如下图1-1所示

网络划分为2个平面:业务平面和管理平面,两个平面之间采用物理隔离的方式进行部署,保证业务、管理各自网络的独立性安全性(采用单平面组网时,不区分管理平面和业务平面)。        

l 管理平面:通过运维网络接入,主要用于集群管理,对外提供集群监控、配置、审计、用户管理等服务。

l 业务平面:通过业务平台接入,主要为用户或上层用户提供业务通道,对外提供数据存储、业务提交和计算的功能。

双平面组网主备管理节点还应支持设置外部管理网络的IP地址,用户可以通过外部“管理网络”进行集群管理。集群中每个节点分别接入管理平面和业务平面,每个节点需要一个管理IP地址和一个业务IP地址,每个IP地址用两个网络接口配置Bond,分别接入两个接入交换机。各节点的业务平面建议采用10GE带宽(如图1-2中MN1、CN3和DN4),业务平面接入交换机与汇聚交换机之间建议采用10GE带宽,业务平面汇聚交换机的堆叠带宽建议设置为40GE。以二层组网为例,双平面隔离组网方案如图1-2所示,图中A、B、C为部署有管理节点和控制节点的机架,称为基本框,D为根据业务需要线型扩展的机架,称为扩展框。

2,集群主机和角色分布

主要角色:

l 管理节点(Master Hosts):主要用于运行Hadoop的管理进程,比如HDFS的NameNode,YARN的ResourceManager。

l 工具节点(Utility Hosts):主要用于运行非管理进程的其他进程,比如Cloudera Manager和Hive Metastore。

l 边缘节点(Edge Hosts):用于集群中启动作业的客户端机器,边缘节点的数量取决于工作负载的类型和数量

l 数据节点(Worker Hosts):主要用于运行DataNode以及其他分布式进程,比如ImpalaD。

    根据集群的规模,推荐的角色划分如下所示,实际部署时,根据工作负载的类型和数量、集群中部署的服务、硬件资源、配置和其他因素,依据下面推荐建议优化角色的主机分布

 表2-1:3 - 10 Worker Hosts without High Availability

表2-2:3- 20 Worker Hosts with High Availability

表2-3:20- 80 Worker Hosts with High Availability

3,Hadoop其他网络要求

1.所有的Hadoop服务器节点应该是独有的网络,而不存在跟其他应用程序的节点共享网络I/O的情况。

2.每个服务器应该都配置静态IP。如果配置了动态IP,在机器重启或者DNS租约过期时,机器的IP地址会改变,这将导致Hadoop服务故障。

3.专用TOR交换机。

4.专用的核心交换刀片或者核心交换机。

5.尽量保证应用服务器与Hadoop“近”一些。

6.CDH只支持IPv4,不支持IPv6

7.机架之间的网络连接速度应该足够快。

8.确保网络接口对于集群中的所有节点应该是一致的。(比如MTU设置应该一样)

9.关闭所有节点的Huge Page compaction

10.确保集群中的所有网络连接都会被监控,比如冲突和丢包问题。以方便后期进行排障。

4,总结及参考文献 

https://www.cloudera.com/documentation/enterprise/5/latest/topics/cm_ig_host_allocations.html

相关文章

  • 大数据集群的角色划分和组网方案

    《第一篇:为大数据集群正确的选择硬件》,主要从基于工作负载的角度(IO-bound工作负载型,还是 CPU-bou...

  • 基于docker的zookeeper集群搭建

    环境组网 组网策略 准备三台server搭建zookeeper最小化集群,以达成主备份关系,为后期mesos集群的...

  • 图解MongoDB集群部署原理(3)

    MongoDB的集群部署方案中有三类角色:实际数据存储结点、配置文件存储结点和路由接入结点。连接的客户端直接与路由...

  • Zookeeper-ZAB协议

    ZK集群中角色 Leader 提供数据读和写能力 负责集群写请求的协调 同步数据到follower 参与选举 Fo...

  • Java中的IO

    什么是IOJava中对于IO的分类按流方向划分按流操作的数据单位划分按流的角色划分四大IO抽象类和常用的节点流处理...

  • Redis高可用之主从复制实践

    前言 Redis支持多种高可用方案如Redis Sentinel 集群和 Redis 数据集群,但是今天我们的主题...

  • 干货:一文详解Redis集群原理核心内容

    集群原理 一个系统建立集群主要需要解决两个问题:数据同步问题和集群容错问题。 Naive方案 一个简单粗暴的方案是...

  • Redis集群

    集群原理 一个系统建立集群主要需要解决两个:数据同步问题和集群容错问题。 Naive方案 一个简单粗暴的方案是部署...

  • Redis 集群

    1. 集群概述 Redis集群是Redis提供的分布式数据库方案,集群通过分片进行数据共享,提供复制和故障转移功能...

  • zk集群数据迁移和恢复

    zk集群数据迁移和恢复 一、zk数据迁移,有如下两种方案: 1、利用zk集群超过半数仍然可用的特性,比如集群中有5...

网友评论

      本文标题:大数据集群的角色划分和组网方案

      本文链接:https://www.haomeiwen.com/subject/ddclbqtx.html