接下来介绍有关Hadoop的源码目录结构、各文件夹的职责以及源码中的包结构以及核心包对应的功能。
1、bin目录
Hadoop最基本的管理脚本和使用脚本,这些脚本是sbin目录下管理脚本的基础实现,用户可以用这些脚本管理和使用hadoop。
2、etc目录
hadoop配置文件所在的目录,包括core-site.xml、hdfs-site.xml、mapred-site.xml等从hadoop1.0继承而来的配置文件和yarn-site.xml等hadoop2.0新增的文件。.template是模板文件
相当于之前版本的conf目录
3、include目录
对外提供的编程库头文件(具体动态库和静态库在lib目录中),这些头文件均是C++定义的,通常用于C++程序访问HDFS或者编写MR程序
4、lib目录该目录提供了对外编程的静态库和动态库,与include目录下的头文件结合使用
(并不是一些依赖jar包)
5、libexec目录
各个服务所对应的shell配置文件所在目录,可用于配置日志输出目录、启动参数(比如JVM参数)等基本信息
6、sbin目录
hadoop管理脚本所在目录,主要包括HDFS和YARN中各类服务的启动/关闭脚本
7、share目录
hadoop 各个模块编译后的jar包所在目录
注:明天更新Hadoop环境搭建课程示例 有喜欢的朋友可以关注转发收藏 谢谢大家













网友评论