hadoop的五个守护进程 - 每天都要往前走一点 - ITeye博客

`

xubindehao

浏览: 239295 次
性别:
来自: 杭州

最近访客更多访客>>

lzb

zjy_369

Misha-Sr0815

xiaomabobo

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Wangwei86609：非常好的规则引擎框架，支持决策树和多线程运行规则https:/ ...
规则引擎
xl6861989： 2 楼正确
Maven中<dependencies>节点和<dependencyManagement>节点的区别
cuitengfei2006x：抄别人的有意思吗
hadoop MapReduce join
rainbow_小春：写的真心赞，向你学习，学着自己写一些东西
hadoop MapReduce join
zsx0321： outputStreamReader 应改为OutputStr ...
从装饰者模式的理解说JAVA的IO包

hadoop的五个守护进程

阅读更多

一般如果正常启动hadoop，我们可以在master上通过jps命令看到以下5个daemons:

[root@master ~]# jps
19803 SecondaryNameNode
19994 TaskTracker
31144 Jps
19571 NameNode

19672 DataNode
19887 JobTracker

下面依次介绍这些进程：

1. NameNode

它是Hadoop 中的主服务器，管理文件系统名称空间和对集群中存储的文件的访问。

参考资料：

http://www.linuxidc.com/Linux/2012-01/51614.htm

2. SecondaryNameNode

它不是 namenode 的冗余守护进程，而是提供周期检查点和清理任务。

出于对可扩展性和容错性等考虑，我们一般将SecondaryNameNode运行在一台非NameNode的机器上。

参考资料：

http://www.linuxidc.com/Linux/2012-01/51628.htm
http://www.linuxidc.com/Linux/2012-01/51622.htm

3. DataNode

它负责管理连接到节点的存储（一个集群中可以有多个节点）。每个存储数据的节点运行一个 datanode 守护进程。

4. JobTracker和TaskTracker

JobTracker负责调度 DataNode上的工作。每个 DataNode有一个TaskTracker，它们执行实际工作。

JobTracker和 TaskTracker采用主-从形式，JobTracker跨DataNode分发工作，而 TaskTracker执行任务。

JobTracker还检查请求的工作，如果一个 DataNode由于某种原因失败，JobTracker会重新调度以前的任务。

分享到：

zookeeper管理分布式服务 | Hadoop中的子项目Zookeeper能做什么

2012-02-06 16:57
浏览 14959
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

【大数据】Hadoop常用启动命令.pdf: 下⾯就具体说说这些命令： start-all.sh 启动所有的Hadoop守护进程。包括NameNode、 Secondary NameNode、DataNode、JobTracker、 TaskTrack stop-all.sh 停⽌所有的Hadoop守护进程。包括NameNode、 Secondary ...

Hadoop完全分布式配置.txt: 完全分布模式 Hadoop守护进程运行在一个集群上。启动所有的守护进程，具有hadoop完整的功能，可以使用HDFS、MapReduce和Yarn，并且这些守护进程运行在集群中，可以真正的利用集群提供高性能，在生产环境下使用。 ...

部署Hadoop3.0高性能集群.docx: 部署Hadoop3.0高性能集群，Hadoop完全分布式模式: Hadoop的守护进程分别运行在由多个主机搭建的集群上,不同节点担任不同的角色,在实际工作应用开发中,通常使用该模式构建企业级Hadoop系统。在Hadoop环境中,所有...

大数据运维技术第4章 Hadoop文件参数配置课件.pptx: 4.1.2 Hadoop守护进程环境配置;4.1.3 Hadoop配置参数格式;4.1.3 Hadoop配置参数格式;4.1.4 获得Hadoop集群全部配置信息;4.2 在Master节点上安装Hadoop;（1）解压缩hadoop-2.7.1.tar.gz安装包到/usr目录下 [root@...

Hadoop从入门到上手企业开发: 018 Hadoop 守护进程服务三种启动停止方式 019 测试环境(HDFS Shell基本命令和运行WordCount程序) 020 结合WordCount实例讲解Hadoop的数据存储和数据计算 021 Hadoop 五大服务与配置文件中的对应关系 022 分析Hadoop...

Hadoop权威指南第二版(中文版): 　Hadoop守护进程的地址和端口　Hadoop的其他属性　创建用户帐号　安全性　Kerberos和Hadoop 　委托令牌　其他安全性改进　利用基准测试程序测试Hadoop集群　Hadoop基准测试程序　用户的作业　云上的Hadoop...

已过基于Hadoop+Spark招聘推荐可视化系统大数据项目毕业设计（源码下载）: start-all.sh ：启动所有的Hadoop守护进程。包括NameNode、 Secondary NameNode、DataNode、JobTracker、 TaskTrack stop-all.sh ：停止所有的Hadoop守护进程。包括NameNode、 Secondary NameNode、...

Hadoop权威指南（中文版）2015上传.rar: Hadoop守护进程的地址和端口 Hadoop的其他属性创建用户帐号安全性 Kerberos和Hadoop 委托令牌其他安全性改进利用基准测试程序测试Hadoop集群 Hadoop基准测试程序用户的作业云上的Hadoop Amazon EC2上的Hadoop ...

hadoop集群建立: 必须安装并且保证 sshd一直运行，以便用Hadoop 脚本管理远端Hadoop守护进程。 1.3. 免密码ssh设置作为一个安全通信协议，使用时需要密码，因此我们要设置成为免密码登录。 2. hadoop配置 2.1. 安装安装hadoop...

实验项目 MapReduce 编程: 1. 启动全分布模式 Hadoop 集群，守护进程包括 NameNode 、 DataNode 、 SecondaryNameNode、ResourceManager、NodeManager 和 JobHistoryServer。 2. 在 Hadoop 集群主节点上搭建 MapReduce 开发环境 ...

Hadoop-task-manager.rar_Master/Slave_hadoop_hadoop taskmanager_: 在Master上运行的是JobTracker守护进程，而在Slave上运行的是TaskTracker守护进程。对于一个作业，首先提交给JobTracker，再由JobTracker对提交的作业进行处理。

基于Hadoop的集群部署与管理系统的设计与实现毕业论文（62页27073字数）.doc: 重点研究 HDFS、MapReduce、HBase和Hive系统的核心算法和实现原理，分析它们运行的守护进程各自的职责和相互间协同工作模式，作为项目设计的理论基础。 4.深入研究项目所使用的技术。重点分析自动化配置和部署工具...

Hadoop集群配置（最全面总结）: ssh必须安装并且保证sshd一直运行，以便用Hadoop脚本管理远端Hadoop守护进程。操作系统：Ubuntu部署：Vmvare在vmvare安装好一台Ubuntu虚拟机后，可以导出或者克隆出另外两台虚拟机。说明：保证虚拟机的ip和主机的ip...

Daemon:UnixLinux守护程序和Windows服务的模板（2014-）。到目前为止，包括C，C ++，C＃，Perl，Python: 守护进程Unix / Linux守护程序和Windows服务的模板集合。您可以基于这些模板构建更复杂的守护程序和Windows服务。为什么选择守护进程？ Linux / Unix守护程序和Windows服务很重要。它们作为长时间运行的进程驻留在...

hadoop-mutinode: 第二个容器映像hadoop-dn从 hadoop-base 扩展并安装从属特定的 hadoop 配置，它还安装了 daemontools 来运行 sshd 、 serf 和 dnsmasq 所以当我们以守护进程模式启动 docker 容器时，它会继续运行而不是在之后立即...

实验项目实战 HDFS 实验报告: 1. 启动全分布模式 Hadoop 集群，守护进程包括 NameNode 、 DataNode 、 SecondaryNameNode、ResourceManager、NodeManager 和 JobHistoryServer。 2. 查看 HDFS Web 界面。 3. 练习 HDFS Shell 文件系统...

大数据开发技术.pdf: 每个存储数据的节点运行一个 datanode 守护进程。 4．ResourceManager（JobTracker） JobTracker 负责调度 DataNode 上的工作。每个 DataNode 有一个 TaskTracker，它们执行实际工作。5．NodeManager（TaskTracker）...

伪集群分布: 　-Hadoop启动NameNode、DataNode、JobTracker、TaskTracker这些守护进程都在同一台机器上运行，是相互独立的Java进程。　-在这种模式下，Hadoop使用的是分布式文件系统，各个作业也是由JobTraker服务，来管理的...

漫谈大数据第四期-storm: 每个工作节点都运行了一个名为“Supervisor”的守护进程，用于监听工作，开始并终止工作进程。Nimbus和Supervisor都能快速失败，而且是无状态的，这样一来它们就变得十分健壮，两者的协调工作是由ApacheZooKeeper...

Global site tag (gtag.js) - Google Analytics