1.问题描述
最近一台线上的主机硬盘完全坏掉,也就是说机器需要重新装了,这台主机安装的还有standby name节点,以及其他的组件。主机挂掉之后,Ambari上该主机对应的组件状态全部都为未知状态,所以也无法对其操作,最后能作的就是在该主机重新安装完系统之后,把原来安装的组件都恢复过来。
2.问题解决
(1)主机重装系统之后,基本准备工作要做好,jdk、免密登陆、防火墙、hosts等等一些基本的环境准备工作,不限于上面几项,最主要是要和其它主机的保持一致。
(2)安装Ambari-agent,这个是保证能够恢复Ambari上对应主机组件的服务。否则Ambari-server无法感知对应主机的状态。安装完成之后需要修改Ambari-agent的配置文件/etc/ambari-agent/conf/ambari-agent.ini
修改上面属性为Ambari-server的地址。
(3)我们知道对于大数据各个组件来说,各个机器上的配置等基本信息是一样的,所以我们只需要将其它主机上的对应组件copy到这个主机上就OK了。例如:我是将/usr/hdp下的东西全部都copy到重装主机上了,由于配置时不变的,也就是说重装主机上的各个组件也是不会变的。原文件下面也有一些文件软连接,注意一下。
由于我的坏掉的是standby name节点,我还需要将active节点的name node的版本信息文件VERSION文件放到新装主机上的对应目录下面。具体路径请参考hdfs-site.xml配置文件的dfs.namenode.name.dir属性。
(4)上面步骤做完以后重新启动ambari-agent,然后就可以看到Ambari界面上新装主机上的组件都变成了stoped状态,然后重启对应的组件即可。
3.问题补充
期间还可能遇到一些其他的问题,但是只要心跳找到了,缺什么东西直接在其他节点拷过来就行了。
来源:CSDN
作者:会飞的犬良
链接:https://blog.csdn.net/things_use/article/details/103235466