CDH使用之CDH 5.3.x安装

混江龙づ霸主 提交于 2020-04-07 11:08:27

前言:CDH是由Cloudera公司发行的Hadoop版本,全称(Cloudera's Distribution Including Apache Hadoop)。该版本基于原生Apache Hadoop版本进行改进,添加了补丁和自行开发的组件,更加稳定易用。并且Cloudera公司已将CDH开源,可以不依靠CM也可以进行独立安装,目前来看在国内市场占有比重较大。本文采用CM方式进行安装,安装环境为CentOS6.5,暂不介绍独立安装方式安装。


安装准备 介质准备




本文采用parcel包方式安装,需要下载相关的3个文件。

parcel包地址:http://archive-primary.cloudera.com/cdh5/parcels/5.3.2/

需要下载如下三个文件


如果采用rpm方式安装,地址为:

http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5.3.2/

系统配置


a) 用户创建

CDH安装建议使用普通用户进行安装,使用root用户安装也可以,安装完成之后如果有其他新普通用户需要使用时,添加到对应的hadoop用户组(默认组为supergroup)即可。

创建用户

# useradd <用户名称>

修改密码

# passwd <用户名称>


b) host配置

安装CDH集群之前,必须配置hosts,将需要添加到集群中的机器配置到hosts中:

    # vi /etc/hosts



安装
安装方式选择



    • CDH通过CM可以选择的安装方式有采用rpm方式和parcel包方式(官方建议采用parcel包方式安装,便于后期升级维护),本文介绍parcel包方式。安装基于CM安装(CM安装部分请参看CDH使用之CM 5.3.x安装)



2、启动http服务

采用parcel包方式安装不需要创建repo文件,浏览器可以访问该地址即可。


启动http 服务

# service httpd start

查看http服务状态

# service httpd status


3、开始安装







    此处从CM安装完毕首次打开7180端口界面开始进行安装:

添加主机IP地址,hostname也可以(主机较多情况下可以填crxy[171-179]),然后点击搜索。


搜索到主机选择需要安装CDH的主机之后点击继续:


添加本地parcel包地址(添加时删除其他默认网络地址),其他存储路径默认。


此处如果没有刷新出对应的CDH版本,检查是否能正常访问parcel包相关3个文件,如果可以正常访问但是仍然没有正常刷新的情况可以重启CM server服务,到cm所在机器执行如下命令:

重启cm server

service cloudera-scm-server restart

重启cm agent

service cloudera-scm-agent restart




点击继续:



开始走进度条,等待一段时间(建议配置内网ip):


安装完成:



往主机上分配parcel包:

安装完成后开始分配服务组件, 选择自定义(可根据实际需要进行选择):


服务节点分配(根据主机硬件配置合理配置):

填写存储目录,点击继续开始首次分配服务:


安装完成之后调转到主页面


服务显示红色的状态,需要添加NTP server时间同步,不适用CDH的时间同步方式关掉即可。如图方式关闭,保存:


状态如下,安装完成。


如果使用普通用户进行安装,主机上切换为普通用户之后,为方便使用hadoop shell命令,可以使用如下方式在hdfs上创建对应的用户(用户名一致):

创建hdfs用户

sudo -u hdfs hadoop fs -mkdir /user/test11

为hdfs用户赋权

sudo -u hdfs hadoop fs -chown -R test11:test11 /user/test11


4、错误定位

注意:如果安装失败,需要到/etc/yum.repos.d/目录查看是否有多余的repo文件生成,repo文件内容是否正确,然后在点击重试。



CM安装部分请参考 CDH使用之CM 5.3.x安装。

更多精彩内容请关注:http://bbs.superwu.cn

关注超人学院微信二维码: 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!