0666-6.2.0-如何在CDH6.2.0上安装CDSW1.5

筅森魡賤 提交于 2020-10-29 01:24:27

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。


Fayson的github:

https://github.com/fayson/cdhproject


提示:代码块部分可以左右滑动查看噢


1

文档编写目的


Cloudera在2019年1月29日发布CDSW1.5,CDSW1.5的一个最大的更新就是支持CDH6和HDP,在1.5之前,CDSW是不能安装到CDH6.x的。CDH5.13版本以后支持CDSW的Parcel安装,本篇文章Fayson就主要讲述如何通过CM6.2使用Parcel包安装CDSW1.5。


CDSW需要DNS服务和泛域名解析,可以参考Fayson以前的文章如何在Windows Server2008搭建DNS服务并配置泛域名解析》、《如何利用Dnsmasq构建小型集群的本地DNS服务器》、《如何在Windows Server2012搭建DNS服务并配置泛域名解析》,《如何在RedHat6上使用Bind搭建DNS服务》或《如何在RedHat7上使用Bind搭建DNS服务》,CDSW1.5的新功能可以参考《0544-CDSW1.5的新功能搭建DNS服务推荐Dnsmasq,小巧可爱特方便。


  • 内容概述

1.部署CDSW parcel及安装CSD文件

2.添加CDSW节点到集群并部署Gateway角色

3.安装DNS服务并配置泛域名解析

4.安装CDSW服务

5.测试CDSW


  • 测试环境

1.Redhat7.2

2.采用root用户操作

3.CM/CDH6.2.0

4.CDSW版本1.5


  • 前置条件

1.CM和CDH已安装且正常运行

2.集群已部署Spark2 On Yarn模式

3.集群已部署Anaconda

4.集群已配置好DNS服务并配置CDSW节点的泛域名解析

5.CDSW节点已经通过CM加入到集群中


2

安装CDSW

2.1

CDSW节点配置


在准备新添加的CDSW节点上按照之前安装CDH集群的要求,配置好需要的设置。

包括下面这些


修改hostname,并更新到所有节点的/etc/hosts文件


[root@cdsw ~]hostnamectl set-hostname cdsw.macro.com



关闭防火墙,禁用SELinux


[root@cdsw yum.repos.d]# systemctl stop firewalld
[root@cdsw yum.repos.d]# systemctl disable firewalld
[root@cdsw yum.repos.d]# setenforce 0



关闭透明大页面,设置SWAP为1


[root@cdsw ~]# echo 1 > /proc/sys/vm/swappiness
[root@cdsw ~]# echo never > /sys/kernel/mm/transparent_hugepage/defrag 
[root@cdsw ~]# echo never > /sys/kernel/mm/transparent_hugepage/enabled


配置时钟同步

配置好OS的yum源后,卸载原有的chrony然后安装ntp服务


[root@cdsw yum.repos.d]# yum install -y ntp


安装好后,修改/etc/ntp.conf 让cdsw节点跟cdh01节点同步

然后重启ntpd服务,验证是否和主机已经同步,用下面的命令


[root@cdsw ~]# ntpq -p


前面出现*号 表明同步成功



2.2

部署Parcel包,安装CSD文件


把Parcel下载下来,地址如下,放到/var/www/html/cdsw1.5 这个目录下,部署成功


https://archive.cloudera.com/cdsw1/1.5.0/parcels/CDSW-1.5.0.p1.849870-el7.parcel
https://archive.cloudera.com/cdsw1/1.5.0/parcels/CDSW-1.5.0.p1.849870-el7.parcel.sha
https://archive.cloudera.com/cdsw1/1.5.0/parcels/manifest.json



下载CSD文件,使CM支持CDSW安装,文件下载地址


https://archive.cloudera.com/cdsw1/1.5.0/csd/CLOUDERA_DATA_SCIENCE_WORKBENCH-CDH6-1.5.0.jar


下载好后放在CM所在服务器的/opt/cloudera/csd目录下


[root@cdh01 ~]# cp CLOUDERA_DATA_SCIENCE_WORKBENCH-CDH6-1.5.0.jar /opt/cloudera/csd/



重启cloudera-scm-server服务


[root@cdh01 csd]# systemctl restart cloudera-scm-server


2.3

添加CDSW节点到集群


1.登录CM,新建一个主机模板,选择模板角色



添加节点到集群



一直点下一步,到添加主机模板这里,选择刚才创建的模板



完成后,可以看到cdsw节点已经添加进集群并且角色已经添加成功。


2.4

配置CDSW的Parcel库


在CM主页点开Parcel页面,添加CDSW的Parcel地址



然后下载,分配,激活



2.5

安装DNS服务并配置泛域名解析


1.安装dnsmasq


[root@cdsw ~]# yum -y install dnsmasq


2.验证安装


[root@cdsw ~]# dnsmasq -v



3.配置DNS服务以及泛域名解析,在/etc/dnsmasq.conf文件末尾增加以下配置。


[root@cdsw ~]# vim /etc/dnsmasq.conf
strict-order
listen-address=192.168.0.195
addn-hosts=/etc/hosts
address=/cdsw.macro.com/192.168.0.195
address=/cdsw/192.168.0.195



4.启动dnsmasq服务,并加入开机自启动


[root@cdsw ~]# systemctl start dnsmasq
[root@cdsw ~]# systemctl enable dnsmasq


5.修改/etc/resolv.conf文件配置,在nameserver中增加创建的DNS服务器IP地址,这里是将cdsw本机配置为dns服务器,所以将cdsw这台机器的内网IP地址配置到该文件中。


[root@cdsw ~]# vim /etc/resolv.conf



6.泛域名解析测试


[root@cdsw ~]nslookup 192.168.0.195
[root@cdsw ~]nslookup cdsw.macro.com
[root@cdsw ~]nslookup xxx.cdsw.macro.com



2.6

安装CDSW服务


在CM主页,集群按钮旁,点击添加服务



选择CDSW



继续,选择Master主机,由于只有一台服务器,就不添加work节点了。



安装完成



3

验证CDSW功能


在登陆CDSW之前,我们先配置好Windows机器里面的DNS服务和hosts文件



配置完之后,登陆CDSW



点击Web UI,进入登陆界面,点击注册



注册完成后,自动登陆CDSW界面,首次注册的账号自动为管理员账号



点击New Project创建一个Python工程



点击Create Project,然后点击Open Workbench



点击Launch Session



执行示例代码,验证完成



5

总结



提示:代码块部分可以左右滑动查看噢


为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。


推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操



本文分享自微信公众号 - Hadoop实操(gh_c4c535955d0f)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!