zeppelin 配置 spark

非 Y 不嫁゛ 提交于 2019-12-06 09:11:16

修改zeppelin 配置文件

在zeppelin-env.sh中添加spark路径和hadoop配置文件路径

export SPARK_HOME=/usr/lib/spark
export HADOOP_CONF_DIR=/usr/lib/hadoop

修改spark interpreter参数

master 可以为:

local[*] in local mode
spark://master:7077 in standalone cluster
yarn-client in Yarn client mode
yarn-cluster in Yarn cluster mode
mesos://host:5050 in Mesos cluster

我这里是 spark on yarn 所以我配置的 master 为yarn,提交模式为 cluster,我设置为 client 的时候运行任务一直卡着不动

排错

我这里是在docker里搭建的,中间还报了其它的错

java.lang.RuntimeException: org.apache.zeppelin.interpreter.InterpreterException: org.apache.thrift.transport.TTransportException: java.net.ConnectException: Connection refused

后来发现是AM无法实例化的原因

host -i

发现docker 里是一个虚拟ip

解决方法:

启动docker时指定网络连接方式

host模式 :

docker run 使用 --net=host指定

docker使用的网络实际上和宿主机一样

遗留问题

1、无法使用client模式

2、无法访问hive表

如果有知道的大佬,请指导

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!