ambari

how to reduce the number of containers in the query

混江龙づ霸主 提交于 2019-12-01 10:05:39
问题 I have a query using to much containers and to much memory. (97% of the memory used). Is there a way to set the number of containers used in the query and limit the max memory? The query is running on Tez. Thanks in advance 回答1: Controlling the number of Mappers: The number of mappers depends on various factors such as how the data is distributed among nodes, input format, execution engine and configuration params. See also How initial task parallelism works MR uses CombineInputFormat, while

ambari部署hadoop集群

故事扮演 提交于 2019-11-29 09:41:51
1、 基本工具 yum、scp、curl、wget、pdsh、ssh 2、 环境准备 2.1、系统环境 Centos6.5 64bit Ambari 1.4.3.38 2.2、ambari server 与 ambari agent 服务器root ssh无密互访 Ambari server服务器 Ssh-keygen 生产私钥公钥 id_rsa id_rsa.pub Ambari agent服务器 将ambari server 服上root生成的id_rsa.pub上传到各个集群机器上。 c at id_rsa.pub >> authorized_keys Ambar server s sh root@ambariagent 2.3、所有集群机器时间同步 安装ntp服务 2.4、所有集群机器关闭selinux s etenforce 0 2.5、所有集群机器关闭防火墙 /etc/init.d/iptables stop 2.6、所有集群机器centos关闭packagekit vim /etc/yum/pluginconf.d/refresh-packagekit.conf enabled=0 3、 安装准备 注:本节只需要在ambari server服务器上做 3.1、安装源 wget http://public-repo-1.hortonworks.com/ambari

Ambari加密显示组件配置文件中设置的密码数据

◇◆丶佛笑我妖孽 提交于 2019-11-29 06:27:50
文章目录 组件在Ambari页面属性加密显示设置 组件在Ambari页面属性加密显示设置 在Ambari页面,对于自定义组件,在ADVANCED中显示组件配置文件中的内容时,特别是密码时,明文显示,未加密,该过程就是记录如何设置,使Ambari前端显示自定义组件输入密码时加密显示。 找到组件密码对应的xml文件,一般ADVANCED下面Advanced开头的区域对应该组件configuration中的xml文件; 再进入对应的xml文件,找到对应的name; 在property内添加如下内容,使组件安装时加密显示,安装完成后加密显示; < value-attributes > < type > password </ type > < overridable > false </ overridable > </ value-attributes > 来源: https://blog.csdn.net/Happy_Sunshine_Boy/article/details/100540727

离线centos6下安装Ambari2.2.1和HDP2.4

随声附和 提交于 2019-11-28 12:19:26
1.首先要下载它们的安装包,别尝试着在yum来下,特别慢,最好的方式是通过建立本地资源的方式来安装。 http://public-repo-1.hortonworks.com/HDP/centos6/2.x/updates/2.4.0.0/HDP-2.4.0.0-centos6-rpm.tar.gz http://public-repo-1.hortonworks.com/HDP-UTILS-1.1.0.20/repos/centos6/HDP-UTILS-1.1.0.20-centos6.tar.gz http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.2.1.0/ambari-2.2.1.0-centos6.tar.gz 2.立本地资源库 在var/www/html下建立一个hdp目录,如果没有的请先安装httpd yum install httpd 把下到的三个资源安装解压完毕之后,传到hdp目录下,然后重启httpd服务,用下面三个地址来测试一下是否可以通过网址访问了,然后准备三个文件,hdp.repo,ambari.repo,hdp-util.repo 不要按照官方说的那个做,那个是会报错的,我把我的放出来,大家自己照着弄,修改一下地址就行,然后把这三个文件复制集群中的所有机器的/etc

Ambari离线安装hadoop集群所需资源包

柔情痞子 提交于 2019-11-28 12:17:56
ambari安装包 http://public-repo-1.hortonworks.com/ambari/centos6/ambari-1.7.0-centos6.tar.gz HDP(Hortonworks Data Platform) http://public-repo-1.hortonworks.com/HDP/centos6/HDP-2.2.0.0-centos6-rpm.tar.gz http://public-repo-1.hortonworks.com/HDP-UTILS-1.1.0.20/repos/centos6/HDP-UTILS-1.1.0.20-centos6.tar.gz CentOS 6: http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.5.0.3/ambari-2.5.0.3-centos6.tar.gz http://public-repo-1.hortonworks.com/HDP/centos6/2.x/updates/2.6.0.3/HDP-2.6.0.3-centos6-rpm.tar.gz http://public-repo-1.hortonworks.com/HDP-UTILS-1.1.0.21/repos/centos6/HDP-UTILS-1.1

Ambari在离线环境中安装Hadoop集群

一曲冷凌霜 提交于 2019-11-28 12:16:37
(WJW)Ambari在离线环境中安装Hadoop集群 如果手工安装Hadoop集群,在管理和后继部署中,越来越多的问题不断出现,主要如下: 各集群节点的配置同步 新应用的部署:比如为集群添加hbase应用,需要很细心复杂的配置才能完成,而且要是操作错误,还可能导致正常的集群崩溃 新集群节点增加:同上 集群架构调整:比如原来hdfs的namenode和ResourceManager等应用主节点都是放到一台服务器上的,当应用多后,需要调整独立,发现异常复杂 Hadoop集群监控 Apache有个项目Ambari能很好的解决上述所有问题! Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目.目前最新的发布版本是 2.1.2. 就 Ambari 的作用来说,就是创建,管理,监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop. 用一句话来说,Ambari 就是为了让 Hadoop 以及相关的大数据软件更容易使用的一个工具. 说到这里,大家就应该明白什么人最需要 Ambari 了.那些苦苦花费好几天去安装,调试 Hadoop 的初学者是最能体会到 Ambari

HDP 企业级大数据平台

吃可爱长大的小学妹 提交于 2019-11-28 04:57:24
一 前言 阅读本文前需要掌握的知识: Linux基本原理和命令 Hadoop生态系统(包括HDFS,Spark的原理和安装命令) 由于Hadoop生态系统组件众多,导致大数据平台多节点的部署,监控极其不方便,因此一些Hadoop厂商提供了企业发行版,例如CDH,HDP等。这些Hadoop企业发行版将Hadoop生态系统的开源组件整合到了一个平台之上,并做了一些定制,提供了安装,部署,监控等工具,大大方便了平台运维人员。 CDH是Cloudera公司向企业客户提供的基于Apache Hadoop生态系统构建的大数据分析平台。 HDP是Hortonworks公司基于Hadoop生态系统开源组件构建的大数据分析平台。 我们选用HDP搭建企业级大数据平台,下面会着重分析说明原因。 二 大数据平台说明 目前企业级Hadoop发行版,免费版本主要有Hadoop Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称“CDH”)和Hortonworks版本(Hortonworks Data Platform,简称“HDP”)。 2.1 CDH与HDP比较 CDH HDP 相同点 1.相对于Intel Hadoop 和IBM Hadoop的发行版而言,两者都是免费版。 2.相对于Apache 开源社区版本,更易于维护,管理

[ambari环境搭建](未完待续)

。_饼干妹妹 提交于 2019-11-28 01:05:24
【安装】 https://blog.csdn.net/Happy_Sunshine_Boy/article/details/86595945#commentBox https://www.jianshu.com/p/f62947a88527 【卸载】 https://www.cnblogs.com/lingluo2017/p/8719733.html 【错误】: 1、Python script has been killed due to timeout after waiting 1800 secs <解决方案> https://blog.csdn.net/yeruby/article/details/49618933 2、错误以及解决方法(命令如果报错去掉-rf) 3、报错:EOF occurred in violation of protocol (_ssl.c:618) <解决方案> By adding below config in [security] section of vi /etc/ambari-agent/conf/ambari-agent.ini force_https_protocol=PROTOCOL_TLSv1_2 vi /etc/python/cert-verification.cfg [https] verify=disable 来源: https

ambari介绍及安装

眉间皱痕 提交于 2019-11-27 23:55:43
Ambari简介 Ambari概述 Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的创建、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等;除此之外,Ambari还支持Spark、Storm等计算框架及资源调度平台YARN。 Apache Ambari 从集群节点和服务收集大量信息,并把它们表现为容易使用的,集中化的接口:Ambari Web. Ambari Web显示诸如服务特定的摘要、图表以及警报信息。可通过Ambari Web对Hadoop集群进行创建、管理、监视、添加主机、更新服务配置等;也可以利用Ambari Web执行集群管理任务,例如启用 Kerberos 安全以及执行Stack升级。任何用户都可以查看Ambari Web特性。拥有administrator-level 角色的用户可以访问比 operator-level 或 view-only 的用户能访问的更多选项。例如,Ambari administrator 可以管理集群安全,一个 operator 用户可以监控集群,而 view-only 用户只能访问系统管理员授予他的必要的权限。 Ambari体系结构 Ambari 自身也是一个分布式架构的软件

Ambari安装Ranger详细教程

非 Y 不嫁゛ 提交于 2019-11-27 13:02:57
准备工作 1.找到ambari-server所在的服务器(这里是hadoop-02) 2.进入/usr/java/share/java/目录下查看数据库驱动包是否存在,并确认是什么类型的数据库 这里确认ambari使用的是mysql数据库,驱动包路径:/usr/share/java/mysql-connector-java.jar 3. 根据前两步执行命令 ambari-server setup --jdbc-db=mysql --jdbc-driver=/usr/share/java/mysql-connector-java.jar 正式安装 1. 进入ambari管理界面,点击add service 2. 选择 ranger 模块进行安装 3. 准备工作若成功完成,则可以勾选复选框进行下一步 4. 选择需要安装到哪一台服务器,注意Ranger Usersync和Ranger Admin必须安装到同一台服务器 5. Ranger Tagsync安装到 Hadoop-05 6. 配置 DB FLAVOR 选择MySQL,依据ambari使用的数据库来定 Ranger DB host 选择安装MySQL的主机名 Ranger DB username 设置ranger用户名,默认rangeradmin,此处默认 Ranger DB password 设置ranger密码,填写两次