MapR

Cloudera CDH 、Hortonworks DHP和MapR比较

我是研究僧i 提交于 2019-11-29 22:21:10
目前啊,都知道,大数据集群管理方式分为 手工方式(Apache hadoop)和工具方式(Ambari + hdp 和Cloudera Manger + CDH) 。   手工部署呢 ,需配置太多参数,但是,好理解其原理,建议初学这样做,能学到很多。该方式啊,均得由用户执行,细节太多,切当设计多个组件时,用户须自己解决组件间版本兼容问题。   工具部署呢 ,比如Ambari或Cloudera Manger。(当前两大最主流的集群管理工具,前者是Hortonworks公司,后者是Cloudera公司)使用工具来,可以说是一键操作,难点都在工具Ambari或Cloudera Manger本身部署上。                手工方式                    工具方式 难易度        难,几乎不可能成功              简单,易行 兼容性        自己解决组件兼容性问题            自动安装兼容组件 组件支持数      支持全部组件                 支持常用组件 优点         对组件和集群管理深刻             简单、容易、可行 缺点         太复杂,不可能成功              屏蔽太多细节,妨碍对组件理解 工具名        所属机构      开源性        社区支持性 

hadoop发行版本之间的区别

匆匆过客 提交于 2019-11-28 21:47:11
Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。Hadoop的发行版除了有Apache hadoop外cloudera,hortonworks,mapR,华为,DKhadoop等都提供了自己的商业版本。商业发行版主要是提供了更为专业的技术支持,这对于大型企业更为重要,不同发行版都有自己的一些特点,本文就各发行版做简单对比介绍。 对比版选择: DKhadoop发行版 、 cloudera发行版 、 hortonworks 发行版 、 MAPR发行版 、 华为hadoop发行版 1、DKhadoop发行版 : 有效的集成了整个HADOOP生态系统的全部组件,并深度优化,重新编译为一个完整的更高性能的大数据通用计算平台,实现了各部件的有机协调。因此DKH相比开源的大数据平台,在计算性能上有了高达5倍(最大)的性能提升。DKhadoop将复杂的大数据集群配置简化至三种节点(主节点、管理节点、计算节点),极大的简化了集群的管理运维,增强了集群的高可用性、高可维护性、高稳定性。 2、 cloudera发行版 : CDH是Cloudera的hadoop发行版,完全开源,比Apache hadoop在兼容性,安全性,稳定性上有增强。 hortonworks 发行版 : Hortonworks 的主打产品是Hortonworks