大数据时代Hadoop的本质,你有过认真了解吗
除非你过去几年一直隐居,远离这个计算机的世界,否则你不可能没有听过Hadoop,全名Apache Hadoop,是一个在通用低成本的硬件上处理存储和大规模并行计算的一个开源框架,Hadoop本质的12点介绍,具体如下: 1.hadoop是由多个产品组成的。 人们在谈论Hadoop的时候,常常把它当做单一产品来看待,但事实上它由多个不同的产品共同组成。 Russom说:“Hadoop是一系列开源产品的组合,这些产品都是Apache软件基金会的项目。” 一提到Hadoop,人们往往将其与MapReduce放在一起,但其实HDFS和MapReduce一样,也是Hadoop的基础。 2.Apache Hadoop是开源技术,但专有厂商也提供Hadoop产品。 由于Hadoop属于开源技术,可免费下载,所以IBM、Cloudera和EMC Greenplum等厂商都可以推出他们各自的Hadoop特别发行版本。 这些特别发行版本一般都会有一些附加特性,比如高级管理工具及相关的支持维护服务。有人可能对此嗤之以鼻:既然开源社区是免费的,那么我们为什么还要为它的服务付费?Russom解释道,这些版本的HDFS对一些IT部门更合适,特别是企业IT系统已经相对成熟的用户。 3.Hadoop是一个生态系统,而非一个产品。 Hadoop是由开源社区和各个厂商共同开发和推动的。具体说来