virtualbox 虚拟3台虚拟机搭建hadoop集群
用了这么久的hadoop,只会使用streaming接口跑任务,各种调优还不熟练,自定义inputformat , outputformat, partitioner 还不会写,于是干脆从头开始,自己搭一个玩玩,也熟悉一下整体架构。 整体环境: 主机Win7 i5 4核 8G内存 笔记本; 虚拟机(客户机)采用Centos5.9 ( 用这个的原因是不想用图形界面,并且以后还想试着装一下ICE) 3台互联的虚拟机搭建 Hadoop集群: 1. 选用virtualbox V4.2.18 + Centos 5.9 virtualbox V4.2.18 下载地址: http://dlc.sun.com.edgesuite.net/virtualbox/4.2.18/VirtualBox-4.2.18-88781-Win.exe Centos 5.9 下载地址(共9个iso文件): http://mirror.bit.edu.cn/centos/5.9/isos/x86_64/ 2. 安装virtualbox 和 Centos5.9 3. hadoop集群用3台机器,拓扑如下: master: ip:192.168.56.120 机器名: master 启动NameNode 启动JobTracker slave1: ip: 192.168.56.121 机器名:slave1