Hadoop完全分布式配置及常见错误集合

JDK配置和Hadoop安装网上教程比较多，就不多说了。

1.ssh配置(实现在主机之间执行指令时不需要输入密码)。

1).在所有机器上建立.ssh目录(假设在/home/user下)

$mkdir .ssh

2).在namenode上生成密钥对，$ssh-keygen -t rsa

3).然后一直【Enter】,即默认保存在~/.ssh/id_rsa文件中。

4).接着$cd ~/.ssh (这几个个命令只需在NameNode上执行就OK了)

$cp id_rsa.pub authorized_keys

$scp authorized_keys DataNode1:/home/user/.ssh

$scp authorized_keys DataNode2:/home/user/.ssh

5).进入所有机器的.ssh目录，改变authorized_keys文件的许可权限:$chmod 644 authorized_keys

这时从NameNode向其他机器(DataNode)发起SSH连接，只在第一次登录时需要输入密码。另外ssh连接过程中时出现
"Agent admitted failure to sign using the key" 时，在windows下"服务"启动VMware Agent Service这个服务。再重启VMware即可。

2.DataNode和NameNode未启动

1).格式化分布式文件系统 $bin/hadoop namenode -format;

2).启动hadoop守护进程 $bin/start-all.sh:

Q: 可能会出现"chown: changing ownership of ‘/hadoop-0.20.203.0/bin/../logs’: Operation not permitted"的错误，

A:不能自动创建或读取文件夹，跟权限有关系：可能文件或目录是用root用户创建的，先用root登录把logs目录删了，然后换成普通账户，再运行bin/start-all.sh

3).用jps命令检测启动情况 $bin/jps

正常情况下，在NameNode上会启动NameNode、JobTracker、Secondary NameNode进程