HDFS 2.X新特性
1 集群间 数据拷贝 1 . scp实现 两个远程主机之间的文件复制 scp -r hello.txt root@hadoop103:/user/atguigu/hello.txt // 推 push scp -r root@hadoop103:/user/atguigu/hello.txt hello.txt // 拉 pull scp -r root@hadoop103:/user/atguigu/hello.txt root@hadoop104:/user/atguigu //是 通过本地主机中转实现两个远程主机的文件复制;如果在两个远程主机之间 ssh 没有配置的情况下可以使用该方式。 2 . 采用 distcp 命令 实现 两个 Hadoop 集群之间的递归数据复制 [atguigu@hadoop102 hadoop-2.7.2]$ bin/hadoop distcp hdfs://haoop102:9000/user/atguigu/hello.txt hdfs://hadoop103:9000/user/atguigu/hello.txt 2 小文件存档 3.案例实操 ( 1 ) 需要启动 YARN 进程 [atguigu@hadoop102 hadoop-2.7.2]$ start-yarn.sh ( 2 ) 归档 文件 把/user