hadoop大致问题
一、项目编码实现 HDFS文件上传 HDFS文件下载 定位文件读取 通过API操作HDFS 通过IO流操作HDFS HDFS写数据流程 HDFS读数据流程 统计一堆文件中单词出现的个数(WordCount案例) 把单词按照ASCII码奇偶分区 统计手机号耗费的总上行流量、下行流量、总流量(序列化) 二、流程图及描述 HDFS写数据流程 HDFS读数据流程 NameNode&Secondary NameNode工作机制 查看fsimage文件 写数据流程 读数据流程 namenode和secondary namenode机制 查看镜像文件 查看编辑日志 DataNode工作机制 查看归档文件 (4)解归档文件 hadoop fs -cp har:///user/my/myhar.har/* /user/hadoop 查看edits文件 模拟namenode故障,并采用任一方法,恢复namenode数据 集群安全模式操作1 DataNode工作机制 服役新数据节点 退役旧数据节点 回收站配置 MapReduce程序运行流程分析 安全模式 回收站(参看hdfs,要与hdoop-site.xml里内容的刷新一致) 7.4 回收站 1)默认回收站 默认值fs.trash.interval=0,0表示禁用回收站,可以设置删除文件的存活时间。 默认值fs.trash.checkpoint