Hadoop原理与高级实践2019
本次课程以实际的演练(环境部署,程序开发)为主,分享大规模Hadoop应用的一线最有效实用经验,实践与理论相结合,让学员能够对Hadoop生态系统有一个清晰明了的认识,理解Hadoop系统适用的场景,掌握MapReduce与Hive的中高级应用开发技能,快速高效搭建稳定可靠的Hadoop集群,满足生产环境的标准。 课程内容的分为4个部分: 进入Hadoop的精彩世界,介绍Hadoop生态系统的各个组成模块与适用场景。 Hadoop部署,编程与管理,讲解演示在生产环境中选用和配置服务器需要注意的事项,介绍HDFS编程的Java API使用。 MapReduce编程:讲解演示MapReduce的中高级应用开发技能。 Hive与HBase编程:根据实际例子讲解Hive的使用与UDF的开发,以及如何通过JAVA编写HBase应用。 进入Hadoop的精彩世界 文件存储-HDFS HDFS-工作原理 数据计算MapReduce MapReduce工作原理 SQL分析-Hive 海量实时读写-HBase 工作流调度-Ooize 分布式协调系统--Zookeeper Hadoop部署与编程 Hadoop版本介绍与选择 Hadoop部署实践 Hadoop安装文件构成与配置体系 机器硬件建议配置 系统环境配置 基本参数配置与说明 进程分布规划与启动 Hadoop基本使用操作 HDFS 权限