大数据实验室(大数据基础培训)——概要
为某企业做的培训,完整文档见: http://gudaoxuri.github.io/bd-lab/ 1. 概要说明 本工程为大数据培训的指导教程,包含了培训实践各个环节的说明及相关代码。 1.1. 课程概要 名称 内容 第一天上午 元宝铺架构分享 大数据总揽 介绍当前大数据的基本情况 环境准备 为后续实践准备基础环境 第一天下午 Spark入门 介绍Spark框架的基本概念 Scala入门 介绍Scala语言的基础使用 Hadoop安装使用 动手实践Hadoop的安装、配置及基础使用 Spark安装使用 动手实践Spark的standalone安装、配置及基础使用 案例分析:ybMAP 介绍元宝铺数据处理遇到的问题及如何解决 第二天上午 Zookeeper安装使用 动手实践Zookeeper的安装、配置及基础使用 HBase安装使用 动手实践HBase的安装、配置及基础使用 Hive安装使用 动手实践Hive的安装、配置及基础使用 Kafka安装使用 动手实践Kafka的安装、配置及基础使用 Sqoop安装使用 动手实践Sqoop的安装、配置及基础使用 Zeppelin安装使用 动手实践Zeppelin的安装、配置及基础使用 生产环境说明 介绍用Ambari+HDP搭建生产环境,使用Hue、Kylin做分析 案例分析:垂直行业数据运营平台