大数据技术原理与应用
概要介绍 大数据期末整理,岩哥牛逼 。 往期文章 数据可视化思维导图 网页设计期末复习 选择+简答+大题 文章目录 第一章 1. 大数据的4个v 2. 大数据的影响 3. 大数据的两大核心技术及对应关系 4. 产品对应关系 5. 三者关系 第二章 1. hadoop最初是创始人Doug Cutting 开发的文本搜索库,hadoop源自于2002年的Apache Nutch项目 2. hadoop分布式处理的软件框架 ,特性如下 3. Apache hadoop 版本演变 1.0-》2.0 4. hadoop生态系统 5. hadoop项目组建功能 6. 配置文件 core-site.xml hdfs-site.xml 参数(属性)理解 第三章 1. 总而言之 HDFS实现以下目标 2. HAFS特殊的设置,使得本身具有一些应用局限性 3.块的概念 4. HDFS主要组件的功能 (名称节点 数据节点)(课本更详细) 5. 名称节点的数据结构 6. 第二名称节点: 7. 第二名称节点的工作流程(个人概括) 8. HDFS体系机构概述 9. HDFS通信协议 10. 多副本方式冗余数据的保存 11. 数据存储策略(重点) 12. 数据错误与恢复(名称节点出错 数据节点出错 数据出错)(了解) 13. HDFS数据读写操作(背)(待补充) 第四章 1. 从BigTable说起 2.