bigdata hadoop 面试问题一
数据结构 1.栈和队列都是线性数据结构。 2. 栈(FIlO):只能在一端操作,即栈顶(如出栈、入栈),这种只能从一端操作的性质,意味着栈中的元素只能后进先出(先进后出)(last in first out)。(它的这种一端性,有时会用来实现double-end stack 双端栈) 3. 队列(FIFO): 是一个双端操作的数据结构,入队、和出队分别在一端操作。能够保持先进先出的性质(first in first out). 为了充分利用的队列的空间,常用来实现循环队列。 1、说说你们公司的hadoop项目? 2、你们项目的集群有多大,有几个节点,总共的数据量是多少? 3、 每天大约有多少数据量? 4、hdfs如何保持数据的一致性? 5、多线程并发是如何开发的? 6,、nio有哪些核心的类? 7、你们是如何解决hive数据倾斜问题的? 8、mapreduce中shuffle的原理 还有很多Java基础的问题,比如java虚拟机,垃圾回收机制等等,有些问题一开始自己并不是很懂,都会说这个自己还没有接触到,但是那个技术我懂,然后就把知识点转移到你熟悉的领域了,这样就把握主动了。无论面试成功或失败,都要总结,把之前被问到,没有完全掌握的都熟悉。到下次面试的时候就更有把握,到后面就会越面试越顺。 一、 内部表和外部表的区别 : 1.在创建表的时候