1. 理论基础怎么样,比如数据结构,里面的快速排序,或者,树?讲一讲你了解的树的知识?(考察树)
2. spark开发分两个方面?哪两个方面呢?(考察spark)
3. 一个读取hdfs上的文件,然后count有多少行的操作,你可以说说过程吗。那这个count是在内存中,还是磁盘中计算的呢?(考察项目业务)
4. spark和Mapreduce快?为什么快呢?快在哪里呢?(考察spark)
5. 简单说一下Spark的内存迭代,Spark的RDD设计(考察spark)
6. RDD的数据结构是怎么样的?(考察RDD)
7. sparksql又为什么比hive快呢?(考察spark与hive区别)
8. 说一说你对hadoop的生态的理解(考察hadoop生态)
梳理了一下面经,顺便对此次面试有个总结,希望面试越来越好 !
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录