一面(20min)
1、自我介绍?
2、Spark join的分类,实现过程,得到的结果?
3、Spark map join的实现原理?
4、Spark Shuffle过程?
5、SQL会写吗,写一个统计每个学科的前三名?
6、实习主要做了什么,用什么技术栈?
7、Python 方法的参数带两个*是什么意思?
8、Java反射生成对象?
9、Java对象的生命周期?
二面(20min)
1、自我介绍?
2、问了下实习做什么?
3、问了下在校项目?
4、数仓分层,每层做什么?
5、Spark Streaming和Flink的区别?
6、MapReduce熟吗?
7、Java GC说一下,我从内存模型开始说的?
8、写了几个题:
给了两个表三个SQL,把每个结果写出来,其实主要是join,不同join的结果
从一个String列表中移除大于某个String的元素(其实不知道为什么要出这个题)
图,最小代价生成树,什么算法,什么思想。
三面(20min)
1、主管面,自我介绍
2、Spark任务调度?
3、Spark Task失败要从头开始重试吗?
4、遇到过什么困难,怎么解决的?
5、HBase特点,应用场景?
6、实习做什么(每次都问)?
总结
感觉不同公司的侧重点不太一样,有些可能会偏向基础,有些可能会偏向工程,感觉还是面向简历复习效果比较好,把简历上写的熟悉的东西基本掌握了也差不多了,此外Java的基础也要比较熟,像ConcurrentHashMap,线程池,AQS的源码最好心里有点数,之后就是自己熟悉的技术栈的源码,常问到的技术点可以去看看,问到就是赚到。
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录