面试公司:北京中北信科技发展有限公司
面试岗位:大数据开发
公司情况:坐标北京东城区,公司大概有几百人。
面试背景:
因为疫情的原因,所以是远程面试,面试了两次,第一次是电话面试,第二次是视频面试。问的较多的是项目细节、spark、kafka等。整理了一下,供大家参考吧!
电话一面
1、自我介绍
2、职业发展方向
3、挑选一个项目来讲,讲述其中一个开发点,开发流程,项目商用情况,项目数据反馈情况?
4、项目细节,数据落地,数据更新频率;(这个根据讲的项目和开发点提问的)
5、项目集群规模?Spark 集群版本?开发语言?
6、使用的资源调度器?
7、Spark shuffle?
8、spark-submit命令提交任务的流程(源码层面流程)?
9、spark-submit命令的参数?
10、Spark容错机制?
11、DAGScheduler和TaskDAGScheduler作用?
12、谁划分stage?谁划分Task?
13、Cluster和Client模式区别?
14、Kafka如何保证数据消费一次?重复消费问题?
15、Spark的性能调优?
视频二面(采用腾讯会议的视频面试,看不到面试官)
1、自我介绍
2、职业发展方向
3、描述一下开发经历
4、挑选一个项目讲,以技术流程描述项目实现。(切记不要过多描述项目需求和业务,重点描述项目技术实现,用技术说话。)
5、测试环境的节点?预生产环境的节点?生产环境的节点?
6、什么是伪分布式?怎么搭建伪分布式?
面经总结
第一次电话面试有些部分项目细节回答的不是太清楚,到了二面好多了。刚开始面试的时候技术要求挺高的。对于一些技术细节问的挺详细的,二面的话偏向宏观的问一下,介绍了一下公司的项目和具体的对人员的要求,收获满满。
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录