一面
1.自我介绍
2.Mapreduce 原理
3.数据倾斜怎么办
4.比如统计广东省的记录数据倾斜,怎么自定义 partition ,代码?(我觉得我说得挺清楚了,一定要代码写出来)
5.推荐系统项目细节,角色,做了什么
6.华为软件精英挑战赛,如何调参
7.代码,两个集合取交集,怎么最快
8.字符串反向输出,用递归实现
9.知道什么ETL工具
10.dataX架构
二面
1.自我介绍
2.项目细节
3.Mapreduce 原理
4.splitsize 如何确定,算法
5.数据倾斜怎么办
6.无 shuffle 的 过程叫什么
7.大数据组件都知道哪些
8.数据仓库和数据库的区别
9.数据库原理懂吗
10.数据库范式知道吗
11.sql 题,按某列排序,并增加排序编号(说了 mysql 怎么做,hive 有点忘了row_number没说明白,可惜了)
12.sql 题,一列从1到n顺序编号,一列是各种类别,输出某一类别编号是连续四个以上的数据行
13.代码题,两个集合取交集…,有哪些做法
14.平时有什么爱好
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录