社区 > 求职面经 > 网易杭研 ---- 大数据开发

网易杭研 ---- 大数据开发

詩光轨車 发布于2020-12-28 10:19:32   68浏览
一面 

1.自我介绍

2.Mapreduce 原理

3.数据倾斜怎么办

4.比如统计广东省的记录数据倾斜,怎么自定义 partition ,代码?(我觉得我说得挺清楚了,一定要代码写出来)

5.推荐系统项目细节,角色,做了什么

6.华为软件精英挑战赛,如何调参

7.代码,两个集合取交集,怎么最快

8.字符串反向输出,用递归实现

9.知道什么ETL工具

10.dataX架构


二面

1.自我介绍

2.项目细节

3.Mapreduce 原理

4.splitsize 如何确定,算法

5.数据倾斜怎么办

6.无 shuffle 的 过程叫什么

7.大数据组件都知道哪些

8.数据仓库和数据库的区别

9.数据库原理懂吗

10.数据库范式知道吗

11.sql 题,按某列排序,并增加排序编号(说了 mysql 怎么做,hive 有点忘了row_number没说明白,可惜了)

12.sql 题,一列从1到n顺序编号,一列是各种类别,输出某一类别编号是连续四个以上的数据行

13.代码题,两个集合取交集…,有哪些做法

14.平时有什么爱好

评论( 0
我要评论

还可以上传7

表情
热帖排行
热门话题
  1. 01 304人参与
  2. 02 186人参与
  3. 03 115人参与
  4. 04 57人参与
  • 12
  • 0
  • 0
  • 举报
  • QQ扫码
  • 微信扫码