求职刷题神器

funit.cn

讨论区 > 求职面经 > 网易杭研 ---- 大数据开发

网易杭研 ---- 大数据开发

詩光轨車
发布于2020-12-28 10:19:32 158浏览
一面 

1.自我介绍

2.Mapreduce 原理

3.数据倾斜怎么办

4.比如统计广东省的记录数据倾斜,怎么自定义 partition ,代码?(我觉得我说得挺清楚了,一定要代码写出来)

5.推荐系统项目细节,角色,做了什么

6.华为软件精英挑战赛,如何调参

7.代码,两个集合取交集,怎么最快

8.字符串反向输出,用递归实现

9.知道什么ETL工具

10.dataX架构


二面

1.自我介绍

2.项目细节

3.Mapreduce 原理

4.splitsize 如何确定,算法

5.数据倾斜怎么办

6.无 shuffle 的 过程叫什么

7.大数据组件都知道哪些

8.数据仓库和数据库的区别

9.数据库原理懂吗

10.数据库范式知道吗

11.sql 题,按某列排序,并增加排序编号(说了 mysql 怎么做,hive 有点忘了row_number没说明白,可惜了)

12.sql 题,一列从1到n顺序编号,一列是各种类别,输出某一类别编号是连续四个以上的数据行

13.代码题,两个集合取交集…,有哪些做法

14.平时有什么爱好

本文首次发布于趣IT ,转载请注明出处,谢谢合作

网易杭研 ---- 大数据开发

  • 举报
  • 12
  • 0
  • 0
全部评论0

成为第一个评论的人

还可以上传7

表情
  • 快速扫码进群
    加入职友圈
下一步
知道了