如果这些问题都能回答上来,后边你应该能有二面或者结果通知吧。
公司:时代金典(北京)装饰工程有限公司,问了很多数据分析与优化方面的问题,自己感觉通过几率50%,/笑哭
1. 多个字段在join或者union中你如何判断字段和其他表的join关系?
2. 用什么方式对接的kafka
3. 说一下hive底层转为mr,底层是怎么转的
4. hive on spark 和spark on hive的区别
5. 在hive set中如何设计动态分区如何打开?
6. 分区中区分静态分区和动态分区,怎么定义静态分区和动态分区?还有有什么区别吗?
7. 建表语句中分区怎么分?
8. sql语句中在hivesql中如何创建索引?
9. 你用sparksql处理的时候 你处理过程中用的dataframe还是直接写的sql?为什么?
10. 说说mr执行过程
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录