重点记录的技术面试 如下:
1.请简述ZooKeeper的选举机制?
2.客户端对ZooKeeper的ServerList的轮询机制
3.客户端如何正确处理CONNECTIONLOSS(连接断开) 和 SESSIONEXPIRED(Session 过期)两类连接异常
4.一个客户端修改了某个节点的数据,其他客户端能够马上获取到这个最新数据吗?
5.ZooKeeper中使用watch的注意事项有哪些?
6.能否收到每次节点变化的通知?
7.ZooKeeper节点类型?
8.Hive表关联查询,如何解决数据倾斜的问题?
9.请谈一下Hive的特点,Hive和RDBMS有什么异同?
10.Hive有哪些方式保存元数据,各有哪些特点?
11.Hive内部表和外部表的区别?
12.Hive底层与数据库交互原理?
13.Hive的HSQL转换为MapReduce的过程?
14.Hive如何进行权限控制?
15.HBase的特点是什么?
16.HBase和Hive的区别?
17.请描述HBase中scan对象的setCache和setBatch方法的使用?
18.flume配置方式
19.flume和kafka采集日志区别
公司:北京长弘迅程科技有限公司,公司有几十人,创业型公司,面试官感觉还不错,基本围绕Hadoop大数据分析和zk&dubbox问的比较多。本人二本计算机,学习大数据是做程序员的表哥怂恿的,不过感谢表哥,我天生也对数据比较敏感,也不愿意甘心只搞编程,本次面试大概1个多小时吧,还有一家,不过不报什么希望,后面有新的面试再更新。
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录