1. 在处理大数据过程中,如何保证得到期望值
2. 如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库
3. 如何判别mapreduce过程有好的负载均衡
4. MapReduce如何调优
5. 了解zookeeper吗?介绍一下它,它的选举机制和集群的搭建
6. .spark streming在实时处理时会发生什么故障,如何停止,解决
项目业务、分布式爬虫、Hadoop大数据分析、zk&dubbox、spark,之前刷题不太够,最后还是会见光死,挑一些问的比较印象深刻的,分享给大家。
验证码登录>
验证码登录>
自动登录 | 忘记密码?
密码登录>
自动登录