求职刷题神器

funit.cn

  • 面试公司:腾讯面试岗位:后台开发(大数据方向)面试背景:腾讯是找了内推,后台开发,但是与大数据相关。面试都在腾讯会议,一面手撕代码是屏幕共享,二面手撕代码在腾讯文档。一面·自我介绍。·Spark和Hadoop的区别·MR流程、RDD流程·newmalloc区别epoll原理看过吗?讲一下多态·写到算法题吧:二分查找,写一下旋转数组最小值(又是这道题。我说这道题之前做过,面试官没再让我写)。二面·自我介绍、在家里?没开学?·学过Hadoop,讲一下MR流程。说一下Partition分区的优化是怎么做的(Partition没答出来)·MR会有数据倾斜,讲一下如何解决(说了一些方法,被要求说的更详细一些。比如为什么增加Reduce数量就可以提高效率,如何自定义分区,如何重新设计key)·然后问的是HadoopStreaming(没听说过,讲了下sparkstreaming)·看简历上有个socket项目,问如何讲一下流程,问如何从socket中提取数据(时间太长,完全记不清了)·写个算法题。给一个树,每个节点的val都有取或不取两种状态。限定条件是,直接连接的节点不能同时取或者不取(比如父子节点)想的是分成四次递归。问如何剪枝。没答出来上面那个题没想法了。那咱们换个,给一个二叉树和两个节点a,b找出二叉树的最近公共祖先。(剑指offer原题最后一题)平时大部分都是PyJavaScala开发,很少用C++,就很难受。还需要多学习啊。
    5 0 81
  • 面试公司:北京中北信科技发展有限公司面试岗位:大数据开发公司情况:坐标北京东城区,公司大概有几百人。面试背景:因为疫情的原因,所以是远程面试,面试了两次,第一次是电话面试,第二次是视频面试。问的较多的是项目细节、spark、kafka等。整理了一下,供大家参考吧!电话一面1、自我介绍2、职业发展方向3、挑选一个项目来讲,讲述其中一个开发点,开发流程,项目商用情况,项目数据反馈情况?4、项目细节,数据落地,数据更新频率;(这个根据讲的项目和开发点提问的)5、项目集群规模?Spark集群版本?开发语言?6、使用的资源调度器?7、Sparkshuffle?8、spark-submit命令提交任务的流程(源码层面流程)?9、spark-submit命令的参数?10、Spark容错机制?11、DAGScheduler和TaskDAGScheduler作用?12、谁划分stage?谁划分Task?13、Cluster和Client模式区别?14、Kafka如何保证数据消费一次?重复消费问题?15、Spark的性能调优?视频二面(采用腾讯会议的视频面试,看不到面试官)1、自我介绍2、职业发展方向3、描述一下开发经历4、挑选一个项目讲,以技术流程描述项目实现。(切记不要过多描述项目需求和业务,重点描述项目技术实现,用技术说话。)5、测试环境的节点?预生产环境的节点?生产环境的节点?6、什么是伪分布式?怎么搭建伪分布式?面经总结第一次电话面试有些部分项目细节回答的不是太清楚,到了二面好多了。刚开始面试的时候技术要求挺高的。对于一些技术细节问的挺详细的,二面的
    2 0 60
  • 面试公司:招银网络科技有限公司面试岗位:大数据开发工程师一面(电话面试)当时刚找到一个教室学习不久,就接到了深圳的电话,心想应该是面试官的电话,赶忙跑出去听了电话;面试官应该不是搞大数据了,并没有问我大数据有关的问题,不过电话面应该都只是基础面吧有关问题如下:1.介绍项目:面试官问了这个项目他感兴趣的点,不过并没有深挖2.JAVA基本类型:还会问到各个类型的储存大小,还有装箱拆箱相关问题3.JAVA集合:又是java集合全家桶,感觉是面试必问的4.二分查找:用自己的话描述一下二分查找的过程5.数据库存储引擎:介绍一下数据库的存储引擎、隔离级别、事务等相关知识6.数据库锁:数据库有关的锁,各种行级锁表级锁;说说悲观锁和乐观锁两种思想7.数据库连接:数据库连接的方式,左连接右连接内连接8.反射:java反射相关知识感觉电话面反而让人更加紧张,想起了上一次美团的电话面也是很紧张,竟然好一段时间头脑空白,所以这次电话面还是表现得不好,但是没想到过了二面(现场一面)现场一面我是从广州去深圳的公司里面面的,当时是提前一天从广州过去,第二天上午一大早就去了,去了等了半个小时便进去面了相关问题如下:1.arraylist和linkedlist2.arraylist扩容,为什么这么扩容3.hashmap和hashtable和currentHashMap4.hashmap的哈希取模5.jdk1.8的hashmap的改进6.红黑树7.二叉查找树8.平衡树9.b+树10.
    1 0 51
  • 面试公司:腾讯TEG面试岗位:大数据开发一面很多原理和计算机基础c++1.反转链表和两个字符串最大公共子串2.osi的七层和什么的四层3.tcp和udp三次握手4.进程和线程区别5.hadoop分布,zookeeper选举6.hive和hbase区别,hbase都是mapreduce吗7.hbase底层8.mapreduce,shfful,经常查询用什么9.hbase原理二面1.打印二叉树每层最右边的节点层序遍历2.synchronized这个用在类上,用在方法上和变量上有什么区别3.flume用过没有,kafka原理4.namenode宕机5.大数据经常查询用hbase还是hive6.shell会用吗,awk会用吗7.乐观锁和悲观锁、自旋锁、互斥同步、读写锁
    4 0 229
  • 面试公司:银联面岗位:大数据实习面试过程:一面|笔试·(图形推理、逻辑推理、数字推理、语文、资料分析)50分钟·(金融,经济、管理、法律、基础知识等)20分钟·英语阅读20分钟·专业知识(单选和不定项)30分钟,一些基本统计理论和Hadoop、Spark知识。二面|心理测评收到面试通知,再次收到电话确认参加面试后收到心理测评的邮件,心理测评内容就是正常的一些题目,会有一些重复的题,会测试你的诚信度和一些简单的性格测试。三面由于疫情原因没有群面,直接单面的,原定是15分钟,最后可能面的太快了然后就被提前了,进去之前还想着要好好表现争取多答一点,然后感觉10分钟左右就出来了吧。先是1分钟的自我介绍,然后问了4个问题,每个问题有3分钟回答时间,太紧张了,具体问题忘光了,就记得一个Hadoop有哪些组件和如果要你做不擅长的事怎么办,剩下两个也都是behavior的问题。面完感觉凉凉了。面前问了几位一起参加面试的人,都是复旦、同济、华师大的,也不知道我怎么混进面试里的。
    3 0 74
  • 面试公司:360面试岗位:大数据开发实习状态:已经拿到offer一面:1.先自我介绍2.问了项目的问题,问了下项目中如何实现的Mysql和hdfs数据同步3.讲一下对Hadoop的了解讲了下HDFS原理、MapReduce的过程,想讲HDFS检查点机制没让讲。4.Spark和MapReduce的区别?是不是用了Spark就不需要MapReduce了?(答得不太好)5.问对Hive的了解?自己提了下数据倾斜6.如果有海量数据,如何求Top10?7.Linux平常用的指令?8.Hive内部表和外部表?建表语句?为什么要分区?9.还有什么问题要问我吗?(问了下主要工作内容)二面:还是问项目,项目具体深挖,大数据组件:kafka,hbase,flume。360有个经典的面试问题就是TopK问题,一二面试均有涉及。很多部门也都会问。
    4 0 191
  • 面试公司:平安产险面试岗位:大数据开发面试时长:1小时左右面试问题:1、hive接触过哪些文件存储类型,text的优劣、列式存储的好处、SequeceFile的好处、RCFile有没有用过2、对mr的理解3、内部表和外部表的区别,对应的应用场景4、mapjoin和reducejoin的区别5、写过最复杂的sql,场景是什么,工作中什么样的sql写的比较多6、hive的数据倾斜,怎么解决7、宽依赖和窄依赖的理解shuffle、stage,发生shuffle就会划分stage,产生宽依赖8、日志数据、交易数据的数据量9、数仓的理解,我从分层角度回答、元数据管理10、数据治理,怎么监控数据是否跑错11、对项目的理解,项目经历的职责
    4 0 98
  • 刚刚参加了快手大数据研发工程师面经,从下午2点到6点多,全程见了2位HR和4位研发,其中2位研发是比较高级的leader。目前等HR回复中。个人情况:自己之前在小公司做了2年大数据,人手少,哪里需要哪里搬,所以这次被考察的面也有点广。题目做了一下简单记录,会有遗漏,并且没有按顺序哈,个人觉得大概回答下来80%多吧。Java1.HashMap的底层数据结构,为什么JDK8要用红黑树.ConcurrentHashMap的底层数据结构,如何保证线程安全2.synchronized关键字的本质,作用是什么.volatile关键字的作用,哪些情况下会用它3.Java线程的几大状态及转换.线程可重入是什么概念,可重入锁呢4.如果要设计一个线程池,需要考虑哪些要素.Executors工厂类能创建哪些线程池,用过哪些5.讲一讲熟悉的设计模式.单例模式及工厂模式的实现方法.装饰器模式是怎么一回事6.讲一讲熟悉的JVMGC算法,常用的垃圾收集器.CMS有什么优缺点7.一个Java应用上线后,关注哪些性能指标.如果响应时间过长或者CPU占用过高,如何排查,用哪些工具或命令大数据组件1.是否自己搭建的集群,集群节点数及配置2.Hadoop的XML配置文件有哪些,改过哪些参数,分别代表什么含义3.HDFSNameNode高可用如何实现,需要哪些角色.YARN有哪些组件,如何分配资源4.SparkRDD有哪些特点,宽依赖和窄依赖.RDD的缓存级别5.DAGScheduler及stage如何划分.给一个比较复杂的RDDlineage,手动划分stage和task6.SparkStreaming以一定的时间
    6 0 130
  • 面试公司:小米面试岗位:大数据开发PS:当时没有录音,不少题目的当时怎么问的记不清了,顺序也可能是乱的,只是大体记下了知识点~~~一面:1、自我介绍2、为什么想学大数据3、mr的流程4、hadoop1和2的区别5、spark为什么比mr快6、spark的任务调度流程7、hive优化8、hbase的一个读写流程9、hbase的memstore冲刷条件10、问想在武汉还是北京11、java基础12、讲一下反射面试感受:没有算法题,之前做的项目比较简单没有怎么问项目,数仓学的不多也没怎么问二面1、自我介绍2、项目问了一点过于简单没什么好问的3、spark调度流程4、spark的shuffle5、spark为什么快6、spark的rdd弹性分布式数据集7、讲了为什么说是弹性的紧接着8、spark基于内存如果放不下了怎么办9、kafka的ISR队列leader选举10、kafka的消息重复和丢失怎么解决11、zookeeper在kafka中的作用12、zookeeper底层是怎么实现的13、kafka的应用场景14、java基础线程创建15、线程池的参数什么的16、反射17、单例模式有多少种,没有写代码,思路说下18、高并发中concurrenthashmap和hashmap讲了下区别初始容量hash()中间是怎么算的等等这些19、阻塞队列20、netty框架大概讲了一下BIONIOnetty发展过程netty里面的循环组什么的讲了一下技术方面的问题大
    7 0 128
  • 面试公司:百度面试岗位:大数据开发面试过程:一面(电话面试:45分钟)1.自我介绍2.项目介绍3.join的leftjoin,innerjoin,crossjoin4.笔试题5.MR6.冒泡排序7.维度建模三种模型8.Awk9.动态分区静态分区10.数据倾斜11.Join大小表大概记住了这些,还有几个问题有些忘了,面试官小姐姐人很好。二面(电话面试38分钟)1.项目介绍(深度挖掘,问到自闭)2.Sql取A、B两个表的交集,A表减交集,B表减交集3.Sql成绩排名前三的学生的情况4.Sql左连接的情况5.二叉树查找6.两个有序链表合并7.Shell、linux常用的语句8.工厂模式9.mysql中myIsam,Innodb各自区别和使用场景10.没有大数据组件的任何问题啊,全是实际开发中的问题。希望能有三面,许愿许愿。三面(视频面试48分钟)1.自我介绍2.自己算法代码展示和介绍3.比赛期间数据集的处理4.手撕代码:两个有序数组的交集(写的有点错误)5.动态分区6.Linux常用命令7.Spark8.生活、工作中的问题
    4 0 106
  • 微信扫码加好友进群