求职刷题神器

funit.cn

  • 面试公司:字节跳动面试岗位:大数据研发工程师面试开始的时候,是一个很帅的小哥。他逻辑十分清晰,反而是面试人生初体验的我紧张的不行(捂脸)内容分为三个部分:1.自我介绍当时在自我介绍中简单讲了一下自己为什么想投递这个职位,以及这个职位对我来说有什么样子的吸引力,我契合这个职位的原因是什么?2.项目介绍自己在学校的时候做过一个数据分析,但是数据量不算很大。一个几百mb的csv文件数据分析,大概有400多万条数据(?,然后详细介绍了当时分析数据中变量关系用到了一些技巧和方法。怎么去判断这两个数据有没有关联性等等。然后简单的对这个数据进行机器学习建模,使用线性回归和KNN方法建立模型等等这一部分可能是因为自己当时作为小组长,对整个项目的逻辑比较熟悉,所以当时一直口若悬河,从框架到最后的report都说的蛮清楚的。从数据清洗-数据分析-报告撰写这三个流程去讲解所以感觉自己的项目介绍这块其实还算可以,原本以为一切就很顺风顺水,结果后面问的两道题目有点把我僵硬住了3.题目a)一道概率题目当时面试官问了我一道概率题,说从0到1的范围中去n个数字,这n个数字求和大于1的概率是多少?当时想了很久真的没有想出来,当时我说找到每一个数字大于1/n的概率然后再去寻找什么的等等,总之就是很紧张加上自己的逻辑很乱,所以并没有给出一个很好的答复。和面试官面面相觑了10分钟后最说了一句“抱歉我可能算不出答案”后面和群里的朋友聊了很久,通过积分的方式最后求证得出来是1-1/n!我们后面感觉这个题目确实有点难,只是没有想到面试官会问这个,也发现自己数学和概率不行的问题了b)算法题目是在一个矩阵中返回最大的正方形大小。我当时想的就是最简单的方法,在一个2Dlist中每个元素跑一遍,但是时间复杂度是O(m^n),然后面试官问我有没有可能更快点,我当时就想到用二分(?脑子进水了),然后面试官说可能也就加个log,然后反问我有没有可能是O(mn),
    6 0 73
  • 面试公司:字节跳动面试岗位:大数据开发工程师面试过程:一面40min【编程题】有两种数据,分别是被转发的用户和转发的用户,求原视频的用户以及转发的最长深度from:1,1,2,2,3,6to:2,3,4,5,6,7面试官提示转换成树的结构,我写了求树的最大深度的函数,面试官说构造树比较复杂,差不多写这样可以。【SQL题】有一张网页访问日志表,记录了user_id,session_id,page_id,timestamp用户在每点击一个连接跳转,就会记录一个时间戳,并且page_id排序后与时间戳的排序一致,现要求每个用户的每个页面所停留的时间。比如:11110:0011312:00面试官看了后说差不多是这样,但要考虑一个边界的问题,最后一个page_id之类的,请问这个怎么处理?·HiveSQL底层是怎么实现的?比如两张表Join的时候会有哪些操作?需要shuffle这一步吗?</p
    2 0 55
  • 面试公司:网易游戏面试岗位:大数据开发面试问题:一面(技术面:1个小时)1.自我介绍2.数仓整条链路具体负责哪块3.团队多少人4.Flume具体配置5.Flume到Kafka的一次性6.Kafka的exactlyonce如何保证7.Kafka下游消费速度比不上生产速度怎么办8.讲一下SparkStreaming的背压9.Kafka消费延迟很大对Kafka会有什么影响10.从kafka原理解释一下为什么Kafka消费越是延迟性能会越差11.HDFS有什么组件分别负责干什么12.详细说一下HDFS的HA13.计算框架用的什么14.YARN有什么组件分别负责干什么15.有没有了解过Yarn配置中的vmemory和vcore16.结合项目介绍一下数仓的建设、分层17.说一下拉链表18.Spark和MR的区别19.怎么增大SparkStreaming的并行度20.Spark持久化21.RDD,DataFrame,DataSet的区别22.JVM内存结构23.介绍一下GC24.挑一个最熟悉的垃圾收集器讲一下25.io,nio,bio的区别26.HashMap和HashTable的区别27.你有什么想问的吗二面(项目面:50分钟)1.自我介绍2.现在公司的部门架构,人员情况是什么样子的3.小组人员的分工是什么样子4.需要维护的服务器有多少台5.这些服务器日常需要做什么事情6.服务器用什么来做监控7.计算用什么来做监控8.任务运行出问题的频率9.集群
    4 0 45
  • 面试公司:美团面试岗位:大数据开发工程师面试结果:去了北京美团公司里面试,一上午面完,第二天通知高分通过一面(简单的聊了聊,10min):1、介绍项目,以及滴滴的实习经历2、JVM内存的划分3、垃圾收集算法4、数据建模,星型模型和雪花模型5、数仓层级的划分,怎么对接到mysql拿数据二面:1、sql题:写一条sql删除订单表中重复的记录2、sql题:一张网页浏览信息表,有两列,一列是网页ip,一列是浏览网页的用户(比如a或者b、c、d直到z),求这些网页被a和b或者a和c或者b和c两两组合访问的次数3、hive数据倾斜产生的原因,怎么解决4、设计学生成绩管理系统,符合第三范式要求,并绘出UML图5、算法题:斐波那契数列6、spark程序的运行流程7、sparkstreaming从kafka中读数据的两种方式8、讲讲数据库索引,B树和B+树9、Elasticsearch的索引,单field索引和多field的联合索引10、linux查看某文件的大小,vim中怎么替换内容11、海量数据的Count问题(单机),如果把大文件hash成不同的小文件,此时小文件装不下某个key对应的数据,该怎么办12、智力题:8升水,有一个5L的杯子和3L的杯子,怎么得到4升水三面:1、osi七层模型,三次握手和四次挥手,为什么两次握手不行2、kafka怎么保证高吞吐量,项目中有测过吞吐量吗,相比于其它MQ,为什么会选择ka
    3 0 42
  • 面试公司:腾讯IEG面试岗位:数据开发一面(全程问基础):1、介绍项目2、String、StringBuffer、StringBuilder的区别,怎么理解String不变性3、==和equals的区别,如果重写了equals()不重写hashCode()会发生什么4、volatile怎么保证可见性,synchronized和lock的区别,synchronized的底层实现5、sleep和wait的区别,sleep会不会释放锁,notify和notifyAll的区别6、了不了解线程的局部变量,讲讲线程池参数7、什么情况会发生死锁,死锁的处理方法8、Cookie和Session的区别,怎么防止Cookie欺骗9、从用户在浏览器输入域名,到浏览器显示出页面的过程二面(全程怼项目,压力面):1、看你写过UDF,谈谈对UDF的理解,写UDF的目的,代码怎么写的2、改造hive表后怎么进行数据一致性校验的,有没有自动化流程3、看你读过kafka源码,讲讲kafkabroker的源码里面你最熟悉的类,以及这个类的主要方法,用的什么设计模式4、项目里面从数据采集到最终的数据可视化,每个环节都有可能丢数据,怎么判断数据有没有丢,如果丢了如何定位到在哪一个环节丢的5、项目里面为什么要用kafkastream做实时计算,而不是用spark或者flink,kafkasql和sparksql了解过吗6、项目里面用到了时序数据库opentsdb,为什么要用这个,有没有跟其它的时序数据库对比过7、平时逛不逛社区,有没有参与过开源项目三面(接着怼项目):1、看你写了实时计算的程序,你怎么保证计算的结果肯定是对的2、数据接入的时候,怎么往kafkatopic里面发的,用的什么方式,起了几个线程,pro
    7 0 73
  • 面试公司:小米面试岗位:大数据开发个人情况:双非高校本科电子信息工程专业一面·自我介绍·讲一下你的银行项目及实现流程·说一下项目中的ETL怎样实现及数据清洗怎样解决的·JVM垃圾回收算法·线程和进程区别·hashmap和hashtable的区别·设计模式了解哪些?那你说说单例模式·你的说你在班级成绩排名·面试官自我介绍,并问你还有我的吗?总结:一面就这样完事了,我觉得自己答的一般,我个人觉得这个面试官主要负责java板块的面试,java方面问的比较多。二面两天后下午三点进行二面,我个人感觉这个比较精通大数据,反正没有足够思想准备,这次面试主要有两个面试官面我。1.介绍一下你的银行项目,说一下数据量的情况,说一下Hive表跟mysql各有多少数据?2.mysql的事务级别3.HadoopMapReduce的流程4.hdfs读写流程5.haspmap的实现原理及扩容机制6.kafka怎样保证数据一致性7.spark宽依赖和窄依赖8.reducebykey和groupbykey的区别9.你还有问我的吗?面试结果:面试结束我感觉我可能就没啥希望进入小米,结果二面过后五六天了吧!一个陌生的电话号码发短息说你接受实习吗?我就爽快的答应了并说十天后来上班,我接着问您那个公司啊!他没有回那个公司,他说尽快让hr联系我,第三天收小米hr电话,跟我谈了一下实习工资,那天我并没有直接说我接受,四天后答复,当时也收到航天科工面试邀请。结果第二天小米给我一个正式offer。经验总结:·尽量做个比较美观简历,海投多面试。·尽量早点去实
    0 0 150
  • 面试公司:北京猿力教育科技有限公司面试岗位:大数据开发面经一面:1.先是自我介绍2.问为什么选这个岗位3.问你了解hadoop的哪些组件,让你说一遍。4.让讲一下hdfs的写入过程,发请求给namenode,返回一个地址进行写入,写入完告诉namenode,namenode完成副本备份。5.讲一下项目中的遇到的问题,多线程,并发工具,并发容器。6.讲一下如何设计一个高并发的秒杀系统7.问python了解吗,讲一下线程和协程8.Hadoop的核心配置是什么9.问“jps”命令的用处?10.问HDFS存储的机制?协程自带上下文,切换不需要刷新cpu上下文和寄存器。更适合并发。协程和线程适用场景的区别。二面1.自我介绍2.问了一下家庭情况和城市意向3.问大学有啥困难和挑战没有4.问学习成绩,在学校做了什么5.让你评价自己6.问你对公司的了解7.对于加班怎么看
    1 0 80
  • 面试公司:字节跳动面试岗位:大数据开发实习面试过程:一面自我介绍介绍项目:详细项目中介绍下深度协同过滤算法,和mysql与hdfs同步的策略写两个Mysql①给出两个表,计算leftjoin的结果②一个广告的表,包含广告的id,广告的开始时间,广告的结束时间,给出一个时间(比如2021-03-02——2020-04-02)。所有与这个日期有交集的广告id.写两个算法题①写个层次遍历②写个排序数组中查找k这个数出现的个数(我用了二分查找,然后向前向后搜索)Spark会吧。介绍下宽窄依赖。(从action讲到shuffle,讲了Aggregator,讲了下DAG解析的阶段划分)Hive会用吧。讲一下内表和外表的区别学过Mysql,讲一下索引的数据结构吧(自己说了下聚集索引和非聚集索引)还有sql各种join之间的不同二面·自我介绍·写个题目吧把一个数字转换成汉字比如1001“一千零一"用了递归但是写的太复杂,有点拉分·讲一下你觉得最难的两个项目·Sparkcache和persite的区别(讲了下广播机制,没回答好)·你未来想学些什么(简单说了下Flink、Spark源码和参数服务器)·还有什么问我吗HR面·自我介绍·想实习多久·未来读研吗·来北京租房吗·父母对来北京的意见·你觉得自己有什么缺点(最后说了个自己熬夜多)</
    1 0 68
  • 面试公司:腾讯面试岗位:大数据开发工程师面试背景:本人渣硕一枚,毕业快两年了。腾讯总共面了5轮,其实我请同学帮忙推的是微视,但是简历莫名其妙的留到了QQ音乐那边。面试问题:一面·给定4G内存,以及16亿个QQ号,这些QQ号里面有重复的,找出重复次数排名前100个QQ号。·聊了下微服务,服务注册发现是怎么做的?微服务的监控是怎么做的?·实现一个线程安全的阻塞队列。·给定两个数组,每个数组中都有重复的数字。不用类库函数,对这两个数组排序。·多路复用是什么?怎么用?·Linux中的文件节点是什么?(这个不太会)·聊了下项目架构二面·给定一个数组,求该数组所有的自子数组·去掉一个字符串中的所有空格(送分题)·两个系统A和B,如果A调用B的时候发生超时,这个时候A会重试,那么怎么确保B只调用一次?·项目中的数据库分表是怎么做的?三面·给定一个数组,元素的大小0~25,有重复元素。按出现频次的高低输出所有的数字。·聊一下项目中HBase的RowKey是怎么设计的?·项目中的事务消息是怎么做的?·对加班怎么看?表示自己可以996四面·给定一个二叉树,依次打印出每一行。·聊一下Redis的zset?实现原理是什么?为什么不用红黑树来实现?·redis哨兵怎么选举主节点?·为什么IP分组到达的时间不一样?·有什么要问我的?五面我真的已经忘记聊什么了。很快,没聊什么技术。聊了下为什么想换工作?以及自己的职业规划</p
    3 0 63
  • 面试公司:网易考拉面试岗位:大数据面经一面:1、sql题:学生成绩表,把每科最高分前三名统计出来2、算法题:二维数组中的查找3、kafka如何保证高吞吐的,了不了解kafka零拷贝,具体怎么做的4、sql有几种join,mapjoin了解过没5、hbase中rowkey该怎么设计6、hdfs文件上传流程,hdfs的容错机制7、怎么解决hive数据倾斜问题二面(全程写写写):1、算法题:二维矩阵相乘2、算法题:链表中环的入口3、写一下mysqlbinlog的数据格式,怎么进行数据清洗的4、写一个正则表达式进行手机号匹配5、讲一下数据仓库层级的划分,每层的作用
    3 0 79
  • 微信扫码加好友进群