求职刷题神器

funit.cn

  • 11月27日下午投的简历,晚上收到面试通知,约好11月30日晚上视频面试。整个过程面试官很有耐心,一直在引导我思考,但这次面试暴露出我的技能储备比较薄弱,还需要加深对各种底层原理的学习!在此做一个记录。一面(40min)1、自我介绍?2、Spark任务调度(源码)?3、Kafka基本原理说一下(生产消费模型,存储,Leader选举,ISR…)4、ConsumerGroup中Consumer和Partition的对应关系?5、Kafka支持什么语义(三种语义),怎么实现ExactlyOnce?6、6、SparkStreaming和Flink的区别?7、Scala的模式匹配和Java有什么区别?8、用Kafka的过程中有过什么问题,怎么解决?9、实习做了什么?10、撕代码:有序链表合并,n*m的带有数字的矩阵,从左上角走到右下角,问最短的路径上经过的数字的和是多少?(dp)
    6 1 138
  • 安生(化名),本科非科班。19年6月零基础学的大数据,错过了20年春招,但在秋招拿了招商银行,光大银行,浪潮等国企大数据开发offer。一面(20min)1、自我介绍?2、Sparkjoin的分类,实现过程,得到的结果?3、Sparkmapjoin的实现原理?4、SparkShuffle过程?5、SQL会写吗,写一个统计每个学科的前三名?6、实习主要做了什么,用什么技术栈?7、Python方法的参数带两个*是什么意思?8、Java反射生成对象?9、Java对象的生命周期?10、Spark任务调度?11、SparkTask失败要从头开始重试吗?12、遇到过什么困难,怎么解决的?13、HBase特点,应用场景?总结感觉不同公司的侧重点不太一样,有些可能会偏向基础,有些可能会偏向工程,感觉还是面向简历复习效果比较好,把简历上写的熟悉的东西基本掌握了也差不多了,此外Java的基础也要比较熟,像ConcurrentHashMap,线程池,AQS的源码最好心里有点数,之后就是自己熟悉的技术栈的源码,常问到的技术点可以去看看,问到就是赚到。
    4 2 97
  • 一.前言在年底前对秋招做一个总结分享给其他同学。先说一下本人情况,本人本硕都是双非高校计算机专业,秋招拿了商汤科技、阿里等多个大数据offer,主要是想给来自双非高校计算机或者双非跟计算机沾边相关类似自动化、控制等一些同学建议。二.面试题1.计算字符串表达式2.二分查找3.判断链表是否是循环链表4.Java内存区域5.Java的GC和Python的GC6.Hive底层原理7.Dataframe和Rdd的区别8.项目中处理的数据量多大9.大数据项目中做过哪些优化10.leftjion和innerjoin11.K-means聚类底层原理12.Tensorflow底层原理13.Pandas底层做了哪些优化
    5 1 97
  • 前言近期在整理面试题,快速复盘自己在面试中的不足,以下是我的面试问题,如果想要了解更多,可以回复我。面试1.spark数据倾斜怎么引起的?该怎么解决?2.spark集群低带宽怎样从大数据量中找中位数3.Hadoop组成架构?4.Hbase,为什么快,适合什么样的业务?能做聚合操作吗?5.hive实现原理?6.hive的优化?7.hive什么时候会产生数据倾斜怎么处理?8.描述一下zookeeper的选举机制?9.描述一下MapReduce的Shuffle阶段?10.什么是乐观锁、悲观锁?11.Kafka有哪些组件,介绍一下作用?
    6 2 98
  • 一面:1,RF的原理,和选用理由2,过拟合的原因是什么,从数据分布的角度解释3,rf和boosting算法的区别4,10亿个数选最大的K个,用什么方法,复杂度多少。分而治之的思想5,有开发经验吗,sql会吗6,25匹马赛跑经典智力题二面:1.给一个递增的数组,需要找到索引和值相等的值并返回,怎么找?(我回答的是二分查找,提示说怎么确定查找的值,构造一个(值减索引)的数组就可以二分)2.给一个只能够生成3以内整数的随机函数rand(3)问怎么实现rand(5)?(我最先想的是两次rand(3)求和去掉6,面试官提示说要每个数出现的概率相等,想了一下用ifelse就可以做到3、模拟高铁卖票和验票的问题,怎么编写方法去读取买票和验票的文件,验证验票和买票文件。开共享面板,编码实现这个流程。
    7 3 111
  • 1.自我介绍2.说一下做过的项目3.问了一些项目上的问题4.问PHP7的新特性有哪些5.问数据库设计为什么进行分表,分库6.问Mysql实现底层btree机制7.问web开发方面会遇到哪些缓存,分别如何优化8.问如何用关联数组实现栈9.问你数据库进行主从分离主要的原理10.问你php的内存回收机制11.nginx负载均衡有哪些,如果其中一台服务器挂掉,报警机制如何实现12.缓存命中率需要怎么提高,原理是什么13.问如何修改php/zend内核,使其满足程序员的编程需要,方便操作14.redis,会问哪些场景用,解决了什么问题,数据量有多少
    7 5 131
  • 公司:北京从零到壹科技有限公司,公司不大,做区块链技术的,遇到的HR和面试官态度都不错,技术面的时候稍微紧张了些,所幸面试通过了,等待最后一轮面试~本人情况:本人大学学的电子商务,打算转行做IT技术方面,前期报班学习了JAVA,后来又转大数据,希望能给自己一个更好发展吧1.简要描述Spark分布式集群搭建的步骤2.对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里?3.MapReduce优化4.Hbase的rowkey怎么创建比较好?5.列族怎么创建比较好?6.hbase过滤器实现原则7.描述HBase,zookeeper搭建过程8.hive如何调优?9.hbase写数据的原理10.怎样将mysql的数据导入到hbase中?11.Hbase的特性12.你怎么去设计rowkey和columnFamily,怎么去建一个table
    3 1 102
  • 公司:北京河狸家信息技术有限公司,公司有大几百号人,已经完成D轮融资,感觉团队很有冲劲~希望可以加入~已面试完,面经奉上1.spark运行时并行度的设置2.spark小文件太多怎么处理?3.hiveonspark动态解决小文件太多的办法4.Hive,HiveonSpark和SparkSQL区别?5.Hive,Hbase,HDFS等之间的关系6.大数据平台架构技术选型与场景运用,你能讲解一下嘛!?7.用户画像建模的过程8.casewhen函数你会用吗!?写一条sql9.sql的分析函数有哪些?10.sql的存储过程你理解嘛!?11.hive的开窗函数有哪些!?12.hive的udf函数你写过哪些!13.row_number相关排序函数!你了解嘛!?已收到二面通知,有时间再更
    6 2 105
  • 1.关于店铺网站页面访问流分析这一块,里面的基础的数据需求是怎么来的?2.你们这些指标力度主要是在pv、uv、ip是嘛?在哪些维度上会产生?3.数据提取是怎么提取的?有没有用比如一些第三方的一些服务?4.这个PIO模式是怎样?PIO入库5.你们在数据清洗的过程是怎样做的?6.14)除了产品外,会提一些数据方面的要求,还是你们自己制定?7.广播变量的使用及为何使用,原理8.数据清洗和入库这一块是怎么去做计算的9.hbase的热点问题怎么形成的10.kafka为什么要设5个分区11.sparkstreaming的开窗函数12.产生shuffle的算子13.hashMap与hashtable的区别14.redis集群宕机的问题15.创建scalaMap有mdash;gt;和元组两种16.spark的collect收集的数据在DriverJVM内存中17.hdfs的存储格式:parquet压缩使用snappy18.hive的存储格式以及对集合的操作19.sparkStreaming的容错20.spark缓存的数据放到哪里,计算的数据放到哪里21.项目中遇到的问题,以及解决思路22.Hbase存放那些数据,多大量23.创建DataFream有几种方式,他与DataSet还有RDD区别和优缺点24.ArrayList与LinkedList区别25.Kafka的数据积压和数据倾斜问题本人大学毕业一年,自学大数据,之前是非计算机专业,后来转的。公司在北京朝阳望京,没有融资,几十人规模。创业型公司,技术人才很多,对于刚入行来说是个不错选择~
    5 1 121
  • 网易雷火伏羲实验室,基本都是前端基础;面试流程还算挺快的,面试后没有收到offer,确认挂。原因总结:虽然感觉技术面很简单,但是面试HR的时候,薪资讲高了,并且对于一些常规性问题回答的感觉不太好,没有get到HR那个点上,蛮可惜,后面多多总结吧。一面2020/850minH5和C3的新特性例举3个你最不常用的css特性什么是变量提升?如何避免变量提升?如何禁止变量提升什么是浅拷贝?简单的浅拷贝如何实现ES6有没有新增什么简单的方法浅拷贝怎么实现一个简单类型的深拷贝,一行代码跨域知道哪几种你用过哪种?(JSONP)JSONP的回调函数需要定义在什么地方浏览器存储你知道哪些cookie和webStorage的区别cookie是每次请求都会携带吗?怎么设置不携带cookie满足某种条件才会不携带,然后设置某种参数才能携带某种请求默认不携带cookiefetch请求默认不携带cookievue-router里面有两种路由模式是什么,区别是什么hash模式和history模式了解SEO吗?要做SEO的话要用哪种路由模式vue里的nextTick有什么作用vue哪些对数据的操作不是响应式的通过索引值修改数组中的元素vue3现在是个什么状态?为什么不发布正式版本目前浏览器的生态还不足以支持vue3,目前浏览器还不支持vue3,再等待浏览器的升级。二面2020/850min自我介绍项目rem和em的区别项目城市切换是如何实现的vuex是什么?主要功能呢浏览器缓存的过程服务器一定会将Etag发送给浏览器吗Etag和If-Modified-Since的区别在哪禁用缓存的方式cookie跟localStorage的区别localStorage会传到服务器端吗?cookie会传到服务器端吗服务器端能否修改cookie
    7 1 139
  • 微信扫码加好友进群