求职刷题神器

funit.cn

  • 面试公司:北京宇信科技集团股份有限公司,经营范围包括研究、开发计算机软件、硬件及互联网技术;提供技术咨询等。面试岗位:大数据面经内容1.hive的细节问题,获取数据以后,是怎么处理的?是把一些什么数据处理的2.sparkstraming怎么理解的?你们的数据checkpoint是多久做一次的?3.hiveSQL,4.sparkstraming的窗口是怎么划分的?5.spark中你常用的算子有哪些??6.ZK的选举机制???7.捡一个自己项目,说明一下你在项目中主要是做了什么??数据量多大,怎么处理的??在开发中遇到哪些问题??怎么解决的??面经总结主要是使用spark内容,所以面试官对于这块内容问的比较多,整体看聊的还不错,等着下一轮面试,主要是驻场开发。所以自己对于这个事情还在考虑。
    1 0 3
  • 面试公司:北京奇虎科技有限公司,在酒仙桥线下面试。面试岗位:中级大数据开发工程师面试问题:1.介绍项目,公司的大数据架构2.kakfa怎么保证数据exactlyonce?3.offerset你们公司怎么维护的?为什么不放在mysql?4.kafka可以保证数据的局部有序,如何保证全局有序?5.介绍一下kafka的事务?6.flink和sparkstreaming的区别?7.flink批处理和实时有什么关系?8.cachehepersis的区别?是transformaction算子还是action算子?9.多线程的原理。实现类,阻塞队列、参数、拒绝策略、区别10.hive使用的时候会将数据同步到hdfs,小文件问题怎么解决面试总结:问了一些flink的内容,谈对实时比较感兴趣。还问了之前工作中的一些生产细节,感觉面试还不错,HR特别好,也介绍了他们公司的福利这块,等着复试了。
    1 0 6
  • 面试公司:新致软件面试难度:中等面试结果:通过面试问题:1.自我介绍2.看了工作年限,问我这几年一共做过多少个项目,每个项目都负责哪一块3.按照我的简历项目一个一个的看,一个一个的问。先让介绍,然后问其中负责的部分,然后问用什么框架,问工具的使用和自己他们之间的区别kettle,smartbi,informatic(我不会),flume都问了。然后我说有的我自学的,还会问用了多久学会的5.数据库的调优,oracle调优,hive调优6.数据量过大怎么办7.问了java会不会8.工作中遇到的最难的问题以及解决办法面试岗位:感觉他们很注重语句调优和遇到问题是否有快速的解决办法还有对业务的梳理能力。
    0 0 5
  • 面试公司:软通动力信息技术(集团)有限公司面试岗位:大数据开发之前电话沟通过,这次是去甲方面的,甲方是一家银行,最近他们准备弄数据仓库。所以聊了大概2个小时面试问题:1.你进行过hivesql到sparksql的任务迁移吗?2.如何建设数仓,如何构建主题域3.缓慢变化维几种处理方式4.什么是维度建模,星型模型与雪花模型的区别5.数仓建设以及分层的好处6.怎么做数据质量,怎么保证及时性和准确性7.维度表和事实表?8.如何数据治理?面试总结:偏生产实际解决方案,主要是对方提供的是一个近似管理的岗位,所以他们打算招几个人做,对于生产经验这块要求很高。要有实际解决问题能力。回答的不太好。在准备、准备
    0 0 14
  • 面试公司:深圳兔展智能科技有限公司面试难度:难面试岗位:大数据开发面试结果:未通过面试问题:1.画一下hbase的get和scan请求流程?2.为什么要用hbase呢?3.hbase有哪些特点?4.hbase是怎么做到高可用的呢?5.画一下HDFS的组件?6.如果在读取一个块的时候,副本节点宕机了会怎么样?7.为什么要切分成128m呢?8.spark和flink你都用过吗?说一下他们之间的区别?9.flink有几种运行模式?10.flink设计这两种模式的初衷是什么?(我也不知道他具体指的那两种模式,瑟瑟发抖)11.先介绍一下kafka吧12.你们kafka每秒钟多少数据?13.kafka有几台?14.为什么kafka吞吐量这么高?15.有看过Kafka的存储目录吗?是怎么读取数据的?16.点对点和发布订阅?17.分区数如果是小于消费者呢?18.checkpoint存在哪里的?多久checkpoint一次呢?19.2PC协议,什么时候发呢?(这句话问的我有点懵,还好我当时机智了一把)20.flink中状态有哪几种?21.有用flink写过哪些程序?22.flink有数据倾斜的问题吗?有遇到过吗?23.flink程序的并行度设置的是多少?会给算子设置并行度吗?24.slot,你是怎么理解slot的?25.Kylin我比较感兴趣,你简单说一下26.你们怎么去调
    1 0 15
  • 面试公司:软通动力外派vivo面试难度:难面试结果:未通过面试问题:1、写一个递归函数,实现1-100的和。2、如何将字符串abdbfbgbddbd反转。3、aaabbcccdeea,通过一段代码,输出成:a_3:b_2:c_3:d_1:e_2:a_1这种格式4、==和equals有什么区别5、redis有哪些数据删除策略6、kafka有什么数据删除策略7、jvm为什么要gc8、hive和关系数据库有什么区别9、ETL。面试总结问的都是一些底层内容,或者基础理论知识,只看项目了,没看技术点
    0 0 11
  • 面试公司:贝壳找房科技有限公司面试岗位:大数据开发PS:贝壳找房线下面试,他们是刚组建的团队,对于基础要求比较高。两个面试官问了2个小时。面试问题1.MR的底层架构画图2.MR的读写流程3.你能简单说一下照成数据倾斜的具体原因4.sortby和orderby的区别5.drop和truncate删除表的区别6.内部表和外部表的区别7.现场给业务场景写sql题面试总结:基础部分问的比较详细,面试官还是比较重视业务能力,给了4个场景让马上就写出sql题目。对sql要求很高。接着面吧
    1 0 23
  • 面试公司:南瑞瑞中数据面试岗位:大数据开发面试结果:未通过面试问题:1、数仓里面分了几层?2、hive源数据的存储服务器?3、介绍一下KMeans算法?4、介绍一下RFM模型?5、如果HBase中数据不符合规则,这条数据怎么办?6、介绍一下业务中匹配、统计、挖掘标签?7、hive中dw层的作用是什么?8、hive中排序有几种,分别说一下?9、spark中如何解决数据倾斜?10、用户画像中挖掘型标签是如何如何确定聚类个数,和迭代次数?11、SparkStreaming有哪几种方式消费Kafka中的数据,它们之间的区别是什么?12、kafka的ACK机制?面试总结:从ETL到离线到实时再到底层和算法都问了,有点扛不住啊
    1 0 11
  • 面试公司:融和科技集团面试岗位:大数据开发面试背景:线下面试,坐车去了1个多小时,约的两点,面了大概2个多小时,4轮、技术、技术经理、技术总监、人事,前几位沟通不错。面试问题1.linux常见命令(主要是awk)2.简述一下hdfs读写机制3.hdfs常用命令4.数仓为什么要分层:5.sql(hive能运行的)6.hive的函数日期函数7.java字符串拼接的时候为什么不同+号而用StringBuilder8.数据来源、数据的存储9.hive经常用到优化10.sql常见优化有哪些11.为什么发生倾斜?怎么解决(不能只说理论,要结合实际开发)面试总结面试轮数比较多,技术和技术经理聊的时候还不错,整体逻辑比较清晰,到了后面的两个,感觉脑袋都乱了,后面涉及到一些技术,也有些人事问题,沟通的时间太长。有点乏了
    0 0 24
  • 面试公司:北京国双科技有限公司面试难度:一般面试岗位:大数据开发面试结果:未通过面试问题:1.java中数组和Arraylist的区别2.手写冒泡排序3.scala手写wordcount4.Scala中模式匹配和java中switchcase的区别5.scala中的数组和集合6.scala元组7.hive处理数据倾斜8.hbase组件9.SQL查询出所有课程都及格的人员的姓名10.为什么使用kettle。11.项目日增多大,表中有多少条数据面经总结:在自我介绍的时候已经和面试官说过很久没做过java开发了,但是在聊过项目之后,一直再问java相关的知识,包括集合,数组。但是自己这块在复习的时候忽略了。
    1 0 24
  • 微信扫码加好友进群