大数据面试题精讲

  • 大数据
  • 78节
  • 0人已学
开始学习
0开始学习之旅吧~ 下一课时:02 ArrayList、LinkedList、Vector区别
目录

章节 1 Java

课时1

01 string、stringbulider、stringbuffer
15:42
开始学习
课时2

02 ArrayList、LinkedList、Vector区别
21:53
开始学习
课时3

03 HashMap的时间复杂度
09:15
开始学习
课时4

04 数组和链表
18:02
开始学习

章节 2 hadoop

课时1

01 hadoop实现二级排序
04:49
开始学习
课时2

02 hadoop都分别需要启动 哪些进程,他们的作用分别都是什么
05:05
开始学习
课时3

03 hadoop和spark都是并行计算,那么他们有什么相同和区别
09:20
开始学习
课时4

04 datanode不兼容文件版本
02:54
开始学习
课时5

05 用mapreduce怎么处理数据倾斜问题
15:31
开始学习
课时6

06 在Hadoop开发过程中使用哪些算法
04:21
开始学习
课时7

07 hadoop调度器
04:03
开始学习
课时8

08 Combiner,partition作用
06:04
开始学习
课时9

09 Hadoop参数调优,性能优化
05:37
开始学习
课时10

10 hadoop三种运行模式的适用场景
03:18
开始学习
课时11

11 Hadoop中的Sequence File
08:10
开始学习
课时12

12 简述hadoop实现jion的几种方法
07:16
开始学习
课时13

13 hadoop和spark有什么相同和区别
09:20
开始学习
课时14

14 hadoop集群进程
05:05
开始学习
课时15

15 Hadoop中的Sequence File
08:10
开始学习

章节 3 hive和数仓

课时1

01 不同数据存储的区别
12:05
开始学习
课时2

02 hive和hbase的区别
09:14
开始学习
课时3

03 hive的排序
12:36
开始学习
课时4

04 redis,传统数据库,hbase,hive区别
12:05
开始学习
课时5

05 hive的存储格式和压缩算法
15:48
开始学习
课时6

06 hive中的ETL
07:03
开始学习
课时7

07 如何保证hive中数据的质量
05:12
开始学习
课时8

08 数仓架构分层
34:58
开始学习
课时9

09 hive如何控制权限
13:42
开始学习
课时10

10 hive建模
06:54
开始学习
课时11

11 hive外部表
10:16
开始学习
课时12

12 数据仓库同步工具
07:59
开始学习
课时13

13 insert into 和 override write 区别
07:00
开始学习
课时14

14 根据什么对hive表进行分桶分区
12:33
开始学习
课时15

15 hive中的小文件
06:00
开始学习

章节 4 hbase

课时1

01 hbase宕机了如何处理
05:59
开始学习
课时2

02 hbase是怎样预分区的
06:28
开始学习
课时3

03 怎样将 mysql 的数据导入到 hbase 中
06:31
开始学习
课时4

04 hbase瓶颈
04:59
开始学习
课时5

05 如何解决Hbase中region太小和region太大带来的结果
08:01
开始学习
课时6

06 hbase的flush过程
06:46
开始学习
课时7

07 hbase宕机了如何处理
05:59
开始学习
课时8

08 hbase预分区
06:28
开始学习
课时9

09 将mysql的数据导入到hbase中
06:31
开始学习
课时10

10 简述hbase的瓶颈
04:59
开始学习
课时11

11 hbase中region太多和太大
11:09
开始学习
课时12

12 如何解决hbase中region太小和region太大带来的结果
08:01
开始学习

章节 5 kafka

课时1

01 kafka指定读取写入数据到指定broker或从指定broker的offset开始消费
08:54
开始学习
课时2

02 消费kafka数据的时候,如果遇到了脏数据,或者是不符合规则的数据等等怎么处理呢
09:27
开始学习
课时3

03 kafka脏数据处理
09:27
开始学习
课时4

04 kafka如何保证数据不丢失
09:59
开始学习

章节 6 spark

课时1

01 spark 如何防止内存溢出
12:15
开始学习
课时2

02 spark技术栈及场景
06:44
开始学习
课时3

03 Spark on Mesos的粗细粒度
14:47
开始学习
课时4

04 spark的工作机制
09:26
开始学习
课时5

05 spark为什么比hive快
06:52
开始学习
课时6

06 spark技术栈有哪些组件,每个组件都有什么功能,适合什么应用场景
06:41
开始学习
课时7

07 Spark on Mesos中,什么是的粗粒度分配,什么是细粒度分配,各自的优点和缺点是什么
14:38
开始学习
课时8

08 spark的广播变量
19:32
开始学习
课时9

09 spark累加器
12:30
开始学习
课时10

10 spark调优
09:43
开始学习
课时11

11 SparkSql去获取hdfs上的数据会出现的问题有哪些?会出现重复消费吗?怎么解决的?
05:50
开始学习
课时12

12 spark为什么比mapreduce快
11:12
开始学习
课时13

13 spark中的RDD
19:08
开始学习
课时14

14 spark的shuffle阶段和mr的shuffle阶段
10:29
开始学习

章节 7 flink

课时1

01 Flink是如何实现exactly-once语义的
14:26
开始学习
课时2

02 Flink、Storm与Spark Stream的区别
08:37
开始学习
课时3

03 Flink的exactly-once
14:26
开始学习
课时4

04 flink中watermark
10:47
开始学习
课时5

05 Flink、Storm与Spark Stream的区别
08:37
开始学习

章节 8 算法

课时1

01 找出两个大文件共同的url
15:31
开始学习
课时2

02 二叉树前中后序的递归遍历
11:25
开始学习
课时3

03 二叉树前中后序的非递归遍历
20:05
开始学习
课时4

04 求数组的所有子集
18:50
开始学习
课时5

05 有序数组中寻找和为n的两个元素
18:47
开始学习
课时6

06 求一个数组的第二大值
19:05
开始学习
课时7

07 找出大文件中频次最高的100个单词
10:21
开始学习
课时8

08 从大文件中取出访问次数最多的ip
10:44
开始学习

章节 9 其他

课时1

01 RPC的原理
10:58
开始学习
正在学习
    暂无数据
  • QQ扫码
  • 微信扫码