本面试宝典涵盖大数据面试高频的所有技术栈,包括Liunx&Shell基础,Hadoop,Zookpeer,Flume,Kafka,Hive,Datax,Maxwell,DolphinScheduler,Spark Core&SQL,Spark Streaming,Flink,Hbase,Clickhouse,Doris,Hudi,数据治理,数据中台,元数据管理,数据质量管理,数据仓库,大厂面试场景题,职场相关,场景题,面试必看、大数据真题、简历模板 等近50个相关技术领域的大厂面试题及详解。
全套大数据开发面试题库教程,把各大公司的题库都给拿来了,总近千道面试题,此外还包含简历编写指导,面试技巧,还有一整套大数据面试复习的视频,让你在最短的时间内最高效复习大数据知识点本内容已更新至2021年最新版!
单项选择题1. 下面哪个程序负责 HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNodee)tasktracker2. HDfS 中的 block 默认保存几份?
三层架构使hbase最少存2ZB的数据,事实上根本用不到这么多,于是删除了root表,只使用meta表定位,meta表的一个region最多可以定位16TB的行键范围,假设一个行键范围包括10条数据,就已经是160TB了,假如一个region大于128M,则更多了,因此根本不需要