spark面试题

资讯

大厂都在疯狂流传的42道 Spark 灵魂面试题，你能答上几道？
1)本地模式 Spark不一定非要跑在hadoop集群，可以在本地，起多个线程的方式来指定。Reducer 以内存作缓冲区，边 shuffle 边 aggregate 数据，等到数据 aggregate 好以后进行 reduce 。
数据分析不是个事儿
11评论
5万字长文！搞定Spark方方面面（二）
spark-shell 是 Spark 自带的交互式 Shell 程序，方便用户进行交互式编程，用户可以在该命令行下可以用 scala 编写 spark 程序，适合学习测试时使用!
CTO技术手册
4评论
5万字长文！搞定Spark方方面面（一）
版权声明:本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。
CTO技术手册
15评论
超详细！一文详解 SparkStreaming 如何整合 Kafka！附代码可实践
APIKafkaUtils.createDirectStream[String,String, StringDecoder, StringDecoder]代码演示import kafka.serializer.StringDecoderimport org.apache.spar
CSDN
5评论
考满分公司大数据面试题
考满分公司面试题1）技术（1）Hadoop是什么（2）Java的特性（3）设计模式（4）怎么理解scala的函数式编程（5）tcp，udp的区别（6）网络七层和网络四层，它们的区别是什么（7）数据库存储数据的具体文件是什么，有几种（8）myisam和innodb的区别（9）数据库
尚硅谷教育
大数据面试宝典
这个问题虽然见过无数次，面试官问过无数次，还是有不少面试者不能完整的说出来，所以请务必记住。注:Hadoop在设计时考虑到数据的安全与高效，数据文件默认在HDFS上存放三份，存储策略为本地一份，同机架内其它某一节点上一份，不同机架的某一节点上一份。
视界新语
5评论
知因智慧大数据面试题，真实面试分享
hadoop、flume、kafka、sqoop、spark版本号。CTO给面试，APP40万的下载量，日活10万。
尚硅谷教育
一线互联网大数据面试题核心知识库（100万字）
本面试宝典涵盖大数据面试高频的所有技术栈，包括Liunx&Shell基础，Hadoop，Zookpeer，Flume，Kafka，Hive，Datax，Maxwell，DolphinScheduler，Spark Core&SQL，Spark Streaming，Flink，Hbase，Clickhouse，Doris，Hudi，数据治理，数据中台，元数据管理，数据质量管理，数据仓库，大厂面试场景题，职场相关，场景题，面试必看、大数据真题、简历模板等近50个相关技术领域的大厂面试题及详解。
蚂蚁大喇叭
5评论
大数据内存计算Spark框架原理详细整理
《大数据和人工智能交流》头条号向广大初学者新增C 、Java 、Python 、Scala、javascript 等目前流行的计算机、大数据编程语言，希望大家以后关注本头条号更多的内容。（一）Spark简介1、什么是sparkSpark是一种基于内存计算的开源框架。
数字化与智能化
3评论
面试指南，终于要跟大家见面了，我有点紧张（附思维导图）
阐述 Flink 提供的容错机制，解释分布式快照 Chandy Lamport 算法逻辑，剖析 Flink Checkpoint 具体实现流程?
程序员高级码农II
1评论
真真正正的九面阿里才定级 P6+ 支持背调，还不来看？（建议收藏）
setNx:系统在 10:05 设置一个值，并给出 5 分钟的过期时间，系统刚刚 set 完之后 redis 集群崩溃，10:11 分系统重启成功，那么 redis 中 set 的值是否还存在?
java联网架构师

加载更多

视频

问答

spark机器学习和python机器学习的区别是什么？
头条问答