spark大数据

资讯

大数据处理框架：Hadoop 与 Spark 的深度解析
MapReduce: MapReduce 是 Hadoop 的计算引擎，处理存储在 HDFS 中的数据。它基于 Map 和 Reduce 两个阶段进行分布式计算，Map 阶段对数据进行分片处理，Reduce 阶段则汇总中间结果。
威哥说编程
深入探索大数据Join实现方式（一）Spark的Join
等值Join VS 非等值JoinSparkSQL和HiveSQL不同，HiveSQL只支持等值连接，但是SparkSQL非等值连接也是支持的。等值连接和非等值连接的区别是：如果on语句中包含一个相等条件或多个需要同时满足的相等条件，那么称为等值连接，否则就称为非等值连接。
Pai老师聊大数据和AI
1评论
计算机毕业设计Python+Spark+LSTM微博大数据可视化微博情感分析
开发技术前端：vue.js echarts websocket后端API：springboot+spark+mybatis爬虫/算法：python、lstm情感分析(python实现)数据库：mysql创新点1.python+spark+springboot+vue.
计算机毕业设计大学
4评论
Spark原理及应用
Spark拥有Hadoop MapReduce所具有的优点，但不同于Hadoop MapReduce的是，Hadoop每次经过Job执行的中间结果都存储到HDFS等磁盘上，而Spark的Job中间输出结果可以保存在内存中，而不再需要读写HDFS。
勇者热情生活家
1评论
快手一面：讲一讲 Hadoop、Hive、Spark 之间的关系？
包含 Map 和 Reduce 两个过程。上图是逻辑回归机器学习算法的运行时间比较，Spark 比 MapReduce 快 100 多倍。
架构师之道
10评论
NVIDIA大讲堂 | 什么是 APACHE SPARK？
Apache Spark 继续了 Apache Hadoop 在 15 年前开始的大数据分析工作，并已成为大规模分布式数据处理的先进框架。
NVIDIA英伟达中国
1评论

视频

问答