presto快还是spark快

资讯

汽车之家 x StarRocks：极速实时数据分析实践
我们最初使用的是 StarRocks 1.17，由于存在多个 UV 指标，查询性能并不理想，在升级到 StarRocks 1.18 之后，性能得到了较大的提升，响应时间从十几秒降到四秒内。
StarRocks
科普：一篇文章让你知晓Spark
说起大数据的工具，最广为人知的就是Hadoop和Spark了，Hadoop在上一篇文章中已经有所介绍，这期小编就为大家介绍后起之秀Spark。
「技术选型」Spark SQL vs Presto
Spark SQL与Presto之间的区别简单来说 Presto 就是“SQL查询引擎”，最初是为Apache Hadoop开发的。它是一个开源的分布式SQL查询引擎，用于对各种大小的数据集运行交互式分析查询。
智能时刻
12评论
Spark原理及应用
Spark拥有Hadoop MapReduce所具有的优点，但不同于Hadoop MapReduce的是，Hadoop每次经过Job执行的中间结果都存储到HDFS等磁盘上，而Spark的Job中间输出结果可以保存在内存中，而不再需要读写HDFS。
勇者热情生活家
1评论
年度案例大数据盘点之Spark篇
编者按：高可用架构推出 2015 年度案例系列文章，分享在架构领域具有典型意义的年度案例，本文由谭政分享。转载请注明来自高可用架构公众号「ArchNotes」。谭政，Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。
高可用架构
唯品会：老司机教你如何调教Presto和ClickHouse，应对业务难题
本文主要介绍唯品会 OLAP 的演进，包括 Presto 智能化和容器化实践，以及 Clickhouse 在实验平台海量数据存储和计算的实践。
DataFunTalk
13评论
大数据平台从0到1之后
导读:大数据平台构建方法大同小异，但是平台构建以后也面临很多挑战，在面临这些挑战我们如何去克服、修复它，让平台更好满足用户需求，这就是本次主题的重点。
DataFunTalk
12评论
字节参战！火山引擎推出大模型训练云平台，自研DPU实例性能提升3倍
智东西4月18日报道，今日，字节跳动旗下火山引擎宣布自研DPU成功应用，已部署上万台DPU服务器，成为业界少数几家具备自研DPU能力的云厂商。
智东西
4评论
分布式系统开源项目领跑者Alluxio获5000万美元C轮融资
参考:Alluxio: A Virtual Distributed File System， Haoyuan Li， University of California， Berkeley， Technical Report No. UCB/EECS-2018-29。
DeepTech深科技
18评论
5万字长文！搞定Spark方方面面（一）
版权声明:本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。
CTO技术手册
13评论
十年大数据专家，手把手带你玩转大数据，Spark技术栈的深度解析
Spark最大的优势就是将计算数据、中间结果都存储在内存中，大大减少IO开销. 因此， Spark更适合于迭代运算比较多的数据挖掘与机器学习运算. 在使用Hadoop进行迭代计算时非常耗资源，因为每次迭代都需要从磁盘中读取、写入中间数据， IO开销大. 而Spark将数据载入
大数据架构师
1评论
“数据湖三剑客”Hudi、Delta Lake和Iceberg 深度对比
Iceberg 提供 ACID 事务能力，上游数据写入即可见，不影响当前数据处理任务，这大大简化了 ETL;
Jtao3212
9评论
比较Hadoop上的SQL引擎Hive，Spark，Impala
·Hive使用目录结构进行数据分区并提高性能· Hive的大多数交互都是通过CLI或命令行界面进行的，并且HQL或Hive查询语言用于查询数据库· Hive支持四种文件格式，即TEXTFILE，ORC，RCFILE和SEQUENCEFILEHive的三个核心部分· Hive客户端
闻数起舞
开源 80 万行代码，微众银行如何在小团队规模炼出一站式大数据平台
比如，在开发 streamis-datasource-transfer 模块对接 Linkis DataSource 时，由于缺少 Linkis DataSource 模块，阻塞了 Streamis 的开发测试进展，后经微众银行 WeDataSphere 大数据团队与天翼云大数据团队多次线上沟通协商、共同推进，解决了 Streamis 依赖 Linkis DataSource 模块的问题。
InfoQ
39评论
如何构建企业级大数据Ad-hoc查询引擎
凭借多年大数据平台建设经验，易观CTO郭炜为大家分享了易观在大数据实时查询引擎建设过程所获经验与挑战，以及大数据人员如何快速建立自己的大数据查询引擎套件，让自己的数据人员不再是“表哥表妹”的方法。
Analysys易观分析
1评论
MapReduce、Spark、Phoenix、Disco、Mars浅析及性能测试
当使用 Hadoop 技术架构集群，集群内新增、删除节点，或者某个节点机器内硬盘存储达到饱和值时，都会造成集群内数据分布不均匀、数据丢失风险增加等问题出现。本文对 HDFS 内部的数据平衡方式做了介绍，通过实验案例的方式向读者解释内部数据平衡的解决办法。
CSDN

加载更多

视频

问答

自从flink成熟之后，spark是否慢慢成为鸡肋？
spark虽然完成的功能较多，但是每一个功能都做的不太好，每个功能组件都有更好更成熟的Hadoop生态圈组件替代。如下：spark批处理：flink，mapreduce.相对来说spark批处理的优势还是比较大的，这是它的强项。
头条问答

在线举报