dinky实时数仓

资讯

Dinky：一个开箱即用的一站式实时计算平台
支持全面的多版本的 FlinkSQL 作业提交方式:Local、Standalone、Yarn Session、Yarn Per-Job、Kubernetes Session、Kubernetes Application。
GitHub精选
56评论
B站基于Hudi+Flink打造流式数据湖的落地实践
导读本文将分享B站基于Hudi+Flink打造流式数据湖的落地实践，主要聚焦于数据湖引入后，在批流融合过程中遇到的若干问题及优化方案。文章包括四个部分：1. 背景与挑战，简要介绍B站数仓的现状和痛点，以及打造数据湖能力的愿景；2.
Lakehouse
10评论
还纠结实时数仓选型，Spark +ClickHouse让你拍案叫绝
目前已支持 4 个离线报表任务，3 个实时报表任务，其中 1 个离线 Join 需求，1 个实时 Join 需求，后续可能更多。
dbaplus社群
19评论
如何基于 Apache Doris 与 Apache Flink 快速构建极速易用的实时数仓
在数据的同步过程中，使⽤了 Flink CDC+MySQL 全量加增量的数据同步⽅式，同时还利⽤ Doris 的 Light Schema Change 特性实时同步 Binlog ⾥的 DDL 表结构变更，实现数据接⼊数仓零开发成本。
SelectDB
28评论
从Spark到Flink，菜鸟实时数仓架构是怎样炼成的？
菜鸟目前在考虑将所有解析的工作交给 Flink 来处理，然后再写入到 batch 中，从而无需在 MaxCompute 的 ODPS 中进行批处理的操作。
半历写书
6评论
传统数仓和大数据数仓的区别是什么？
然后就会出现各种各样的问题:oracle不是数据库么，怎么又是数据仓库?数据仓库、数据库是一个概念，是一些技术的集合。
数字化转型咨询
3评论
一文让您读懂实时数仓（Apache Doris）
引言：随着大数据时代的来临，实时数据处理与分析成为企业核心竞争力的关键因素之一。在这场数据革命中，SelectDB成为引领者。
SelectDB
17评论
携程酒店实时数仓架构和案例
还有一个问题，上面有介绍过酒店订单的生命周期很长，用 union all 的方式，状态周期只保存了30分钟，一些订单的状态可能已经过期，当出现订单状态时，我们需要获取订单的历史状态，这样就需要一个中间层保存历史状态数据来做补充。
携程技术
4评论
产业实战公开课大数据产业案例《商业智能实时数仓决策平台项目》
伴随着新一代信息技术的蓬勃发展，大数据应用与创新在国民经济各行业正快速推进，数据规模越来越大，随之而来的是人才资源的巨大缺口难以满足产业发展需要。
QST青软集团
罗海伟：阿里云万亿级数据集成架构实践
导读:阿里云DataWorks数据集成是DataX团队在阿里云上的商业化产品，致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动能力，以及繁杂业务背景下的数据同步解决方案。
DataFunTalk
7评论
大数据与大模型如何共振？星环科技数弹齐发：推出多个行业大模型及训练工具
在上周举行的向星力·未来数据技术峰会上，上海大数据基础软件龙头企业星环科技推出多个行业大模型以及大模型训练工具，为企业定制符合自身业务需求的专属大模型提供又一选择。
智东西
中国的「Databricks」们：打造AI基础架构，我们是认真的
美国数据科学公司Databricks刚刚在今年8月底完成了16亿美元H轮融资，其最新估值高达380亿美元，相比7个月前G轮融资时280亿美元的估值，又轻松增加了100亿美元。
36氪

加载更多

视频

在线举报