flink快照

资讯

Flink CDC 2.3 发布，更多连接器支持增量快照，新增 Db2 支持
在 Flink CDC 开源的两年多时间里，社区成长迅速，目前 Flink CDC 社区已有 76 位贡献者，7 位 Maintainer，社区钉钉用户群超过 7800 人。
灯惉
4评论
Flink（一）：为什么大数据项目都要选它？
本以为它很简单，在其他技术栈的基础上，稍微看看就得了，但是真正了解的时候，却发现它的内容原来如此丰富，功能如此强大，远不止“数据计算”这么简单。
杰哥的悦读时光
1评论
Flink CDC 如何加速海量数据的实时集成？
发起于2017年，在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会，已邀请超过2000位专家和学者参与分享。
DataFunTalk
24评论
第1章 Flink 基础概念
1.1、Flink基础概念1.1.1、Flink是什么Apache Flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算，它的核心目标是“数据流上的有状态计算”（Stateful Computations over Data Streams）。1.1.
MochiCruise
1评论
Flink被阿里收购4年，最开心的却是Spark背后的Databricks
2022 年，Apache Flink 社区保持快速发展:GitHub Star 数突破 2 万，单月下载量突破 1400 万次;
SQLynx
22评论
B站基于Hudi+Flink打造流式数据湖的落地实践
导读本文将分享B站基于Hudi+Flink打造流式数据湖的落地实践，主要聚焦于数据湖引入后，在批流融合过程中遇到的若干问题及优化方案。文章包括四个部分：1. 背景与挑战，简要介绍B站数仓的现状和痛点，以及打造数据湖能力的愿景；2.
Lakehouse
10评论
Flink1.13架构全集| 一文带你由浅入深精通Flink方方面面（一）
没有 shuffle 的多个算子合并在一个 subtask 中就形成了 Operator chain，类似 spark 中的 pipeline。
CTO技术手册
2评论
Flink1.13架构全集| 一文带你由浅入深精通Flink方方面面（二）E
从检查点恢复状态后还有一个问题:如果直接继续处理数据，那么保存检查点之后、到发生故障这段时间内的数据，也就是第4、5个数据就相当于丢掉了;
CTO技术手册
flink checkpoint原理与实践
基于state出发，flink基于与state可以做非常多复杂的事情，但是state是存储在内存中，内存中的数据是不安全的易丢失的，所以flink为了解决这个问题就引入了checkpointed机制，所谓的checkpointe就是把整个flink job的某一瞬间的状态数据进行快照，后续可以从这个快照。
传智教育官方账号
2评论
打造通用缓存层：字节跳动 Flink StateBackend 性能提升之路
在单 Task 的状态比较大时，一般推荐使用 RocksDBStateBackend，由于 State 操作都是随机 IO 类型，在非 SSD 机器上的访问性能比较差，并且在访问过程中存在额外的序列化和反序列化开销， CPU 的使用量也会明显上升，实际使用的资源成本增加了。
字节跳动云原生计算
4评论
Doris Connector x Flink CDC 实现 MySQL 分库分表 Exactly Once精准接入
1. 概述在实际业务系统中为了解决单表数据量大带来的各种问题，我们通常采用分库分表的方式对库表进行拆分，以达到提高系统的吞吐量。但是这样给后面数据分析带来了麻烦，这个时候我们通常试将业务数据库的分库分表同步到数据仓库时，将这些分库分表的数据，合并成一个库，一个表。
SelectDB
实时数据湖 Flink Hudi 实践探索
2018 ~2020 阿里:负责计算平台 Blink SQL 引擎的开发，由于主导的功能和 Calcite 社区互动较多，在 19 年成为 Apache Calcite PMC。
DataFunTalk
5评论
图解Flink实时数仓
马上过冬了，我和小伙伴灰灰开始屯年货。今年劳动了大半年，我们收获了整整一车的橡果。关键词: 速度慢、体量大、及时性差、快速查找、回溯。
散文随风想
1评论
5分钟了解Flink状态管理
什么叫做Flink的有状态计算呢？说白了就是将之前的中间结果暂时存储起来，等待后续的事件数据过来后，可以使用之前的中间结果继续计算。本文主要介绍Flink状态计算和管理、代码示例。1、有状态的计算什么是Flink的有状态的计算。
程序员半支烟

加载更多