Flink sql实时处理

资讯

Flink CDC：一行sql实现数据实时同步
环境说明flink-1.13.1-bin-scala_2.11.tgz[hadoop-2.7.3.tar.gz[flink-cdc-connectors](https://github.
爱炒股的程序员
26评论
基于Confluent+Flink的实时数据分析最佳实践
Confluent是基于Apache Kafka提供的企业级全托管流数据服务，由 Apache Kafka 的原始创建者构建，通过企业级功能扩展了 Kafka 的优势，同时消除了 Kafka管理或监控的负担。
数据库技术
1评论
大数据Hadoop之——Flink Table API 和 SQL（单机Kafka）
Table API 和 SQL 集成在同一套 API 中。如果你想实现自定义格式或连接器用于序列化行或一组用户定义的函数，下面的依赖就足够了，编译出来的 jar 文件可以直接给 SQL Client 使用:【温馨提示】如果需要本地直接运行，得先把scope先注释掉，要不然会报如下错误:Exception in thread “main” java.lang.NoClassDefFoundError: org/apache/flink/table/api/bridge/scala/StreamTableEnvironment$
大数据老司机
1评论
如何基于 Apache Doris 与 Apache Flink 快速构建极速易用的实时数仓
在数据的同步过程中，使⽤了 Flink CDC+MySQL 全量加增量的数据同步⽅式，同时还利⽤ Doris 的 Light Schema Change 特性实时同步 Binlog ⾥的 DDL 表结构变更，实现数据接⼊数仓零开发成本。
SelectDB
27评论
Flink SQL 知其所以然（六）| 维表 join 的性能优化之路（上）
flink sql lookup join 的解决方案以及原理的介绍:主要介绍 lookup join 的在上述实战案例的 sql 写法，博主期望你能了解到，lookup join 是基于处理时间的，并且 lookup join 经常会由于访问外部存储的 qps 过高而导致背压，产出延迟等性能问题。
Jtao3212
1评论
Dinky - FlinkSQL Studio & 实时计算平台
支持 Flink Java / Scala / Python UDF 开发与自动提交。Dinky 作为 Apache Flink 的 FlinkSQL 的实时计算平台，具有以下核心特点。
htmltoo
26评论
FlinkSQL的字段血缘解决方案
这里涉及到子查询，字段经过了多个步骤的加工，比如 ods_mysql_users.id 字段，第一步在子查询先经过 sum 处理生成 sum_id，再经过 ABS 处理插入到 dwd_hudi_users.id 字段。
DataFunTalk
9评论
Dinky：一个开箱即用的一站式实时计算平台
支持全面的多版本的 FlinkSQL 作业提交方式:Local、Standalone、Yarn Session、Yarn Per-Job、Kubernetes Session、Kubernetes Application。
GitHub精选
58评论
实时BI（三）离线数据与实时数据处理的技术实现
之前的文章讲到了商业智能BI对数据的同步处理机制主要是采用T+1的方式，这部分数据我们一般把它们叫做离线数据，这些数据来自于各个业务系统。
派可数据官方
2评论
Flink cdc介绍
Flink CDC 是 Apache Flink 提供的一种数据同步解决方案。Flink CDC 通过读取数据库的 redo log来捕获数据变化。
深藏身与名
数据湖技术解析
第一章数据湖概述一数据湖技术产生的背景国内的大型互联网公司，每天都会生成几十、几百TB，甚至几PB的原始数据。这些公司通常采用开源的大数据组件来搭建大数据平台。大数据平台经历过“以Hadoop为代表的离线数据平台”、“Lambda架构平台”、“Kappa架构平台”三个阶段。
IT智能化专栏
3评论

加载更多