大数据组件 #paimon #Flink

Flink+Paimon在阿里云大数据云原生运维数仓的实践

转载来源：公众号【Apache Flink】，侵删。随着大数据产品云原生化的推进，云原生集群的规模和数量都在增加，云原生集群的运维难度也在不断增加，云原生集群的资源审计、资源拓扑、资源趋势的需要就比较迫切。

发布于 2024-07-19

大数据组件 #FlinkCDC

Flink CDC：基于 Apache Flink 的流式数据集成框架

转载来源：公众号【Apache Flink】，侵删。本文整理自阿里云 Flink SQL 团队研发工程师于喜千（yux）在 SECon 全球软件工程技术大会中数据集成专场沙龙的分享。

发布于 2024-07-19

大数据组件 #paimon

Apache Paimon 在蚂蚁的应用

转载来源：公众号【Apache Flink】，侵删。本文整理自 Apache Paimon Committer 闵文俊老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享。

发布于 2024-07-19

大数据组件 #Flink

玳数科技集成 Flink CDC 3.0 的实践

转载来源：公众号【Apache Flink】，侵删。本文投稿自玳数科技工程师杨槐老师，介绍了 Flink CDC 3.0 与 ChunJun 框架在玳数科技的集成实践。

发布于 2024-07-19

大数据组件 #Hudi #Doris

Apache Doris + Apache Hudi 快速搭建指南

转载来源：公众号：【Apache Hudi】，侵删。Apache Hudi 是目前最主流的开放数据湖格式之一，也是事务性的数据湖管理平台，支持包括 Apache Doris 在内的多种主流查询引擎。

发布于 2024-07-19

大数据组件 #spark

Blaze：SparkSQL Native算子优化在快手的深度优化及大规模应用实践

转载来源：【 DataFunSummit】侵删。Blaze 是快手自研的基于向量化技术开发的一套 native 执行引擎，执行过程充分利用 native 代码和 SIMD 指令向量化计算的优势。目前已在快手内部部分业务上线，并实现了 30% 的算力提升。

发布于 2024-07-14

大数据组件 #大数据 #starrocks

极速查询：StarRocks 存算分离 Compaction 原理 & 调优指南

转载来源：公众号【StarRocks】侵删。作者：丁凯，StarRocks TSC member/镜舟科技云原生技术负责人

发布于 2024-07-11

大数据组件 #大数据 #starrocks

成本下降50%，腾讯音乐StarRocks存算分离大规模实践！

转载来源：公众号【StarRocks】侵删。作者:腾讯音乐高级数据工程师陈嘉奇，腾讯音乐高级运营开发工程师高盛远

发布于 2024-07-11

大数据组件 #大数据 #starrocks

Data Lakehouse：你的下一个数据仓库

转载来源：公众号【StarRocks】侵删。作者：张友东 StarRocks TSC member/镜舟科技 CTO

发布于 2024-07-11

大数据组件 #大数据 #spark

Spark 内核的设计原理

转载来源：【公众号： DataFunSummit】侵删。本期是 DataFun 深入浅出 Apache Spark 第一期的分享，主讲老师耿嘉安开场介绍了自己的从业经历，当前就职的数新网络与 Spark 相关的两款产品 CyberEngine 和 CyberData。

发布于 2024-07-11

菜单

Flink+Paimon在阿里云大数据云原生运维数仓的实践

Flink CDC：基于 Apache Flink 的流式数据集成框架

Apache Paimon 在蚂蚁的应用

玳数科技集成 Flink CDC 3.0 的实践

Apache Doris + Apache Hudi 快速搭建指南

Blaze：SparkSQL Native算子优化在快手的深度优化及大规模应用实践

极速查询：StarRocks 存算分离 Compaction 原理 & 调优指南

成本下降50%，腾讯音乐StarRocks存算分离大规模实践！

Data Lakehouse：你的下一个数据仓库

Spark 内核的设计原理

Apache SeaTunnel 2.3.5：一键搭建Zeta-Server集群指南

基于SeaTunnel 2.3.5版本分布式集群安装部署指南(小白版)

SeaTunnel初体验，5000字深入浅出带你用上Oracle-CDC

10分钟带你深入理解Apache SeaTunnel与DataX的核心架构

海豚调度清理：使用 API 轻松清理历史工作流实例以及日志文件

Apache Dolphinscheduler Standalone 部署教程

源代码编译，Apache DolphinScheduler前后端分离部署解决方案

Apache DolphinScheduler中处理任务/告警/事件相关核心思路曝光

基于 RocketMQ 的云原生 MQTT 消息引擎设计

StarRocks Lakehouse 快速入门——Apache Paimon