归档 - 大数据技能圈

使用 SeaTunnel 进行 HTTP 同步到 Doris 实战经验分享

2024-07-19

大数据组件 #seatunnel

转载来源：公众号【SeaTunnel】

Apache SeaTunnel——OLAP 引擎的数据动脉

2024-07-19

大数据组件 #seatunnel

转载来源：公众号【SeaTunnel】，侵删。本文将分享如何利用 Apache SeaTunnel 将各个业务系统的数据同步到 OLAP 引擎。

Flink+Paimon在阿里云大数据云原生运维数仓的实践

2024-07-19

大数据组件 #paimon #Flink

转载来源：公众号【Apache Flink】，侵删。随着大数据产品云原生化的推进，云原生集群的规模和数量都在增加，云原生集群的运维难度也在不断增加，云原生集群的资源审计、资源拓扑、资源趋势的需要就比较迫切。

Flink CDC：基于 Apache Flink 的流式数据集成框架

2024-07-19

大数据组件 #FlinkCDC

转载来源：公众号【Apache Flink】，侵删。本文整理自阿里云 Flink SQL 团队研发工程师于喜千（yux）在 SECon 全球软件工程技术大会中数据集成专场沙龙的分享。

Apache Paimon 在蚂蚁的应用

2024-07-19

大数据组件 #paimon

转载来源：公众号【Apache Flink】，侵删。本文整理自 Apache Paimon Committer 闵文俊老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享。

玳数科技集成 Flink CDC 3.0 的实践

2024-07-19

大数据组件 #Flink

转载来源：公众号【Apache Flink】，侵删。本文投稿自玳数科技工程师杨槐老师，介绍了 Flink CDC 3.0 与 ChunJun 框架在玳数科技的集成实践。

Apache Doris + Apache Hudi 快速搭建指南

2024-07-19

大数据组件 #Hudi #Doris

转载来源：公众号：【Apache Hudi】，侵删。Apache Hudi 是目前最主流的开放数据湖格式之一，也是事务性的数据湖管理平台，支持包括 Apache Doris 在内的多种主流查询引擎。

Blaze：SparkSQL Native算子优化在快手的深度优化及大规模应用实践

2024-07-14

大数据组件 #spark

转载来源：【 DataFunSummit】侵删。Blaze 是快手自研的基于向量化技术开发的一套 native 执行引擎，执行过程充分利用 native 代码和 SIMD 指令向量化计算的优势。目前已在快手内部部分业务上线，并实现了 30% 的算力提升。

极速查询：StarRocks 存算分离 Compaction 原理 & 调优指南

2024-07-11

大数据组件 #大数据 #starrocks

转载来源：公众号【StarRocks】侵删。作者：丁凯，StarRocks TSC member/镜舟科技云原生技术负责人

成本下降50%，腾讯音乐StarRocks存算分离大规模实践！

2024-07-11

大数据组件 #大数据 #starrocks

转载来源：公众号【StarRocks】侵删。作者:腾讯音乐高级数据工程师陈嘉奇，腾讯音乐高级运营开发工程师高盛远

菜单

归档

2024 年 07 月

Apache SeaTunnel 2.3.5：一键搭建Zeta-Server集群指南

基于SeaTunnel 2.3.5版本分布式集群安装部署指南(小白版)

SeaTunnel初体验，5000字深入浅出带你用上Oracle-CDC

10分钟带你深入理解Apache SeaTunnel与DataX的核心架构

海豚调度清理：使用 API 轻松清理历史工作流实例以及日志文件

Apache Dolphinscheduler Standalone 部署教程

源代码编译，Apache DolphinScheduler前后端分离部署解决方案

Apache DolphinScheduler中处理任务/告警/事件相关核心思路曝光

基于 RocketMQ 的云原生 MQTT 消息引擎设计

StarRocks Lakehouse 快速入门——Apache Paimon