大数据技能圈 加入大数据技能圈,解锁数据世界的无限可能

Flink+Paimon在阿里云大数据云原生运维数仓的实践

转载来源:公众号【Apache Flink】,侵删。随着大数据产品云原生化的推进,云原生集群的规模和数量都在增加,云原生集群的运维难度也在不断增加,云原生集群的资源审计、资源拓扑、资源趋势的需要就比较迫切。

kuhuo 发布于 2024-07-19

Flink CDC:基于 Apache Flink 的流式数据集成框架

转载来源:公众号【Apache Flink】,侵删。本文整理自阿里云 Flink SQL 团队研发工程师于喜千(yux)在 SECon 全球软件工程技术大会中数据集成专场沙龙的分享。

kuhuo 发布于 2024-07-19

Apache Paimon 在蚂蚁的应用

转载来源:公众号【Apache Flink】,侵删。本文整理自 Apache Paimon Committer 闵文俊老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享。

kuhuo 发布于 2024-07-19

玳数科技集成 Flink CDC 3.0 的实践

转载来源:公众号【Apache Flink】,侵删。本文投稿自玳数科技工程师杨槐老师,介绍了 Flink CDC 3.0 与 ChunJun 框架在玳数科技的集成实践。

kuhuo 发布于 2024-07-19

Apache Doris + Apache Hudi 快速搭建指南

转载来源:公众号:【Apache Hudi】,侵删。Apache Hudi 是目前最主流的开放数据湖格式之一,也是事务性的数据湖管理平台,支持包括 Apache Doris 在内的多种主流查询引擎。

kuhuo 发布于 2024-07-19

Blaze:SparkSQL Native算子优化在快手的深度优化及大规模应用实践

转载来源:【 DataFunSummit】侵删。Blaze 是快手自研的基于向量化技术开发的一套 native 执行引擎,执行过程充分利用 native 代码和 SIMD 指令向量化计算的优势。目前已在快手内部部分业务上线,并实现了 30% 的算力提升。

kuhuo 发布于 2024-07-14

极速查询:StarRocks 存算分离 Compaction 原理 & 调优指南

转载来源:公众号【StarRocks】侵删。作者:丁凯,StarRocks TSC member/镜舟科技云原生技术负责人

kuhuo 发布于 2024-07-11

成本下降50%,腾讯音乐StarRocks存算分离大规模实践!

转载来源:公众号【StarRocks】侵删。作者:腾讯音乐高级数据工程师 陈嘉奇,腾讯音乐高级运营开发工程师 高盛远

kuhuo 发布于 2024-07-11

Data Lakehouse:你的下一个数据仓库

转载来源:公众号【StarRocks】侵删。作者:张友东 StarRocks TSC member/镜舟科技 CTO

kuhuo 发布于 2024-07-11

Spark 内核的设计原理

转载来源:【公众号: DataFunSummit】侵删。本期是 DataFun 深入浅出 Apache Spark 第一期的分享,主讲老师耿嘉安开场介绍了自己的从业经历,当前就职的数新网络与 Spark 相关的两款产品 CyberEngine 和 CyberData。

kuhuo 发布于 2024-07-11