大数据技能圈 加入大数据技能圈,解锁数据世界的无限可能

Flink CDC:基于 Apache Flink 的流式数据集成框架

转载来源:公众号【Apache Paimon】,侵删。本文整理自阿里云 Flink SQL 团队研发工程师于喜千(yux)在 SECon 全球软件工程技术大会中数据集成专场沙龙的分享。

kuhuo 发布于 2024-07-11

Apache Doris + Apache Hudi 快速搭建指南|Lakehouse 使用手册(一)

转载来源:【SelectDB技术团队】,侵删。湖仓一体(Data Lakehouse)融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求。

kuhuo 发布于 2024-07-10

Flink+Paimon在阿里云大数据云原生运维数仓的实践

转载来源:公众号【Apache Paimon】 ,,侵删。作者欧阳武林 (伍林)

kuhuo 发布于 2024-07-09

理解 Apache Paimon 一致性模型(一)

转载来源:公众号【Apache Paimon】,侵删。Apache Paimon是一种开源表格格式,是在更成熟的 Apache Iceberg、Delta Lake 和 Apache Hudi 项目之后出现的。它诞生于 Apache Flink 项目中,当时被称为 Flink Table Store,但后来成为顶级 Apache 项目。

kuhuo 发布于 2024-07-09

Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解

转载来源:公众号【SelectDB】,侵删。| 在 Apache Doris 中,数据划分包含分区和分桶两个层级。

kuhuo 发布于 2024-06-30

网易游戏如何基于 Apache Doris 构建全新湖仓一体架构

转载来源:公众号【 SelectDB】,侵删。| 本文将分享网易游戏在选型数据仓库架构升级过程中的思考以及基于 Apache Doris 构建湖仓一体全新架构的解决方案,并分享 Apache Doris 在关键业务场景中的落地实践。

kuhuo 发布于 2024-06-30

Apache Paimon 在蚂蚁的生产实践

转载来源:公众号【 Apache Paimon】,侵删。| Paimon 在流场景支持中做了很多工作, 同时对传统的批处理场景也对标现有其他湖格式的能力。

kuhuo 发布于 2024-06-30

Apache Paimon 表模式最佳实践

转载来源:公众号【 Apache Paimon】,侵删。| Apache Paimon 作为数据湖对各种场景有着完整的功能支持,看完这篇文章,你可以了解到 Paimon 有哪几种表模式。对应哪些场景。

kuhuo 发布于 2024-06-30

Paimon Audit Log 在贝壳找房家装数仓中的运用

转载来源:公众号【 Apache Paimon】,侵删。| Paimon 所提供的变更日志功能,可以作为一种新的数据转换方式,巧妙地解决家装行业数据建设中的业绩流水和历史变更信息的构建问题

kuhuo 发布于 2024-06-30

Flink 数据写入 Paimon 流程及源码解析

转载来源:公众号【 Apache Paimon】,侵删。| 本文对 Flink 流 / 批 Job 写数据进 Paimon 主键表的源码进行了深入浅出的总结,后续会持续更新 Paimon 别的模块的解读。

kuhuo 发布于 2024-06-30