首页
安装部署
数仓建模
离线数仓
数据湖
大数据
面试
AI
Gitee
Github
知识星球
微信公众号
登录
菜单
首页
安装部署
数仓建模
离线数仓
数据湖
大数据
面试
AI
Gitee
Github
知识星球
微信公众号
大数据技能圈
加入大数据技能圈,解锁数据世界的无限可能
归档
2024 年 06 月
第8章 用户行为日志及生成
2024-06-30
数仓建模
#离线数仓
#数据湖
模拟用户日志生成文档
Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解
2024-06-30
大数据组件
#大数据
#Doris
转载来源:公众号【SelectDB】,侵删。| 在 Apache Doris 中,数据划分包含分区和分桶两个层级。
网易游戏如何基于 Apache Doris 构建全新湖仓一体架构
2024-06-30
大数据组件
#大数据
#Doris
转载来源:公众号【 SelectDB】,侵删。| 本文将分享网易游戏在选型数据仓库架构升级过程中的思考以及基于 Apache Doris 构建湖仓一体全新架构的解决方案,并分享 Apache Doris 在关键业务场景中的落地实践。
Apache Paimon 在蚂蚁的生产实践
2024-06-30
大数据组件
#大数据
#paimon
转载来源:公众号【 Apache Paimon】,侵删。| Paimon 在流场景支持中做了很多工作, 同时对传统的批处理场景也对标现有其他湖格式的能力。
Apache Paimon 表模式最佳实践
2024-06-30
大数据组件
#大数据
#paimon
转载来源:公众号【 Apache Paimon】,侵删。| Apache Paimon 作为数据湖对各种场景有着完整的功能支持,看完这篇文章,你可以了解到 Paimon 有哪几种表模式。对应哪些场景。
Paimon Audit Log 在贝壳找房家装数仓中的运用
2024-06-30
大数据组件
#大数据
#paimon
转载来源:公众号【 Apache Paimon】,侵删。| Paimon 所提供的变更日志功能,可以作为一种新的数据转换方式,巧妙地解决家装行业数据建设中的业绩流水和历史变更信息的构建问题
Flink 数据写入 Paimon 流程及源码解析
2024-06-30
大数据组件
#大数据
#Flink
#paimon
转载来源:公众号【 Apache Paimon】,侵删。| 本文对 Flink 流 / 批 Job 写数据进 Paimon 主键表的源码进行了深入浅出的总结,后续会持续更新 Paimon 别的模块的解读。
友盟+|如何通过阿里云 Flink+Paimon 实现流式湖仓落地方案
2024-06-30
大数据组件
#大数据
#Flink
#paimon
转载来源:公众号【 Apache Flink】,侵删。| 介绍 Apache Paimon 主要优势,然后介绍基于 Paimon 在 U-App 实时基础指标计算和友盟设备ID维表更新场景的优化方案。
Flink DataStream API 批处理能力演进之路
2024-06-30
大数据组件
#大数据
#Flink
转载来源:公众号【 Apache Flink】,侵删。| 本文由阿里云 Flink 团队郭伟杰老师撰写,旨在向 Flink Batch 社区用户介绍 Flink DataStream API 批处理能力的演进之路。
Flink⼤状态作业调优实践指南:状态报错与启停慢篇
2024-06-30
大数据组件
#大数据
#Flink
转载来源:公众号【 Apache Flink】,侵删。| 本文整理自俞航翔、陈婧敏、黄鹏程老师所撰写的大状态作业调优实践指南。由于内容丰富,本文分享终篇状态报错与启停慢篇,
上一页
9 / 13
下一页