首页
安装部署
数仓建模
离线数仓
数据湖
大数据
面试
AI
Gitee
Github
知识星球
微信公众号
登录
菜单
首页
安装部署
数仓建模
离线数仓
数据湖
大数据
面试
AI
Gitee
Github
知识星球
微信公众号
大数据技能圈
加入大数据技能圈,解锁数据世界的无限可能
归档
2024 年 07 月
使用 SeaTunnel 进行 HTTP 同步到 Doris 实战经验分享
2024-07-19
大数据组件
#seatunnel
转载来源:公众号【SeaTunnel】
Apache SeaTunnel——OLAP 引擎的数据动脉
2024-07-19
大数据组件
#seatunnel
转载来源:公众号【SeaTunnel】,侵删。本文将分享如何利用 Apache SeaTunnel 将各个业务系统的数据同步到 OLAP 引擎。
Flink+Paimon在阿里云大数据云原生运维数仓的实践
2024-07-19
大数据组件
#paimon
#Flink
转载来源:公众号【Apache Flink】,侵删。随着大数据产品云原生化的推进,云原生集群的规模和数量都在增加,云原生集群的运维难度也在不断增加,云原生集群的资源审计、资源拓扑、资源趋势的需要就比较迫切。
Flink CDC:基于 Apache Flink 的流式数据集成框架
2024-07-19
大数据组件
#FlinkCDC
转载来源:公众号【Apache Flink】,侵删。本文整理自阿里云 Flink SQL 团队研发工程师于喜千(yux)在 SECon 全球软件工程技术大会中数据集成专场沙龙的分享。
Apache Paimon 在蚂蚁的应用
2024-07-19
大数据组件
#paimon
转载来源:公众号【Apache Flink】,侵删。本文整理自 Apache Paimon Committer 闵文俊老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享。
玳数科技集成 Flink CDC 3.0 的实践
2024-07-19
大数据组件
#Flink
转载来源:公众号【Apache Flink】,侵删。本文投稿自玳数科技工程师杨槐老师,介绍了 Flink CDC 3.0 与 ChunJun 框架在玳数科技的集成实践。
Apache Doris + Apache Hudi 快速搭建指南
2024-07-19
大数据组件
#Hudi
#Doris
转载来源:公众号:【Apache Hudi】,侵删。Apache Hudi 是目前最主流的开放数据湖格式之一,也是事务性的数据湖管理平台,支持包括 Apache Doris 在内的多种主流查询引擎。
Blaze:SparkSQL Native算子优化在快手的深度优化及大规模应用实践
2024-07-14
大数据组件
#spark
转载来源:【 DataFunSummit】侵删。Blaze 是快手自研的基于向量化技术开发的一套 native 执行引擎,执行过程充分利用 native 代码和 SIMD 指令向量化计算的优势。目前已在快手内部部分业务上线,并实现了 30% 的算力提升。
极速查询:StarRocks 存算分离 Compaction 原理 & 调优指南
2024-07-11
大数据组件
#大数据
#starrocks
转载来源:公众号【StarRocks】侵删。作者:丁凯,StarRocks TSC member/镜舟科技云原生技术负责人
成本下降50%,腾讯音乐StarRocks存算分离大规模实践!
2024-07-11
大数据组件
#大数据
#starrocks
转载来源:公众号【StarRocks】侵删。作者:腾讯音乐高级数据工程师 陈嘉奇,腾讯音乐高级运营开发工程师 高盛远
上一页
6 / 13
下一页