回顾|Apache Cloudberry™ (Incubating) Meetup·2025 杭州站
2025 年 4 月 19 日,由酷克数据与中启乘数联合举办的 Apache Cloudberry™ (Incubating) Meetup · 杭州站在浙江省杭州市滨江区滨江会展中心成功举办。本次活动邀请了 Cloudberry PPMC 团队成员、活跃内核贡献者以及中兴 EBASE-A、阿里云 ADB-PG、网易、中启乘数等多家团队的顶尖技术专家,共同探讨 Cloudberry / Greenplum 内核前沿进展、一线生产实践和周边生态工具。活动现场气氛热烈,干货满满,为社区开发者与用户搭建了自由交流的平台,吸引线上线下近千名开发者与用户参与。
让我们一起回顾整场活动的议题干货吧!
Apache Cloudberry 简介与路线图展望
演讲嘉宾:杨瑜(Cloudberry PPMC 成员,酷克数据研发 VP,前 Greenplum 全球研发总监)
活动伊始,酷克数据研发 VP、Apache Cloudberry PPMC 成员杨瑜从项目背景、技术架构到未来规划,全面解读了 Apache Cloudberry 的发展蓝图。作为基于 Greenplum 和 PostgreSQL 的开源 MPP 数据库,Cloudberry 旨在通过开源模式将企业级优化成果回馈社区,解决闭源带来的不确定性。目前 Cloudberry 已正式进入 Apache 孵化器进行孵化,经过社区的充分讨论,已形成项目发展路线图;同时,社区正在准备推出第一个 Apache Release —— Cloudberry 2.0。未来,Cloudberry 将聚焦内核升级、执行引擎优化及社区合作,携手开发者共建开源生态。
酷克数据HashData
Apache Cloudberry 向量化实践:向量数据重分布性能优化
演讲嘉宾:赵熙(Cloudberry 贡献者,内核研发工程师)
酷克数据内核研发工程师、Apache Cloudberry 贡献者赵熙聚焦向量化技术在Join+Motion数据重分布中的性能瓶颈,分享了Cloudberry从系统性能分析到优化落地的完整实践。通过Gandiva表达式优化与分组算法重构,显著降低CPU负载,512节点下耗时从2004ms降至180ms,提速11倍。结合内存布局优化与性能分析工具,有效提升向量化 Join+Motion 吞吐,为大规模查询提供高效支撑。这一分享为内核开发者提供了可落地的优化范式。
酷克数据HashData,赞1
EBASE-A 实时流式入库实现机制及应用实践
演讲嘉宾:柏楠(中兴 EBASE-A 团队工程师)
中兴 EBASE-A 团队工程师柏楠介绍了 EBASE-A 的实时流式入库架构及核心技术。作为支持多写多读、湖仓一体的 OLAP 数据库,EBASE-A 依托自研向量化引擎与存算分离架构实现 PB级分析。其 APFlow 组件通过零拷贝技术将吞吐推至磁盘极限,结合性能为 Flink 两倍的 Saturn 流引擎替代 JStorm 架构,资源消耗降低 50%,入库效率提升 30%,有效支撑通信行业实时数据处理。
酷克数据HashData,赞1
Data+AI 时代下的数据处理分析架构与技术演进
演讲嘉宾:印才华(阿里云资深技术专家)
阿里云 ADB-PG 技术负责人、阿里云资深技术专家印才华分享了企业在 Data + AI 背景下的数据分析架构演进,特别介绍了基于 Greenplum 构建的阿里云 ADB-PG 云数仓在高性能实时数仓、向量化,以及 In-Database AI 方面的探索洞察与行业用户融合实践。
酷克数据HashData
Greenplum/Cloudberry 第三方管控平台 APCC 详解
演讲嘉宾:唐成(中启乘数科技 CTO)
中启乘数 CTO 唐成分享第三方可视化管控平台 APCC 的设计理念与实践路径。APCC 平台支持多版本、跨平台部署,提供可视化集群管理、一键扩容、慢 SQL 优化等丰富能力,旨在通过“自动化 + 图形化”的方式大幅降低 Greenplum 及 Cloudberry 运维门槛,实现高效、智能的数据库运维。
酷克数据HashData
Apache SeaTunnel 架构解析与 Cloudberry 集成实践
演讲嘉宾:陈虹宇 (Apache SeaTunnel 贡献者,网易数据集成研发工程师)
最后,网易数据集成研发工程师、Apache SeaTunnel 贡献者陈虹宇详细介绍了 SeaTunnel 的核心架构及其与 Cloudberry 的集成方案。Apache SeaTunnel 是一个易用的支持海量数据同步的超高性能分布式数据集成平台;SeaTunnel 中的 Cloudberry 连接器基于标准 JDBC 构建,继承了 PostgreSQL 连接器的所有核心逻辑。通过简单命令,即可实现 Cloudberry 数据库的读写操作,无需复杂配置,使得数据流转更加轻松高效。未来,计划引入基于 gpfdist 协议和外部表机制的全新连接器,充分利用 Cloudberry 的并行计算能力,持续提升大规模数据迁移传输的性能表现。
酷克数据HashData
本次 Meetup 汇聚了来自社区与企业的一线技术力量,分享内容兼具深度与实战价值,涵盖数据库内核、数据集成、运维、AI 融合等多个关键方向,为开发者与用户搭建了高质量的技术交流平台。
特别感谢中启乘数对本次活动的全程支持与协作,也感谢每一位演讲嘉宾与参会者的积极投入,感谢 Apache SeaTunnel 等众多社区合作伙伴的支持!欢迎更多开发者、用户与企业伙伴加入 Apache Cloudberry 社区,共同打造开源时代的分布式数据基础设施!