2022-05-12 16:51:2719930人阅读
2022年5月10日,百度宣布由百度安全自主研发的图数据库HugeGraph捐赠给Apache软件基金会,成为Apache孵化项目,孵化成功的HugeGraph有望成为全球首个Apache软件基金会的图数据库顶级项目。本次捐赠将促使国产图数据库走向世界,对生态建设产生深远的影响,让更多开发者因此受益。
Apache软件基金会官网截图
百度是一家积极参与开源的公司,在这个开源项目已成为软件基石的时代,享受业界开源成果的同时,也对外贡献了大量的开源项目,包括深度学习框架 飞桨PaddlePaddle、自动驾驶平台 Apollo、可视化渲染库 Apache ECharts、数据仓库 Apache Doris 等。一方面是因为百度的技术基因,另一方面也是表达一种开放的态度。百度深深理解在技术领域一枝独秀不是春,只有拥抱开源,很多技术和产品才能加速发展、拓宽边界。开源社区有无穷的力量,与广大用户及开发者共同成长,打造繁荣的开源生态,是一件多赢的事情。截至 2021 年底百度已在 Github 主导的 21 个开源组织累计开源项目1000+ 个,社区贡献者达 1.8万+ ,获得 Star 总数 37万+。其中,HugeGraph是百度于2018年开源的国内首款图数据库。
百度开源知名项目
随着大数据、知识图谱、工业互联网、强人工智能等互联网创新型业务应用的快速发展,非关系型数据库应用将加速落地。图数据库能够支撑新型应用场景的关联分析业务,根据Gartner预测,到2025年图技术将应用于80%的数据和分析创新,远高于2021年的10%,而图技术是图数据库的核心技术,从而将推动图数据库规模持续增长。百度安全部主任架构师包沉浮表示:“伴随全球范围内的人工智能革命,数据呈现爆炸式增长,企业能否充分利用好海量的多模态数据影响着其发展的未来。图数据库相比传统的关系型数据库,在处理规模庞大、错综复杂的数据关系方面具有较大优势,广泛适用于社交、电商、金融、安全风控等场景,也是知识图谱等人工智能技术的重要基石”。百度安全部数据安全业务副总经理韩祖利也表示:“HugeGraph 源自百度安全业务需求而孵化的项目,目前己经在百度众多业务中发挥了重要的作用,也成为众多百度合作伙伴的优质之选,所以自2018 年 HugeGraph开源以来,获得了大量企业用户的同时,也获得了来自社区的代码贡献。我们认为开源有助于从产、学、研、教、用各方面强化数据库生态建设,不断培养图数据的人才,减轻产业在图数据库上的应用成本。为了进一步夯实人才、生态的建设,百度将 HugeGraph 捐赠给 Apache 软件基金会孵化,未来将有助于团队快速获得企业反馈并加快产品开发、提升产品质量,用更高质量的产品反哺社区的生态合作伙伴”。
关于Apache软件基金会
Apache 软件基金会(Apache Software Foundation,简称为ASF),是世界上最大的开源软件基金会,目前拥有超过350个开源项目。ASF是专门为支持开源软件项目而创办的一个非盈利性组织,apache.org 每周流量超过3500万,镜像下载量超过900万,每天都影响50%以上的互联网基础设施。Apache 软件基金会持续举办的社区盛会、马拉松、全球路演,让其中的开源项目在全球范围崭露头角。开源软件相比闭源的企业软件,具有费用低廉、高质量、免受厂商锁定的优势。加入最具广泛影响力的 Apache 软件基金会,几乎成为开源项目获得更多信任与支持的最佳选择。
值得一提的是,Gremlin图查询语言的制定者TinkerPop也是Apache的顶级项目,其核心模块是TinkerPop Gremlin引擎。HugeGraph实现了Apache TinkerPop3框架并完全兼容Gremlin查询语言,于2021年4月得到了Apache TinkerPop的官方认证,并被纳入其供应商列表。
Apache 孵化器导师寄语:
在 HugeGraph 加入 Apache 软件基金会之际,HugeGraph 的 Apache Mentor 以及孵化器导师也发来祝福寄语:
非常高兴能够成为HugeGraph进入ASF孵化器的领路人,帮助推进和见证了HugeGraph完成项目捐赠的全部过程。祝愿HugeGraph在孵化器中茁壮成长, 吸引更多的图数据库技术爱好者加入到项目中来, 共建一个繁荣发展的技术共同体!
-- 姜宁
ASF Member、ASF PPMC、ASF2022年董事会董事
很高兴能成为HugeGraph的Mentor,参与并帮助它在Apache Incubator不断壮大并且向着顶级项目前进。相信HugeGraph的产品价值和团队贡献会让它在国际舞台上熠熠生辉!
-- 潘娟
Apache Member、Apache ShardingSphere PMC
很高兴看到 Apache 生态有 HugeGraph 图数据库的出现,进入孵化器是一个新的征程,希望 HugeGraph 社区的伙伴们持续努力学习 Apache way,早日成为顶级项目!
-- 代立冬
Apache Member、Apache DolphinScheduler PMC Chair
恭喜HugeGraph成功进入Apache孵化器并完成商标捐赠!在日常的讨论过程中,能够充分感受到大家对开源的热情和对技术的追求。希望大家继往开来,砥砺前行,也希望更多的图数据库技术爱好者加入我们,共同建设一个更加繁荣和多样化的社区,早日完成孵化并成为Apache顶级项目!
-- 李钰
Apache Member、Apache Flink & HBase PMC Member
未来企业级计算引擎是多个引擎百花齐放的,其中图计算必然是很重要的一部分,HugeGraph作为其中一个新兴图计算软件已经在百度运行多年,非常欢迎HugeGraph加入Apache孵化器,希望可以在Apache软件基金会获得更大进步!
-- 郭炜
Apache Member、Apache DolphinScheduler PMC、ClickHouse中国社区创始人
恭喜 HugeGraph 成为 Apache 软件基金会孵化器项目,也希望可以有更多对图数据库感兴趣的小伙伴一起加入 HugeGraph 项目,建设开源社区更好的生态环境!
-- 羡辙
Apache Member, Apache ECharts PMC Chair
祝贺HugeGraph进入Apache软件基金会孵化器,这是HugeGraph走向世界的一大步。很有幸成为HugeGraph的孵化导师,期待有更多技术爱好者和用户加入,祝社区快速成长成为顶级项目,成为图数据管理领域的中流砥柱。
-- 黄向东
Apache Member, Apache IoTDB PMC Chair
关于HugeGraph图数据库
HugeGraph 是百度自研的大规模图数据库,也是国内首个开源的图数据库,提供了一站式的千亿级大规模图数据的存储、在线查询、离线分析平台。HugeGraph 于2016年项目启动,2018年对外开源。
HugeGraph作为我国首个自主开源的图数据库,其特性是高效、易用、可扩展。HugeGraph吸引了大量社区用户在金融风控、反诈欺和知识图谱等业务场景进行大规模应用。为使更多来自全球各地的开发者参与到HugeGraph生态,百度将HugeGraph项目推进到Apache软件基金会孵化,现已通过Apache捐赠提案的投票,并于2022年5月正式入驻Apache开启孵化,进而提高了图数据库产品开发的效率,避免重复开发,并有助于深化与开发者的互动,加速HugeGraph产品的技术创新。
截止目前,HugeGraph 在 GitHub 上有近 2000 Stars,HugeGraph 所有子项目 Contributors 数量超过 50 名贡献者(其中50%以上都是外部贡献者),社区版下载量超过2万。有超过100家社区用户长期使用 HugeGraph,包括网易、科大讯飞、网商银行、虎牙直播、YY直播、货拉拉、百分点科技等,并且以上公司也在与我们一道共建开源社区。
HugeGraph图数据库具有以下优势:
易用:HugeGraph 支持 Gremlin 图查询语言与 Restful API,同时提供图检索常用接口,具备功能齐全的周边工具,轻松实现基于图的各种查询分析运算。
高效:HugeGraph 在图存储和图计算方面做了深度优化,提供多种批量导入工具,轻松完成千亿级数据快速导入,通过优化过的查询达到图检索的毫秒级响应。支持数千用户并发的在线实时操作。
通用:HugeGraph 支持 Apache Gremlin 标准图查询语言和 Property Graph 标准图建模方法,支持基于图的 OLTP 和 OLAP 方案。集成 Apache Hadoop 及 Apache Spark 大数据平台。
可扩展:支持分布式存储、数据多副本及横向扩容,内置多种后端存储引擎,也可插件式轻松扩展后端存储引擎。
开放:HugeGraph 代码开源,客户可自主修改定制,选择性回馈开源社区。
HugeGraph逻辑架构
HugeGraph由HugeGraph-Server、HugeGraph-Client、HugeGraph-Loader、HugeGraph-Hubble与HugeGraph-Tools等组件构成,可通过批量方式快速导入数据、扫描并分析现有数据自动生成Graph Schema创建语言,基于Web的可视化IDE环境,记录Gremlin查询可视化展示图的关联关系,是目前功能最丰富的开源图数据库。典型应用场景包括深度关系探索、关联分析、路径搜索、特征抽取、数据聚类、社区检测、知识图谱等,适用业务领域有如网络安全、电信诈骗、金融风控、广告推荐、社交网络和智能机器人等。
HugeGraph应用场景
一直以来,百度以技术创新为信仰,在创新投入、研发布局、人才引进方面均走在国际前列。而新型的图数据库就像是数据中心里的“新基建”,非结构化数据处理需求以及高并行运算为数据库行业带来了技术革新。未来,百度期望HugeGraph可作为重要的里程碑,并将在大数据领域持续贡献优秀的项目来回馈开源社区,让更多的开发者收益。
致谢
感谢 Apache 导师:
Apache 导师是项目孵化的领路人,在 HugeGraph 加入 Apache 软件基金会的过程中,非常感谢 Apache 导师团提供的辅导,他们分别是:
姜宁老师:HugeGraph Champion,Apache Member、同时也是今年当选的 Apache 董事;
潘娟老师:HugeGraph Mentor,Apache Member、Apache ShardingSphere PMC
代立冬老师:HugeGraph Mentor,Apache Member、Apache DolphinScheduler PMC;
黄向东老师:HugeGraph Mentor,Apache Member、Apache IoTDB PMC;
李钰老师:HugeGraph Mentor,Apache Member、Apache Flink PMC、Apache HBase PMC;
感谢两位Apache孵化器导师提供的大力支持,他们分别是:
张雯莉老师:Apache Member、Apache ECharts PMC;
郭炜老师:Apache Member、ClickHouse中国社区创始人、Apache DolphinScheduler PMC;
感谢百度内部相关组织提供的大力支持:
@百度开源办公室
@百度安全技术委员会
感谢 HugeGraph 开源社区的所有维护者PPMC/Committers,他们分别是:
感谢 HugeGraph 开源社区的所有贡献者Contributors,他们分别是:
HugeGraph 开源社区链接参考
欢迎加入 Apache HugeGraph (Incubating) 开源社区,以下是 HugeGraph 相关参考链接:
HugeGraph 官网:https://hugegraph.apache.org/
HugeGraph 代码仓库(图数据库):https://github.com/apache/incubator-hugegraph
HugeGraph 代码仓库(图计算):https://github.com/apache/incubator-hugegraph-computer
HugeGraph 代码仓库(工具链):https://github.com/apache/incubator-hugegraph-toolchain
如何开始贡献开源社区:https://github.com/apache/incubator-hugegraph/issues/1753