在接下来的几年里,数字计算可能是一个很好的途径

在互联网时代,图数据越来越多地呈现出海量和动态等特性,静态图计算的模型和方法难以应对数据处理的需求。而流式图计算能基于实时变化的数据,流式地构建动态图数据关系,并基于动态变化的图数据之上实时地进行分析、计算和挖掘,是图计算主流技术分支。流式图计算是蚂蚁大规模图计算系统 TuGraph 的重要组成部分,可以有效地挖掘数据关系变化的趋势和异动,承担着重要的近线异步图计算等功能。

InfoQ 作为技术媒体对技术趋势保持着格外的关注,本次我们采访了蚂蚁流式图计算团队负责人潘臻轩。他为我们分享了蚂蚁流式图计算的应用经验,以及图计算在未来的发展趋势。

“在 2017 年左右,那个时候对图概念有了解的人并不多,即使有,也是仅限了解数据库(比如业界的 Neo4j)和离线图计算系统(Google 的 Pregel 等),当时,在工业界,根本没有看到成熟的流式图计算系统,也没用看到典型的应用案例,我们只能摸着石头过河。”

在与 InfoQ 聊到流图计算的时候,潘臻轩表示,在那个时候,流图计算项目仅仅算是内部探索项目,具体能否跑通,无人知晓。“作为这个项目的探路人,我也仅仅知道原理上可行,实际是否跑得通,还需要打问号”。

最初始阶段,流图计算团队仅仅只有两名成员。“我自己必须相信这个事情,才能吸引更多的人加入进来”,当谈到最难的事的时候,潘臻轩如此说道。据他回忆,那个时候的他们,一方面需要探索系统应该如何去设计和构建,另外一方面需要找到典型的应用案例,证明流式实时图的业务价值,从而才能让更多的人相信该方向的价值。

尝试、探索与验证

踏过 2018 年,探索时间已经有一年多,潘臻轩也找到了可以使用流图计算的场景。“那个时候,我们团队主要去寻找适合流图的应用场景,同时也贴合业务场景打造核心引擎的能力。在蚂蚁内部信用风控等小的场景也做了一些落地尝试。”潘臻轩这样说道。

直到 2018 年双十一,流图计算才真正证明了自己的价值。在潘臻轩的一篇文章中曾提到,流图计算做到了在双十一大促极端流量高峰情况下,动态识别超过六度关系链(隐蔽性强)的异常资金风险,这一风控能力在业界也非常领先。

这个时候,流图计算又出现了另外两个问题,那就是如何让用户更多更好地用起来?首先是流式链路相对于离线图计算整体的链路会复杂很多,相对于图数据库又会出现可交互性不强等问题,往往是业务方想用,但由于门槛较高而无法真正用起来。其次,当时流式图计算团队只有 3 位同学,由于系统完全是自主研发,因此内核上也有很多功能和特性需要完善。

当聊到如何解决门槛问题和人力问题的时候,潘臻轩坦言:“比较好的解决方案是让大家相信流式图计算本身的价值,一方面通过双十一标杆场景带来的业务场景做驱动,让大家感知到,采用流式图计算可以获得非常好的业务效果。另一方面和中台更好地联动,通过支持特定的中台(比如知识图谱)快速覆盖一类场景用户,从而形成规模增长的飞轮,让更多的业务用起流式图计算。”

的确,只有不断验证流图计算的价值,才能应对接踵而至的挑战。当解决了这些问题之后,蚂蚁流图计算踏入了第三个阶段,大约在 2020 年左右,随着图在蚂蚁应用的越来越广,体系化的建设给流图计算团队带来了很大的挑战。于是他们将流图的能力从两边延伸提供了离在线一体化的能力,使得用户可以基于一套 DSL 支持基于离在线的数据进行实验。

就这样,流式图计算系统逐渐成为了蚂蚁图计算系统里面的核心成员之一。根据潘臻轩介绍,当前的图计算引擎广泛应用到蚂蚁的安全风控、信贷风控、知识图谱、数据血缘、资金分析、流量归因分析以及会员关系等场景。

进入 2022 年之后,蚂蚁图计算团队开始了新的探索与创新,例如探索大规模的分布式图机器学习系统、下一代图数据库以及在线图计算系统的前沿能力探索,同时也将成熟的图计算技术对外开放,应用于金融、能源、政务等领域。当前 GeaFlow 团队也在积极的和外部交流沟通,希望将流式图计算的能力开放到外部的场景,从而让业界更多更好的使用图计算的能力,发挥图计算的价值。

创新与升级

这几年的升级主要包含围绕流式图体系化的一系列工作,同时也继续深化系统内核。在体系化方面,围绕流式图计算引擎,蚂蚁图计算团队构建了从交互式离线图探索到基于历史数据长周期离线图仿真,再到流式近线图计算、动态时序图计算等一套完整的流式图计算体系。在系统内核方面,他们构建了计算和存储分离,支持超大规模图状态管理和存储。同时也围绕图特有的热点 / 大点做了相关的深度优化。

流式图计算在蚂蚁基础设施技术的应用越来越广,当前, 蚂蚁的大规模图计算系统持续地不断突破,已经成为蚂蚁风控的核心基础设施之一,流式图计算是其中的重要组成部分。

流式图计算在蚂蚁集团主要承担以下两方面的职责。首先,随着业务对图的应用越来越广泛以及对图的理解越来越深刻,简单图关系的在线查询并不能完全满足业务场景的诉求,因此业务迫切地需要支持复杂图查询 / 图计算的在线和实时处理能力。由于在线场景对延迟的要求非常高,因此当前业务会基于流式图计算引擎构建复杂图查询 / 图计算的预处理,从而将计算好的数据提前写到 KV 存储中,从而提供极低延迟的在线查询能力。基于这样的能力,蚂蚁风控系统当前更好地组合了在线图数据库提供低延迟简单图查询能力,以及流式图计算提供复杂图查询 / 计算的实时图计算能力,从而进一步在蚂蚁内部让业务更好地使用图计算系统。

其次,随着数据化和智能化的进一步演进,流式图引擎也更多地和图的智能化结合,比如和蚂蚁的图学习团队合作,构建动态图的离线训练和实时图推理能力。其中流式图引擎提供离在线一体图计算能力,既可以支持基于历史数据进行仿真回溯验证,也支持流式数据的实时图处理能力。同时当前流式图计算引擎还支持一套 DSL,从而打通用户的离线训练和流式上线两个阶段,极大地提升了研发的效能和使用体验。

未来几年,赛道可期

当我们谈到,流式图计算引擎 GeaFlow 的本质以及未来发展时,潘臻轩这样说道:“GeaFlow 从技术上说是图计算和流式计算融合交叉的计算技术,从计算语义和计算模型上,它更贴近于图计算的语义和模型。从业务的使用角度来看,它更偏向流式计算,也会用到流式计算的相关技术。流式图计算本质上还是一种增量计算,但是从计算语义和数据模型的角度是以图为中心的视角。”

同时潘臻轩还表示,“我个人认为未来图计算领域会越来越成熟并且越来越标准化。在数据体系方面,未来图计算会像通用大数据体系一样,越来越完备。比如围绕实时的图数据,可以构建一整体实时图数仓的体系,基于这样一套实时图数仓的体系,可以构建图数据实时的数据处理、实时图数据访问。既可以提升图数据的鲜活性,还可以更大的发挥图数据的价值。同时,在算力上,我相信图计算的能力也会越来越强,更多的业务场景会采用图数据结构,从而进一步深度的挖掘数据的价值,并且随着算力的增强,也会有越来越来的图计算场景从离线走向实时,从实时走向在线。”

就在去年,人民日报曾发文称:在我国发展高性能图计算,具备良好的技术基础和现实条件。一方面,人们如今的日常生活离不开高性能计算。天气预报、新药研发、新型材料、安全系数更高的汽车、高铁和飞机等都需要高性能计算作支撑。另一方面,由于图的优秀表达能力、可视化效果和坚实的数学基础,图计算也已在国家安全、金融安全等方面有很高的价值。有研究报告显示,到 2023 年图技术将促进全球 30% 企业的快速决策场景化,图技术应用的年增长率超过 100%。

以蚂蚁集团为例,图计算已被成熟应用于蚂蚁集团的支付和数字金融场景,为风控、反洗钱、反套现和社交网络应用提供了稳定的决策支持能力。其中,支撑支付宝的重要风险识别能力提升了近 100 倍,风险审理分析效率提升 90%。

数字化浪潮越卷越大,企业的线上数据也越来越多。通过数据进行决策一定会涉及到数据化的分析和运营,而图作为一个高维的数据结构,可以更好地挖掘数据的关联特性,为企业提供精准高效的决策。图计算赛道未来的发展,值得期待。

嘉宾介绍

潘臻轩,蚂蚁集团资深技术专家,现负责蚂蚁图计算部门流式图计算团队。2012 年加入阿里集团数据平台,2016 年加入蚂蚁集团数据技术部,经历了阿里和蚂蚁实时计算从 0 到 1 的演进,从 2017 年底开始负责流式图系统和团队的构建,从 0 到 1 打造了蚂蚁的流式图系统,对实时计算和图计算以及上层的应用场景有深入的理解。

活动推荐

在 6 月 19 日和 20 日,ArchSummit 全球架构师峰会即将落地上海,潘臻轩讲师也会亲临现场与大家交流,另外在此峰会上,我们一共设置了十五个专题,其中包含大数据与人工智能、中间件开发实战、移动端开发实践、微服务架构设计等等,详细专题内容可通过下方 Banner 扫码了解,期待和你一起现场交流。

了解更多软件开发与相关领域知识,点击访问 InfoQ 官网:https://www.infoq.cn/,获取更多精彩内容!

发表评论

您的电子邮箱地址不会被公开。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据