原标题:原创| 金融行业数智转型,如何突破算力瓶颈?

  来源:新金融联盟NFA

  “金融监管总局正积极推动相关机制建设,在平衡安全与发展的前提下,规范与推进AI在金融业务当中的应用。”5月24日,监管专家在新金融联盟主办的“智算赋能金融服务智能化”内部研讨会上表示。

  算力已成为金融行业的核心生产力,在人工智能加速迭代与全球算力竞争升级的背景下,构建自主可控、高效安全的智算体系成为金融行业共识。会上,国家金融监督管理总局科技监管司相关负责人与23家银行、理财子和保险公司的专家,聚焦金融算力基建的实践、挑战与对策深度探讨。新金融联盟秘书长吴雨珊主持会议,中国金融四十人论坛提供学术支持。

金融行业数智转型,如何突破算力瓶颈?  第1张

  研讨会现场

  有限算力VS无限创新

  当前,头部金融机构的算力卡布局呈现显著的“多厂商、多版本”特征:邮储银行搭建的算力集群涵盖华为昇腾、英伟达GPU等芯片;交行AI芯片已投入超4亿元,形成1000PFlops算力规模,国产算力占比超70%;国开行筛选2-3家有持续发展潜力的国产芯片厂商,构建混合多芯智算基础设施。

  邮储银行总工程师徐朝辉指出,搭建混合异构分布式算力平台,是应对供应链不确定性的务实选择,但要充分发挥其作用并不容易。异构算力的协同需突破并行计算技术瓶颈,高峰期算力集群利用率达60%已属优秀。

  百度智能云混合云部总经理杜海认为,国产算力的蓬勃发展,给金融行业带来算力异构管理问题。智能体爆发趋势下,需平衡有限算力与无限创新的矛盾。

  面对巨大的算力需求,邮储银行采用“训练集中化+推理分布式”架构,兼顾算力效率与业务实时性。农业银行采取“开源、节流、运维、管控”的算力管理策略:通过统一资源调度平台实现跨厂商算力的透明化调用;通过并行计算提升GPU利用率;通过实时监控网络拥塞与节点状态,降低训练任务中断风险;根据算力需求评估结果,对省级以上项目实施技术基准审查,避免资源滥用。

  交通银行金融科技部总经理刘雷表示,交行通过“朝推夜训”实现算力分时复用,并以千卡自研成本、百万tokens使用成本等指标衡量投入,以数字劳动力创造量、风险事件减少率、成交金额提升等维度评估产出,实现资源精准配置。

  国开行信息科技部总经理宋磊介绍,国开行针对不同业务需求对算力资源进行差异化调度:大并发场景用高性能集群,跨境业务配专属算力,高保密场景采用软硬件一体机。

  智算发展面临多重挑战

  与会专家认为,当前,国产芯片已具备支撑金融核心业务的能力,但智算落地仍面临生态、成本、安全等方面的挑战。

  一是国产智算生态尚不健全。国产芯片呈现自主架构与兼容CUDA双轨发展,行业标准缺失,导致银行需承担多重适配成本。

  二是算力成本指数级增长。智算建设需要大量高端GPU/NPU、高速网络存储设备、智算服务器等,叠加配套系统与运维成本,资金投入较大。更严峻的是,大模型训练存在阶段性算力高峰,自行采购易导致资源闲置。

  三是大集群运维复杂性增大。海量数据处理、模型训练及推理运行易发生网络拥塞、延迟高等问题。超大网络集群中单个网络节点故障引发的影响具有放大效应,可能会导致模型训练任务重启或中断,造成较高的算力成本浪费。

  四是供应链不确定性与技术迭代风险交织。美国对华科技制裁不断升级,大行通过提前储备缓解压力,但中小机构面临有钱买不到卡的困境。而随着芯片技术迭代加速,储备多少、何时储备也是两难抉择。

  加快国产智算标准体系建设

  针对上述问题,与会专家认为,建立金融专用智算中心是当务之急,建议通过租赁模式为中小机构提供合规算力。杜海介绍,百度智能云已在宁夏建成昆仑芯P800的大型集群,其“智算一体机”方案可为中小机构提供轻量化选择。

  此外,国产智算标准体系建设迫在眉睫。刘雷呼吁在监管指导下制定金融智算技术标准,统一芯片接口、算力调度协议等关键规范;杜海表示,百度智能云采用“四层智算架构”,通过RDMA协议优化通信效率,实现跨芯片精度对齐与任务编排。

  中国银行原行长李礼辉建议建立“高中初小”监管原则:“高”是占领技术高地,“中”是打造全球领先的中国方案,“初”是把风险消灭在萌芽状态,“小”是实现风险概率和风险成本最小化。监管专家表示,金融监管总局正加快政策研究,针对算法透明度、数据安全、模型可解释性等核心问题制定具体措施,为行业发展提供明确指引。

  随着监管政策与标准体系完善,金融机构与科技公司需在算力基建、生态共建、风险防控等维度形成合力。未来,金融服务将依托智能算力向高效化、安全化、普惠化演进,而混合异构架构、动态资源调度与国产化替代,将成为金融行业穿越周期的核心竞争力。

  (转自:新金融联盟NFA)