AI在线 AI在线

突破FHE瓶颈,Lancelot架构实现加密状态下的鲁棒聚合计算,兼顾「隐私保护」与「鲁棒性」

在金融、医疗等高度敏感的应用场景中,拜占庭鲁棒联邦学习(BRFL)能够有效避免因数据集中存储而导致的隐私泄露风险,同时防止恶意客户端对模型训练的攻击。 然而,即使是在模型更新的过程中,信息泄露的威胁仍然无法完全规避。 为了解决这一问题,全同态加密(FHE)技术通过在密文状态下进行安全计算,展现出保护隐私信息的巨大潜力。
图片

在金融、医疗等高度敏感的应用场景中,拜占庭鲁棒联邦学习(BRFL)能够有效避免因数据集中存储而导致的隐私泄露风险,同时防止恶意客户端对模型训练的攻击。然而,即使是在模型更新的过程中,信息泄露的威胁仍然无法完全规避。为了解决这一问题,全同态加密(FHE)技术通过在密文状态下进行安全计算,展现出保护隐私信息的巨大潜力。

然而,FHE 的计算效率始终是其最大的瓶颈,尤其在面对高复杂度操作(如排序、聚合)时,计算开销会随着客户端数量和数据规模的增加呈指数级增长,极大地限制了其在实际场景中的应用。

针对这一挑战,香港中文大学 AIoT 实验室联合重庆大学、香港城市大学等高校和企业,首次将全同态加密(FHE)与拜占庭鲁棒联邦学习(BRFL)深度融合,提出了全新的 Lancelot 框架。该框架实现了在加密状态下的鲁棒聚合计算,算法优化和硬件加速设计为其高效性提供了保障,有效解决了传统 FHE 计算开销高、复杂聚合规则支持不足以及隐私保护与鲁棒性难以兼顾的问题。

这项研究已发表在《Nature Machine Intelligence》上。

图片
  • 论文链接:https://www.nature.com/articles/s42256-025-01107-6

创新点概览

1.掩码式加密排序解决全同态加密难点

在拜占庭鲁棒联邦学习(BRFL)中,全同态加密(FHE)面临无法直接对客户端上传的模型参数进行距离计算和排序的挑战,为解决这一问题,Lancelot 提出了一种由客户端、服务器和密钥生成中心(KGC)协作的加密计算框架(见下图 1),并创新性地引入了「掩码式加密排序(Masked-based Encrypted Sorting)」机制。该机制的主要流程包括:

  • 由服务器计算加密状态下的模型间距离,无需解密;

  • 将距离发送至可信的密钥生成中心(KGC)进行解密和排序,生成加密掩码矩阵;

  • 服务器根据掩码选择可信客户端模型并完成聚合,全程不暴露任何明文信息或排序结果。

该机制在严格安全约束下实现了鲁棒聚合所需的排序逻辑,突破了 FHE 应用在复杂 FL 系统中的最大障碍

图片

      图 1 Lancelot 系统架构:模型训练、排序、聚合全过程均在加密状态下完成

2.融合密码学优化 FHE 计算效率

尽管全同态加密(FHE)在隐私保护方面具有显著优势,但其高昂的计算开销一直是限制其实际应用的主要瓶颈。Lancelot 从底层实现入手,对密文计算进行了深入优化:通过改进密文的成对乘法策略,大幅降低了排序和聚合操作中对乘法深度的依赖;优化多项式矩阵运算,显著减少复杂计算的资源消耗;同时对密文操作(如加法和乘法)进行高效实现,显著降低了训练过程中密文计算的延迟。

密码学优化如下:

  • Lazy Relinearization:将多个重线性化操作合并,每轮仅执行一次 relinearization,有效减少乘法后密文尺寸的扩展。

  • Dynamic Hoisting:针对加密轮转中的模提升操作,引入并行化计算结构,实现旋转操作的批量并行处理,显著提升整体吞吐率。

3.硬件优化提速训练过程

本文具体分析了基于 FHE 的 BRFL 系统中计算开销的主要来源,并针对 Lancelot 进行了硬件部署优化设计,有效减少了协作过程中不必要的计算负担,从而显著加速了训练过程。

硬件部署优化如下:

  • 构建了 GPU 原生的同态加密矩阵计算库,将密集型 FHE 计算任务从 CPU 转移至 GPU;

  • 利用 CUDA 并行内核,加速执行距离计算、掩码处理和模型聚合等关键环节;

  • 在实际测试中,单轮训练时间从数小时缩短至数分钟,相较当前最优 FHE 平台 OpenFHE,性能提升超过 20 倍。

这一优化大幅提高了基于 FHE 的 BRFL 系统的实际可用性,为其在复杂场景中的应用奠定了坚实基础。

图片

图 2 在 MNIST、CIFAR-10 等数据集上,Lancelot 显著优于现有 FHE 方案(如 OpenFHE),达成 20 倍以上提速。

总结与展望

Lancelot 框架通有效解决了全同态加密在复杂联邦学习场景中的性能与安全瓶颈,为隐私计算和鲁棒 AI 模型的实际部署提供了全新解决方案。Lancelot 不仅支持多种联邦鲁棒聚合算法,还可与差分隐私机制集成,满足 GDPR、HIPAA 等严格合规要求。在医学图像诊断、癌症检测等实际医疗场景中的实验显示,Lancelot 能在保持诊断准确率的前提下彻底杜绝信息泄露,为 AI + 医疗的可信计算奠定基础。

此外,研究还进一步分析了 Lancelot 在 GPU 资源使用、密钥安全性(采用 Noise Flooding 防御 FHE 密钥恢复攻击)、大规模部署中的通信与计算效率等方面的综合性能,为未来扩展至生物信息、金融风控等领域提供了理论基础和工程实践经验。

作者介绍

本文第一作者为蒋思阳,香港中文大学博士生,指导导师为邢国良教授,ACM 和 IEEE 会士,担任 CUHK AIoT 实验室主任,美国 NSF CAREER Award 和香港中文大学杰出研究奖获得者。共同通讯作者为邢国良及马川,重庆大学计算机学院副教授。

相关资讯

The Ministry of Industry and Information Technology will release the 'International Artificial Intelligence Open Source Cooperation Initiative' at the 2025 World Artificial Intelligence Conference

The 2025 World Artificial Intelligence Conference will be held in Shanghai from July 26 to 28, 2025. To this end, the Shanghai Municipal Government's Information Office held a press conference on July 10 to introduce the progress of the conference preparations.
7/14/2025 2:01:51 PM
AI在线

又一Sora级选手来炸街!我们拿它和Sora、可灵PK了下

当Sora「千呼万唤」不出来时,OpenAI 的对手们却纷纷祭出大杀器来炸街。Sora 再不开放使用,真的要被偷家了!今日,旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine。人人免费可用。据介绍,该模型能够根据简单的文本描述生成高质量、逼真视频,效果堪比 Sora。消息一出,大量用户挤进官网尝鲜。尽管官方声称该模型能在短短两分钟内生成 120 帧视频,但由于访问量激增,许多用户在官网中苦苦等待数小时。Luma 的产品增长主管 Barkley Dai 不得不在
6/14/2024 11:48:00 AM
机器之心

120 秒生成 120 帧,视频模型 Dream Machine 开放测试免费试用

Luma AI 在 X 平台宣布,视频模型 Dream Machine 开放测试,可进行免费试用。IT之家附 Dream Machine 地址:  AI 称 Dream Machine 可以从文本和图像生成“高质量”的视频。Dream Machine 可在 120 秒生成 120 帧,目前单个视频最长为 5 秒;生成的视频具有逼真的流畅运动、电影摄影和戏剧效果;还可以匹配摄像机运动,创造出“惊艳”的画面。Luma AI 也提到了目前模型存在的问题,比如切换视角时汽车会变形,狗的运动没有用到爪子,显示文字会有问题(将
6/13/2024 11:04:22 AM
沛霖(实习)
  • 1