全球首个联邦进修工业级开源框架FATE更新!五大模块迎来巨幅优化

FATE(Federated AI Technology Enabler)是微众银行AI团队研发的全球首个联邦进修工业级开源框架,旨在提供安全的算计框架来支撑联邦 AI 生态。FATE 实现了基于同态加密和多方算计(MPC)的安全算计协议,它支撑联邦进修架构和多种机器进修算法的联邦进修实现,包括逻辑回归、基于树的算法、深度进修和迁移进修等等。3月31日,FATE推出 v1.6版本更新。在1.6版本中,优化了功能效率及稳定性,在使用体验方面,根据社区的反馈也有多方面的优化,将带来更流畅的使用体验。此外,新版本对其他F

FATE(Federated AI Technology Enabler)是微众银行AI团队研发的全球首个联邦进修工业级开源框架,旨在提供安全的算计框架来支撑联邦 AI 生态。FATE 实现了基于同态加密和多方算计(MPC)的安全算计协议,它支撑联邦进修架构和多种机器进修算法的联邦进修实现,包括逻辑回归、基于树的算法、深度进修和迁移进修等等。

3月31日,FATE推出 v1.6版本更新。在1.6版本中,优化了功能效率及稳定性,在使用体验方面,根据社区的反馈也有多方面的优化,将带来更流畅的使用体验。

全球首个联邦进修工业级开源框架FATE更新!五大模块迎来巨幅优化

此外,新版本对其他FederatedML、System Architecture、FATE-Test、FATE-Board、KubeFate等多个模块都进行了更新及改进,五大模块更新如下:

FederatedML

1、纵向SecureBoost 算计机制优化,支撑GOSS、直方图相减、密文压缩等机制,功能晋升2-4倍;

2、纵向SecureBoost支撑L1、min_child_weight,缓解过拟合问题;

3、纵向SBT增加deterministic选项,解决因为浮点误差带来的直方图算计不稳定性问题;

4、新增特色工程组件SecureBoost Transformer,使用SecureBoost的叶子结点进行样本编码;

5、隐私交集模块支撑随机数复用和分组算计均衡机制,功能晋升30%;

6、隐私保护交集支撑国密SM3杂凑算法;

7、纵向GLM优化算计通信流程,支撑低精度加密运算,功能晋升可达2倍;

8、纵向神经网络支撑低精度加密运算,支撑SelectiveBackPropagation、交互层的dropOut,功能晋升2倍;

9、纵向特色分箱优化算计逻辑,减少数据拷贝和内存消耗,支撑密文压缩,功能晋升2倍;

10、纵向Pearson模块支撑本地VIF的算计;

11、联邦特色选择新增Pearson相关性和VIF共线性过滤器;

12、横向神经网络支撑直接输入图像数据进行训练和预测;

13、横向神经网络torch后端重构和语法优化;

14、新增横向联邦分箱,支撑virtual和迭代式2种横向联邦分箱机制;

15、新增样本加权模块,支撑列加权和标签加权机制,纵向GLM、纵向SecureBoost支撑加权训练;

16、新增组件data_transformer,支撑输入数据schema大小写不敏感;

17、LocalBaseline组件支撑离线预测;

18、CrossValidation支撑输出数据切分明细;

19、Evaluation模块支撑多分类评估指标的one-vs-rest展开成二分类指标功能。

System Architecture 

1、新增本地文件系统目录路径虚拟存储引擎,以支撑图像输入数据;

2、新增消息队列Pulsar跨站点传输引擎,可搭配Spark算计引擎使用,并可加入Exchange角色支撑星型站点组网模式。

FATE-Test

1、FATE-Test新增算法效率比较,支撑自动化数据的生成;

2、FATE-Test支撑flow接口的自动化回归和正确性测试,覆盖rest\cli\sdk三类接口;

3、FATE-Test支撑flow流程自动化回归训练、预测、在线推模型的全流程;

4、FATE-Test算法效果对比功能增强,支撑验证集指标一致性对比。

FATE-Board

1、SBT Transformer:新增sbt transformer组件,支撑利用hetero_sbt模型对样本特色进行重新编码;

2、Sample Weight:新增sample weight组件,可为样本进行加权,当前支撑根据标签指定权重或根据特色列自动提取权重;

3、Homo Feature Binning:新增homo feature binning组件,用于横向联邦场景下的分箱,当前支撑观察各特色的分箱数及分箱区间;

4、Data Transformer:新增data transformer组件,该组件继承data IO组件的功能,同时支撑大小写不敏感等新特性;

5、Reader:支撑读入图像文件;

6、Hetero Feature Binning:支撑根据woe筛选观察分箱;

7、Pearson:支撑算计特色VIF值;

8、Feature Selection:支撑使用pearson进行特色选择;

9、SecureBoost:支撑同时观察模型的gain和split两类特色重要性,二分类情形下Performance Score支撑观察汇总图表;

10、CV组件:支撑观察和下载每一折的训练集样本及其训练结果;

11、Evaluation:支撑观察one_vs_rest各子模型的二分类指标及汇总可视化图表;

12、可在Board上导出当前任务的dsl和conf文件;

13、可根据合作成员的party_id条件搜索job;

14、优化组件数据/模型下载功能;

15、优化迭代次数过多/cv折数过多情况下Performance Score的图表展示。

KubeFate

1、支撑FATE v1.6.0部署,方便配置切换不同的算计引擎、存储引擎、传输引擎;

2、支撑最新的Pulsar传输引擎配置,以及Pulsar exchange模式配置;

3、改进Spark作为算计引擎的配置;

4、新增Kubernetes日志聚合,提高错误追踪能力;

5、新增集群部署任务的停止功能。

了解更多联邦进修相关资讯,可参考官网(https://www.fedai.org)或者扫描下方二维码,添加小助手。

全球首个联邦进修工业级开源框架FATE更新!五大模块迎来巨幅优化

原创文章,作者:新闻助手,如若转载,请注明出处:https://www.iaiol.com/news/quan-qiu-shou-ge-lian-bang-jin-xiu-gong-ye-ji-kai-yuan/

(0)
上一篇 2021年 3月 31日 下午5:01
下一篇 2021年 3月 31日 下午9:38

相关推荐

  • 华人一作统一「视觉-谈话」理解与天生:一键天生图象标注,完成视觉问答,Demo可玩

    这个 BLIP 模型可以「看图说话」,提取图象的主要内容,不仅如此,它还能回答你提出的关于图象的问题。

    2022年 2月 6日
  • AMD Ryzen 5000移动版曝光,功能大涨30%,明年1月或发布

    新呈现的型号 Ryzen 9 5900HX,单核功能要比现在的旗舰级 4900HS 快 30% 左右,还没有算超频。

    2020年 12月 9日
  • 大模型时代还不理解自注意力?这篇文章教你从头写代码实现

    自注意力是 LLM 的一大核心组件。对大模型及相关应用开发者来说,理解自注意力非常重要。近日,Ahead of AI 杂志运营者、机器学习和 AI 研究者 Sebastian Raschka 发布了一篇文章,介绍并用代码从头实现了 LLM 中的自注意力、多头注意力、交叉注意力和因果注意力。太长不看版这篇文章将介绍 Transformer 架构以及 GPT-4 和 Llama 等大型语言模型(LLM)中利用的自注意力体制。自注意力等相关体制是 LLM 的核心组件,因此如果想要理解 LLM,就需要理解它们。不仅如此,这

    2024年 2月 16日
  • 把轮子装在膝盖上,「机器羊」能走能滑、还载起了人和货

    四足机器人不一定是机器狗,也可能是「机器羊」。

    2022年 3月 29日
  • 图神经网络精确预计有机化合物性质,加速静态电池的设计

    编辑/绿萝大规模从头较量争论与布局预计的进步相结合,在有机功能资料的发觉中发挥了重要作用。目前,在有机资料的广阔化学空间中,只发觉了一小部分。实验和较量争论研讨职员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研讨职员展示了一种可以精确预计有机化合物性质的机械进修方法。展示了基态(GS)和更高能量布局的平衡训练数据集,对使用通用图神经网络(GNN)架构精确预计总能量的重要性。该研讨可加速静态电池的设计。该研讨以「Predicting energy and stabi

    2021年 12月 24日
  • 终于可用可拉拢函数变换库!PyTorch 1.11发布,弥补JAX短板,撑持Python 3.10

    PyTorch 1.11、TorchData 和 functorch 现已推出。

    2022年 3月 13日
  • 争取盟友、洞察人心,最新的Meta智能体是个谈判高手

    AI 学会了「揣度人心」,这本来是世界上最难的事情之一。

    2022年 11月 23日
  • 特斯拉被判向挪威车主支付巨额罚金,或在多地产生连锁效应

    在挪威的一家法庭上,特斯拉由于通过软件进级限制充电速度、并降低电池容量而被判有罪。除非特斯拉上诉,否则该品牌将会向挪威遭到作用的车主每人赔付16000美元。据了解,挪威是特斯拉人均保有量最多的国度,而遭到相关问题作用的用户,可能会达到一万名。现如今其他国度也正在调查类似案件,所以这一惩罚可能会对特斯拉起到连环负面效应。早在2019年,外媒就曾报导过数起特斯拉车主在进级软件后,车辆续航上升12-30英里的事件。在那时,只有选装了85kWh电池包的Model S和Model X遭到了作用,而上述两款车型早在2016年就

    2021年 5月 26日
  • google研究总监Peter Norvig赴斯坦福任教,著有《人工智能:一种现代方法》

    Peter Norvig:AI 在线课程 10 万报名只有 1.6 万人上完,这才是必要解决的题目。

    2021年 10月 12日
  • 曝光!阿里50余位工程师私藏的进修资本清单

    进修是⼀个不断精进的过程,没有 standard destination。我们经常听到技巧人各种进修困扰:●「AI 范围发展太快了,感觉囤积的进修资本好容易过时。」●「网上资料和课程太多了,不知道怎么挑选出适合自己的经典资料。」●「想知道阿里 p7p8 同砚的技巧发展路线,都有哪些精进方式?」工欲善其事,必先利其器。⼀份高质量的进修资本是每位技巧同砚的发展必需品。通常来说,只有当进修资本 catch 到我们学问盲点的时候才能勾起我们的兴趣,此外,相关范围的前辈根据自身经验的推荐,是不错的挑选标准。基于此,来自阿里淘

    2021年 9月 17日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注