全球首个联邦进修工业级开源框架FATE更新！五大模块迎来巨幅优化

FATE（Federated AI Technology Enabler）是微众银行AI团队研发的全球首个联邦进修工业级开源框架，旨在提供安全的算计框架来支撑联邦 AI 生态。FATE 实现了基于同态加密和多方算计（MPC）的安全算计协议，它支撑联邦进修架构和多种机器进修算法的联邦进修实现，包括逻辑回归、基于树的算法、深度进修和迁移进修等等。3月31日，FATE推出 v1.6版本更新。在1.6版本中，优化了功能效率及稳定性，在使用体验方面，根据社区的反馈也有多方面的优化，将带来更流畅的使用体验。此外，新版本对其他F

3月31日，FATE推出 v1.6版本更新。在1.6版本中，优化了功能效率及稳定性，在使用体验方面，根据社区的反馈也有多方面的优化，将带来更流畅的使用体验。

此外，新版本对其他FederatedML、System Architecture、FATE-Test、FATE-Board、KubeFate等多个模块都进行了更新及改进，五大模块更新如下：

FederatedML

1、纵向SecureBoost 算计机制优化，支撑GOSS、直方图相减、密文压缩等机制，功能提拔2-4倍；

2、纵向SecureBoost支撑L1、min_child_weight，缓解过拟合问题；

3、纵向SBT增加deterministic选项，解决因为浮点误差带来的直方图算计不稳定性问题；

4、新增特点工程组件SecureBoost Transformer，使用SecureBoost的叶子结点进行样本编码；

5、隐私交集模块支撑随机数复用和分组算计均衡机制，功能提拔30%；

6、隐私保护交集支撑国密SM3杂凑算法；

7、纵向GLM优化算计通信流程，支撑低精度加密运算，功能提拔可达2倍；

8、纵向神经网络支撑低精度加密运算，支撑SelectiveBackPropagation、交互层的dropOut，功能提拔2倍；

9、纵向特点分箱优化算计逻辑，减少数据拷贝和内存消耗，支撑密文压缩，功能提拔2倍；

10、纵向Pearson模块支撑本地VIF的算计；

11、联邦特点选择新增Pearson相关性和VIF共线性过滤器；

12、横向神经网络支撑直接输入图像数据进行训练和预测；

13、横向神经网络torch后端重构和语法优化；

14、新增横向联邦分箱，支撑virtual和迭代式2种横向联邦分箱机制；

15、新增样本加权模块，支撑列加权和标签加权机制，纵向GLM、纵向SecureBoost支撑加权训练；

16、新增组件data_transformer，支撑输入数据schema大小写不敏感；

17、LocalBaseline组件支撑离线预测；

18、CrossValidation支撑输出数据切分明细；

19、Evaluation模块支撑多分类评估指标的one-vs-rest展开成二分类指标功能。

System Architecture

1、新增本地文件系统目录路径虚拟存储引擎，以支撑图像输入数据；

2、新增消息队列Pulsar跨站点传输引擎，可搭配Spark算计引擎使用，并可加入Exchange角色支撑星型站点组网模式。

FATE-Test

1、FATE-Test新增算法效率比较，支撑自动化数据的生成；

2、FATE-Test支撑flow接口的自动化回归和正确性测试，覆盖rest\cli\sdk三类接口；

3、FATE-Test支撑flow流程自动化回归训练、预测、在线推模型的全流程；

4、FATE-Test算法效果对比功能增强，支撑验证集指标一致性对比。

FATE-Board

1、SBT Transformer：新增sbt transformer组件，支撑利用hetero_sbt模型对样本特点进行重新编码；

2、Sample Weight：新增sample weight组件，可为样本进行加权，当前支撑根据标签指定权重或根据特点列自动提取权重；

3、Homo Feature Binning：新增homo feature binning组件，用于横向联邦场景下的分箱，当前支撑观察各特点的分箱数及分箱区间；

4、Data Transformer：新增data transformer组件，该组件继承data IO组件的功能，同时支撑大小写不敏感等新特性；

5、Reader：支撑读入图像文件；

6、Hetero Feature Binning：支撑根据woe筛选观察分箱；

7、Pearson：支撑算计特点VIF值；

8、Feature Selection：支撑使用pearson进行特点选择；

9、SecureBoost：支撑同时观察模型的gain和split两类特点重要性，二分类情形下Performance Score支撑观察汇总图表；

10、CV组件：支撑观察和下载每一折的训练集样本及其训练结果；

11、Evaluation：支撑观察one_vs_rest各子模型的二分类指标及汇总可视化图表；

12、可在Board上导出当前任务的dsl和conf文件；

13、可根据合作成员的party_id条件搜索job；

14、优化组件数据/模型下载功能；

15、优化迭代次数过多/cv折数过多情况下Performance Score的图表展示。

KubeFate

1、支撑FATE v1.6.0部署，方便配置切换不同的算计引擎、存储引擎、传输引擎；

2、支撑最新的Pulsar传输引擎配置，以及Pulsar exchange模式配置；

3、改进Spark作为算计引擎的配置；

4、新增Kubernetes日志聚合，提高错误追踪能力；

5、新增集群部署任务的停止功能。

了解更多联邦进修相关资讯，可参考官网（https://www.fedai.org）或者扫描下方二维码，添加小助手。

全球首个联邦进修工业级开源框架FATE更新！五大模块迎来巨幅优化

{{userData.name}}已认证

全球首个联邦进修工业级开源框架FATE更新！五大模块迎来巨幅优化

ARM最新回应：新架构Armv9不受美国出口管理条例约束，华为可获受权

智加科技完成总计4.2亿美元新一轮融资

独家对话李岩：宿华、经纬、红点资金支持，第一个「生成式推荐」创业公司｜AI Pioneers

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

baidu李彦宏：开源模型是智商税，闭源模型更强大、推理本钱更低

Midjourney 再更新！V6 模型支持外绘拓展与局部重绘了!

Python 3.11正式版来了，比3.10快10-60%，官方：这或许是最好的版本

无需训练，主动扩大的视觉Transformer来了

教授何恺明在MIT的第一堂课

用魔法打败魔法，电信公司已部署 AI 遏制诈骗电话