AI在线 AI在线

人大

大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到

大模型伦理竟然无法对齐? 来自中国人民大学高瓴人工智能学院与上海人工智能实验室的最新研究发现:强化模型隐私保护能力的代价,竟是高达45%的公平性断崖式下跌! 团队深入神经元层面,揪出了关键原因:一组同时编码公平与隐私语义的耦合神经元,带来了伦理安全的「跷跷板效应」——一端压下去(公平),另一端(隐私)就必然翘起来。
7/27/2025 8:37:11 PM
一水
  • 1