AI在线 AI在线

三维多样化框架

ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

第一作者武骁睿,武汉大学计算机学院博士一年级生,研究大语言模型安全对齐与红队数据生成,侧重低资源场景的对齐策略与风险覆盖。 导师:李庄讲师(RMIT,低资源 NLP、计算社会科学、模型安全),姬东鸿教授、李霏副教授、腾冲副教授(武汉大学,情感计算、信息抽取)。 合作单位蚂蚁集团、蚂蚁国际,合作作者张欣主任工程师、毛潇锋工程师。
7/31/2025 5:54:00 PM
机器之心
  • 1