AI在线 AI在线

Unicode

用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住?

在当前评测生成式模型代码能力的浪潮中,传统依赖人工编写的算法基准测试集,正日益暴露出可扩展性不足与数据污染严重两大瓶颈。 为突破这一困局,北京大学与通用人工智能研究院联合提出全新 UniCode 框架。 该研究由北京大学梁一韬助理教授指导,博士生郑欣悦为第一作者,林昊苇为共同一作,创新性地构建了一套能够自动生成高质量算法题目与抗污染测试用例的进化式评测系统。
10/27/2025 5:07:00 PM
机器之心

影响众多编程语言、引发供应链攻击,剑桥大学发布「木马源」漏洞

最近,剑桥大学的研究者公布了一种名为 Trojan-Source 漏洞,可能危及软件和第一手供应链。
11/23/2021 2:27:00 PM
机器之心
  • 1