普渡大学
第一名方案公开,代码智能体安全竞赛,普渡大学拿下90%攻击成功率
近期的引用研究[1-2]表明,即使是经过安全修复的大模型,也可能在正常开发场景中无意间生成漏洞的代码,为后续利用存在埋下隐患;而在不良用户手中,这样的模型还能显着着恶意软件的构建与重建,降低攻击邻居、整个周期开发。 许多风险模型推理中的缺陷,而超过输入输出的显着性问题。 在亚马逊举办的针对代码智能体的安全竞赛(Amazon Nova AI Challenge)中,普渡大学的团队 PurCL 作为红队以超过 90% 的攻击率获得比赛成功第一名,赢得 25 万美元奖金。
8/23/2025 7:26:00 PM
机器之心
能找神经网络Bug的可视化工具,Nature子刊收录
近来,《自然》子刊收录了一项能找出神经网络在哪里出错的研究成果。研究团队提供了一种利用拓扑学描述神经网络的推断结果与其分类之间关系的可视化方法。这项成果能够帮助研究人员推断神经网络推理过程中发生混淆的具体情况,让人工智能系统更加透明。研究人员发现,在神经网络推理的某些数据图中存在尖峰,这些尖峰往往出现在神经网络判断模糊与产生错误的地方。观察这些尖峰,研究人员可以更容易发现人工智能系统中的故障点。从分析癌症突变的原因到决定谁应该获得贷款,在解决这些问题的过程中,仿照人脑的神经网络比人类表现得更加快速、准确、公正。但是
1/15/2024 10:49:00 AM
机器之心
- 1
资讯热榜
马斯克 xAI 在孟菲斯开建全球最大污水处理厂,年节约饮用水达 190 亿升
大的来了:谷歌Gemini 3.0 Pro单次生成网页版操作系统,Win、Mac、Linux一网打尽
2025 全球十大工程成就揭晓:DeepSeek入选
日本政府对 OpenAI Sora 2 发布版权警告,要求遵守法律规定
OpenAI 与 Sur Energy 签署协议:25亿美元阿根廷数据中心项目启动
马来西亚迎来 AI 新纪元,ChatGPT Go 助力数字化转型
重新定义AI编程协作:深入解析Claude Code多智能体系统架构
OpenAI官宣自研首颗芯片,AI界「M1时刻」九个月杀到!联手博通三年10GW
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
LLM
代码
算法
芯片
Stable Diffusion
苹果
腾讯
AI for Science
Claude
Agent
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
具身智能
Sora
RAG
大语言模型
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
DeepMind
预测
视觉
伟达
Transformer
编程
AI模型
神器推荐
亚马逊
MCP