人工智能安全

AI 安全性与有效性测试存在严重缺陷，引发专家关注

AI 安全性与有效性测试存在严重缺陷，引发专家关注

近日，来自英国政府 AI 安全研究所的计算机科学家及斯坦福大学、加州大学伯克利分校和牛津大学的专家们，对超过440个用于评估新人工智能模型安全性和有效性的基准进行了深入研究。他们发现几乎所有测试在某一领域存在缺陷，这些缺陷可能会 “削弱结果声明的有效性”，并且一些测试的评分结果可能 “无关紧要甚至误导”。图源备注：图片由AI生成随着各大科技公司不断推出新 AI，公众对 AI 的安全性和有效性日益担忧。

11/4/2025 10:51:41 AM AI在线

《中国人工智能安全承诺框架》发布

《中国人工智能安全承诺框架》发布

AI在线 7 月 30 日消息，2025 世界人工智能大会暨人工智能全球治理高级别会议“人工智能发展与安全”全体会议 7 月 26 日下午在上海召开。会议由中国人工智能发展与安全研究网络（以下简称“研究网络”，CnAISDA）主办。上海市委常委、常务副市长吴伟，国家发展和改革委员会创新驱动发展中心主任霍福鹏出席并致辞。

7/30/2025 5:30:20 PM 汪淼

OpenAI新模型o3首次出现 “拒绝自我关闭” 现象

OpenAI新模型o3首次出现 “拒绝自我关闭” 现象

最近，人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。这是首次观察到 AI 模型在明确指令下故意不遵守，打破了传统对 AI 行为的认知。此事件让 AI 的安全性和可控性再次成为公众热议的焦点。

5/27/2025 10:01:25 AM AI在线

前 OpenAI 政策负责人质疑公司 AI 安全叙事的变更

前 OpenAI 政策负责人质疑公司 AI 安全叙事的变更

最近，前 OpenAI 政策研究负责人迈尔斯・布伦达奇（Miles Brundage）对公司在人工智能安全方面的叙事变更提出了批评，认为 OpenAI 正在重新编写其 AI 系统安全的历史。他表示，OpenAI 在追求通用人工智能(AGI)的过程中，可能会忽视长远的安全措施。 OpenAI 一直以来致力于推动其雄心勃勃的愿景，尤其是在 DeepSeek 等竞争对手日益崛起的背景下。

3/7/2025 11:41:00 AM AI在线

用AI反制AI诈骗，合合信息获全球AI攻防挑战赛金融场景赛道冠军

用AI反制AI诈骗，合合信息获全球AI攻防挑战赛金融场景赛道冠军

11月20日，2024年世界互联网大会乌镇峰会在浙江省桐乡市乌镇开幕，主题为“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”。会议期间，由中国图象图形学学会、蚂蚁集团、云安全联盟（CSA）大中华区联合主办的AI大模型攻防赛圆满落下帷幕，该赛事联合了清华大学、上海交通大学、浙江大学等高校及多家产学研组织共同发起，直面并解决大模型应用中潜藏风险，助力全球AI产业健康可持续发展。大赛吸引了来自全球18个国家和地区的3200余名技术精英参与，参赛者来自清华大学、北京大学、交通大学、南洋理工大学等290多所国内外高校，以及字节跳动、理想汽车、腾讯、合合信息等上百家科技企业。

11/21/2024 2:22:00 PM 机器之心

有史以来最高互作强度，华盛顿大学David Baker团队用AI工具产生具有非凡结合强度的蛋白质

有史以来最高互作强度，华盛顿大学David Baker团队用AI工具产生具有非凡结合强度的蛋白质

编辑 | 萝卜皮多肽的研究对于药物开发、疾病检测和环境监测具有重大意义。许多肽激素在结合其受体后形成 α 螺旋，对其敏感的检测方法可能有助于更好的疾病临床管理。从头蛋白质设计现在可以生成对结构化蛋白质具有高亲和力和特异性的结合物。然而，蛋白质和具有螺旋倾向的短肽之间的相互作用的设计是一个尚未解决的挑战。华盛顿大学医学院蛋白质设计研究所的科学家们人工智能驱动的生物技术来应对这些挑战。他们使用人工智能软件创建了蛋白质分子，这些蛋白质分子以极高的亲和力和特异性与各种具有挑战性的生物标志物（包括人类激素）结合。值得注意的是

12/20/2023 2:20:00 PM ScienceAI

MBZUAI校长邢波亲笔撰文：人工智能的「文艺复兴」已经到来

MBZUAI校长邢波亲笔撰文：人工智能的「文艺复兴」已经到来

机器之能报道作者：邢波关于 AI 风险的问题，各路大佬也是意见不统一，前阵子大家还在社交媒体上爆发了一场大规模论战。有的人带头签署联名信，呼吁 AI 实验室应立即暂停研究并呼吁政府加强监管。也有不少人对 AI 发展非常积极乐观，认为 AI 的发展远未构成对人类的威胁，监管只会蜕变为少数巨头利益的保护伞。英国政府针对 AI 技术前后态度的变化，正是「威胁论」尘嚣甚上的例证。三月份，英国政府曾发布白皮书，承诺不会扼杀 AI 创新。仅仅两个月后，「AI 末日论」弥漫，政府也开始讨论为 AI 设置护栏，并敦促美国政府

11/20/2023 6:17:00 PM 机器之能

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉