人工智能安全
AI 安全性与有效性测试存在严重缺陷,引发专家关注
近日,来自英国政府 AI 安全研究所的计算机科学家及斯坦福大学、加州大学伯克利分校和牛津大学的专家们,对超过440个用于评估新人工智能模型安全性和有效性的基准进行了深入研究。 他们发现几乎所有测试在某一领域存在缺陷,这些缺陷可能会 “削弱结果声明的有效性”,并且一些测试的评分结果可能 “无关紧要甚至误导”。 图源备注:图片由AI生成随着各大科技公司不断推出新 AI,公众对 AI 的安全性和有效性日益担忧。
11/4/2025 10:51:41 AM
AI在线
《中国人工智能安全承诺框架》发布
AI在线 7 月 30 日消息,2025 世界人工智能大会暨人工智能全球治理高级别会议“人工智能发展与安全”全体会议 7 月 26 日下午在上海召开。 会议由中国人工智能发展与安全研究网络(以下简称“研究网络”,CnAISDA)主办。 上海市委常委、常务副市长吴伟,国家发展和改革委员会创新驱动发展中心主任霍福鹏出席并致辞。
7/30/2025 5:30:20 PM
汪淼
OpenAI新模型o3首次出现 “拒绝自我关闭” 现象
最近,人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。 这是首次观察到 AI 模型在明确指令下故意不遵守,打破了传统对 AI 行为的认知。 此事件让 AI 的安全性和可控性再次成为公众热议的焦点。
5/27/2025 10:01:25 AM
AI在线
前 OpenAI 政策负责人质疑公司 AI 安全叙事的变更
最近,前 OpenAI 政策研究负责人迈尔斯・布伦达奇(Miles Brundage)对公司在人工智能安全方面的叙事变更提出了批评,认为 OpenAI 正在重新编写其 AI 系统安全的历史。 他表示,OpenAI 在追求通用人工智能(AGI)的过程中,可能会忽视长远的安全措施。 OpenAI 一直以来致力于推动其雄心勃勃的愿景,尤其是在 DeepSeek 等竞争对手日益崛起的背景下。
3/7/2025 11:41:00 AM
AI在线
用AI反制AI诈骗,合合信息获全球AI攻防挑战赛金融场景赛道冠军
11月20日,2024年世界互联网大会乌镇峰会在浙江省桐乡市乌镇开幕,主题为“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”。 会议期间,由中国图象图形学学会、蚂蚁集团、云安全联盟(CSA)大中华区联合主办的AI大模型攻防赛圆满落下帷幕,该赛事联合了清华大学、上海交通大学、浙江大学等高校及多家产学研组织共同发起,直面并解决大模型应用中潜藏风险,助力全球AI产业健康可持续发展。 大赛吸引了来自全球18个国家和地区的3200余名技术精英参与,参赛者来自清华大学、北京大学、交通大学、南洋理工大学等290多所国内外高校,以及字节跳动、理想汽车、腾讯、合合信息等上百家科技企业。
11/21/2024 2:22:00 PM
机器之心
有史以来最高互作强度,华盛顿大学David Baker团队用AI工具产生具有非凡结合强度的蛋白质
编辑 | 萝卜皮多肽的研究对于药物开发、疾病检测和环境监测具有重大意义。许多肽激素在结合其受体后形成 α 螺旋,对其敏感的检测方法可能有助于更好的疾病临床管理。从头蛋白质设计现在可以生成对结构化蛋白质具有高亲和力和特异性的结合物。然而,蛋白质和具有螺旋倾向的短肽之间的相互作用的设计是一个尚未解决的挑战。华盛顿大学医学院蛋白质设计研究所的科学家们人工智能驱动的生物技术来应对这些挑战。他们使用人工智能软件创建了蛋白质分子,这些蛋白质分子以极高的亲和力和特异性与各种具有挑战性的生物标志物(包括人类激素)结合。值得注意的是
12/20/2023 2:20:00 PM
ScienceAI
MBZUAI校长邢波亲笔撰文:人工智能的「文艺复兴」已经到来
机器之能报道作者:邢波关于 AI 风险的问题,各路大佬也是意见不统一,前阵子大家还在社交媒体上爆发了一场大规模论战。 有的人带头签署联名信,呼吁 AI 实验室应立即暂停研究并呼吁政府加强监管。也有不少人对 AI 发展非常积极乐观,认为 AI 的发展远未构成对人类的威胁,监管只会蜕变为少数巨头利益的保护伞。 英国政府针对 AI 技术前后态度的变化,正是「威胁论」尘嚣甚上的例证。三月份,英国政府曾发布白皮书,承诺不会扼杀 AI 创新。仅仅两个月后,「AI 末日论」 弥漫,政府也开始讨论为 AI 设置护栏,并敦促美国政府
11/20/2023 6:17:00 PM
机器之能
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉