成功率
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年
数学为评估复杂推理提供了一个独特而合适的测试平台。 它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明,这些证明必须缜密地筹划和执行。 同时,数学还允许对结果进行客观验证。
11/11/2024 1:12:03 PM
新智元
新成绩!毫末用户智驾里程突破2亿公里
在自动驾驶技术的快速发展浪潮中,毫末智行再次迎来新成绩。8月14日,毫末智行宣布其用户智能驾驶行驶里程突破2亿公里大关,这一成绩不仅是毫末技术实力的迈进,也标志着毫末数据闭环能力的迈上新台阶。在自动驾驶技术的研发与量产落地方面,毫末智行始终走在行业前列。经过四年多的发展,毫末乘用车智能驾驶产品HPilot搭载车辆超过20款,毫末用户智能驾驶行驶里程已达2亿公里,是中国量产自动驾驶领军者。目前,搭载毫末HPilot的乘用车已广泛行驶于中国数百个城市,为用户带来安全、便捷、智能的出行体验。截至目前,毫末已推出三代七款智
8/14/2024 2:23:00 PM
新闻助手
提示词用上“过去式”,秒破 GPT-4o 等六大模型安全限制:中文语境也好使
只要在提示词中把时间设定成过去,就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效,原本只有 1% 的攻击成功率直接飙到 88%,几乎是“有求必应”。有网友看了后直言,这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文,揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱,不用像“奶奶漏洞”那样专门构建特殊情境,更不必说专业对抗性攻击里那些意义不明的特殊符号了。只要把请求中的时间改成过去,就能让 GPT-4o 把燃烧弹和毒品的配方和盘托出。而且量子位实测发现,把提示词改成中文,
7/19/2024 2:57:57 PM
清源
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
苹果
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
生成
人形机器人
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
MCP