理论

任正非最新访谈谈人工智能：也许是人类社会最后一次技术革命

近日在深圳华为总部，人民日报记者一行与华为首席执行官任正非面对面交流。交流中任正非在回答有关人工智能的提问时表示，人工智能也许是人类社会最后一次技术革命，其发展要经历数十年、数百年，中国有很多优势。谈及中国发展人工智能的优势时，任正非称，人工智能在技术上的要害，是要有充足的电力、发达的信息网络。

6/10/2025 4:21:00 PM

“程序员炸锅”！Claude一夜撤离 Windsurf，OpenAI 收购遭"精准狙击"

本月初，Anthropic 悄然切断 Claude 3.x 模型在 Windsurf 平台上的接入，直接影响其免费与 Pro 试用用户。 Windsurf的官方消息事情发生得很快。 6 月 4 日，Windsurf 收到 Anthropic 的正式通知：Claude 3.x 系列模型将在不到一周后全面停止服务。

6/10/2025 4:19:54 PM

我让十个大模型又参加了完整版数学高考，第一名居然是它......

昨天，我不是发了几个大模型参加数学高考的测试文章嘛。没想到热度挺高，大家还挺关注的。图片不过，很多评论区的小伙伴也说，根本看不出来区别。

6/10/2025 11:25:31 AM 数字生命卡兹克

60%情况下，主流大模型没理解风险只是装懂！别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出，表象下藏着认知危机：即使生成合规答案，超60%的案例中模型并未真正理解风险。换句话说，主流推理模型的安全性能存在系统性漏洞。针对此种现象，淘天集团算法技术-未来实验室团队引入「表面安全对齐」（Superficial Safety Alignment, SSA）这一术语来描述这种系统性漏洞。

6/10/2025 11:25:06 AM

斯坦福NYU联合研究：AI和人类思维差异的惊人发现 —— 为什么大模型"聪明"却不够"智慧"？

1、一个令人深思的认知谜题想象一下这样的场景：你和ChatGPT都被要求对一堆动物进行分类。你可能会说"鸟类里，知更鸟是典型代表，而企鹅有点特殊"，而AI却可能简单粗暴地把所有有翅膀的都归为一类。表面上看，你们的分类结果差不多，但背后的思维逻辑却天差地别。

6/10/2025 11:22:38 AM 无影寺

强化学习之父：LLM主导只是暂时，扩展计算才是正解

这是新晋图灵奖得主、强化学习之父Richard Sutton对未来的最新预测。就在刚刚的新加坡国立大学建校120周年（NUS120）之际，Sutton受邀发表演讲——塑造AI和强化学习的未来。其实，这已经不是Sutton第一次在公开场合表达类似的观点，早在他19年的著作《痛苦的教训》中，他就明确提出：让AI尤其是LLM模仿人类思维方式，只能带来短期的性能提升，长期看只会阻碍研究的持续进步。

6/10/2025 11:22:09 AM

开源多智能体开发框架：支持MCP、Agent SDK，超2000颗星

著名企业孵化器Y Combinator支持的开源多智能体开发框架Rowboat。 Rowboat支持火热的MCP服务以及OpenAI开源的Agent SDK，几分钟就能开发一个复杂的智能体工作流。开源地址：、Playground、Copilot三大块组成：Agent，主要负责处理对话的特定部分，并能依据指令使用工具执行任务。

6/10/2025 9:28:31 AM

苹果炮轰AI推理遭打脸，GitHub大佬神怒怼！复杂任务≠推理能力

最近，苹果公司发表了预印本论文，指出推理大模型存在重大缺陷。昨天，Ruben Hassid发布了相关解读的X帖子，认为这是项突破性研究：苹果证明了Claude等AI推理模型，根本不会思考。这种解读在社交平台上广泛传播，浏览量已超过1000万，且仍在持续增长。

6/10/2025 9:25:27 AM

数学圈地震！o3靠直觉刷爆人类顶尖难题，14位专家集体破防

6/10/2025 9:22:31 AM

比自回归更灵活、比离散扩散更通用，首个纯Discrete Flow Matching多模态巨兽降临

王劲，香港大学计算机系二年级博士生，导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等，有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。近年来，大型语言模型（LLMs）在多模态任务中取得了显著进展，在人工通用智能（AGI）的两大核心支柱（即理解与生成）方面展现出强大潜力。

6/10/2025 9:18:53 AM

刚刚，苹果WWDC掀AI重构风暴！端侧模型全开放、AI版Siri却成最大「鸽」王

今年的苹果，到底有没有新活？北京时间今天凌晨 1 点，一年一度的「科技圈春晚」—— 苹果全球开发者大会 WWDC 在 CEO 蒂姆・库克的演讲中拉开了序幕！此次大会，苹果宣布了一系列操作系统、服务和软件的更新，其中包括全新的系统命名规则以及名为液态玻璃（ Liquid Glass）的新设计语言。

6/10/2025 9:10:47 AM

AI集体“听不懂”！MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容，已经是人类的常规操作。不过，你猜怎么着？面对1000道多步骤音频推理题时，30款AI模型竟然几乎全军覆没，很多开源模型表现甚至接近瞎猜。

6/10/2025 9:10:00 AM

AI七个月突破数学家“围剿”反超人类！14位数学家深挖原始推理token：不靠死记硬背靠直觉

从只能答对2%的题目，到在超难数学题集中刷下22%得分，甚至超过人类团队平均水平，大模型需要多长时间？现在，令数学家们都惊讶的结果已经尘埃落定：7个月。发生在大名鼎鼎的“专为为难大模型而生的”FrontierMath基准测试上的这一幕，在激起热议同时，也引发了新的思考：大模型们是怎么做到的？

6/10/2025 9:09:00 AM

双重突破：全球首个零售VLA大模型来了！开源OpenWBT让机器人遥操门槛暴降！

学会“适当暂停与总结”，大模型终于实现无限推理。想象一下，让你一口气不歇地推演一个超复杂数学证明，大脑也会“内存溢出”吧？如今的大模型在长上下文推理中也面临同样的困境，随着推理长度增加而指数级增长的计算成本，以及由于长度受限而被迫中断推理过程。

6/10/2025 9:07:00 AM

首创像素空间推理，7B模型领先GPT-4o，让VLM能像人类一样「眼脑并用」

视觉语言模型（VLM）正经历从「感知」到「认知」的关键跃迁。当OpenAI的o3系列通过「图像思维」（Thinking with Images）让模型学会缩放、标记视觉区域时，我们看到了多模态交互的全新可能。然而，当前主流VLM仍被困在「文本茧房」中——依赖文本token间接翻译视觉信息，在高清图像中的微小物体、视频里的动态细节等场景中，常常因缺乏直接视觉操作能力而「视而不见」。

6/10/2025 9:07:00 AM

无需SFT也不用RL，样本级推理优化神器SLOT来了，准确率轻松+10%

试想一下，如果你参加考试时，可以在答题前花几秒钟「适应」一下这道具体的题目，你的表现会不会更好？这正是西湖大学研究团队在最新论文中提出的核心思想。他们开发的 SLOT（Sample-specific Language Model Optimization at Test-time）方法，把每个输入 prompt 本身当作一份「迷你训练数据」，让模型在生成答案前先「学习」理解这个具体问题。

6/10/2025 9:05:00 AM

大模型能够自发形成“人类思维地图”！Nature子刊重磅研究揭示多模态大模型类脑机制

6/10/2025 9:04:00 AM

破解自驾数据难题！毫米波雷达可控仿真技术新框架来了

以神经网络为核心引擎，让AI承担雷达仿真数据生成任务，还实现对雷达物理特性的建模与控制——这就是光轮智能联合清华AIR、LeddarTech等机构提出的全新自动驾驶神经渲染框架SA-Radar。在无需雷达具体细节的情况下，它能实现可控且逼真的雷达仿真，支持场景的灵活编辑——包括雷达属性修改、演员移除以及新视角合成，并能显著增强多种下游任务。作为高级驾驶辅助系统（ADAS）中扮演着至关重要角色的雷达，其相关研究和开发仍面临数据获取的挑战。

6/10/2025 8:45:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉