资讯列表

分类

标签

刚刚，谷歌摊牌：Genie 3让你1秒「进入」名画，人人可造交互世界！

谷歌摊牌了，彻底不装了！他们前几天刚刚发布的Genie 3世界模型，正在疯狂展示AI的超能力。它不只是能从文本中生成交互式的AI空间世界，还能操控图像和视频。

8/11/2025 9:21:00 AM

突破40年Dijkstra算法瓶颈，清华教授等颠覆教科书！斩获STOC最佳论文

计算机科学的重大成果！清华大学教授刷新最短路径算法认知，或将改写计算机算法教科书。在计算机科学中，一个经典问题是寻找网络中每个点的最短路径，而Dijkstra算法是此问题的最经典解决方法。

8/11/2025 9:18:00 AM

蛋白质基座的GPT时代来了？！

蛋白质模型的GPT时刻来了！清华大学智能产业研究院（AIR）周浩副教授课题组联合上海人工智能实验室发布了AMix-1：. 首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling的系统化方法论来构建蛋白质基座模型。

8/11/2025 9:15:00 AM

梦晨

内幕曝光：OpenAI模型坦承不会第六题，三人俩月拿下IMO金牌！

OpenAI的ChatGPT真能拿到国际奥数IMO金牌？还是OpenAI的自嗨？背后到底有何隐情？

8/11/2025 8:57:00 AM

奥特曼曝惊世预言：2035年GPT-8治愈癌症！人类将为算力爆发三战

GPT-5发布后，毫无意外又在全网掀起轩然大波。「还我GPT-4o」的呼声，如海啸一般在全网掀起！甚至连Karpathy都同意，GPT-5确实有些令人失望了终于，在铺天盖地的骂声中，奥特曼火速承认错误，表示会立刻让GPT-4o回归！

8/11/2025 8:57:00 AM

AI「解码」古罗马，重现千年铭文真相！DeepMind新模型再登Nature

Aeneas原本是古希腊神话中流浪英雄。出现在7月24日Nature主刊的Aeneas则是一个多模态生成式神经网络，它能帮助历史学家更好地解读、归属和修复残缺文本。想象考古学家在欧洲发现了一块刻有古代文字的铭文，文本残缺不全、部分文字被风化或被故意破坏。

8/11/2025 8:54:00 AM

本科必学Dijkstra算法被超越！清华段然团队打破图灵奖得主证明的普遍最优性

本科经典算法Dijkstra，被清华团队超越了！这个被用来解决最短路径问题的经典算法，去年才被图灵奖得主Tarjan团队证明具有普遍最优性。但现在，来自清华的段然团队将这一格局彻底打破——运行速度比任何Dijkstra及其改进算法都快，关键是它彻底解决了困扰研究人员四十多年来的“排序障碍”。

8/11/2025 8:49:00 AM

史上最大高质量科学推理后训练数据集开源，快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了！上海创智学院、上海交通大学（GAIR Lab）发布MegaScience。该数据集包含约125万条问答对及其参考答案，广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域，旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

8/11/2025 8:46:00 AM

实测谷歌AI故事书，我实现漫画和绘本自由了

谷歌Gemini又双叒叕出新工具了，只需要30s左右，就能让AI帮你生成一篇10页的故事书，还是免费的。并且支持中文，生成的内容也相当有趣。这一次带来的是能够一键生成故事书的StoryBook：只需描述你想要的故事，如果喜欢的话还可以添加文件和图片，Gemni将会创造一本独特的10页故事书。

8/11/2025 8:45:00 AM

代季峰陈天桥联手AGI首秀炸场！最强开源深度研究模型，GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR（Open Deep Research），来自代季峰加盟陈天桥的技术首秀。首先，它做到了性能最强，GAIA测试结果更是达到了82.4分，超过了一众开源闭源模型，其中包括Manus、OpenAI的DeepResearch。

8/11/2025 8:43:00 AM

3B模型性能小钢炮，“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab&澳门大学

当大模型把人类曾经的终极考题变成日常练习，AI的奔跑却悄悄瘸了腿——训练能力突飞猛进，验证答案的本事却成了拖后腿的短板。为此，上海AI Lab和澳门大学联合发布通用答案验证模型CompassVerifier与评测集VerifierBench。填补了Verifier领域没有建立验证-提升-验证的循环迭代体系的空白。

8/11/2025 8:35:00 AM

开发MCP服务，何时使用工具？何时使用资源？

当我们朝着构建能够推理、计划和自主行动的智能系统前进时，模型上下文协议 (MCP) 在构建 AI 模型如何与外部工具和数据交互方面扮演着关键角色。在采用 MCP 时，一个容易混淆的常见问题是——什么时候使用资源，什么时候使用工具。在这里，老码农尝试对这些概念进行区分，提供一些实际的示例，并总结要点，以便有效地应用它们。

8/11/2025 8:05:58 AM

曹洪伟

大家好，这是 2025 年 8 月第一波干货合集！这期干货合集几乎全都是 AI 工具，有基于 AI 的着陆页生成工具，有给 Blender 做的 AI 助手，有免费生成粉色壁纸的 AI 网站，有免费且具备 AI 功能的在线设计平台，有基于 AI 的 Github Readme 文档生成工具，还有一键生成可交互页面的 AI 平台。当然，在继续阅读下去之前，记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货:.

8/11/2025 7:35:54 AM

陈子木

AI能替你写代码，但近半数代码可能暗藏安全漏洞

Veracode发布的《2025年GenAI代码安全报告》显示，虽然GenAI擅长编写可运行的代码，但在45%的情况下会引入安全漏洞，该报告分析了80个真实编程任务中100多个大语言模型(LLM)生成的代码。氛围编程Veracode首席技术官延斯·韦斯林(Jens Wessling)表示：“氛围编程(vibe coding)的兴起，标志着软件开发方式的根本转变。在氛围编程中，开发者通常依赖AI生成代码，且不明确规定安全要求，这种趋势的主要问题在于，开发者无需指定安全约束就能得到想要的代码，实际上是将安全编码决策交给了大语言模型。

8/11/2025 7:30:00 AM

为何必须由营销部门而非IT部门主导AI转型

AI已不再是一项边缘实验，它正像互联网、移动技术和云技术一样，成为现代营销的基础层面。麦肯锡2025年全球AI调查发现，92%的公司计划在未来三年内增加AI预算，78%的公司已经在至少一项业务职能中应用了AI。我每天都与以增长为重点的营销高管交流，他们面临着证明其影响力的压力，并寻求解决方案。

8/11/2025 7:07:00 AM

Debra

上海AI Lab庞江淼：开放平台是具身智能“ChatGPT时刻”的前提丨具身先锋十人谈

置身机器人这样的大热赛道，明星研究员总被如此之多的目光注视着。但关于庞江淼，网络查到的信息寥寥。为数不多的内容是，聚焦计算机视觉，浙江大学博士，香港中文大学MMLab研究员，接下来一份经历就是现在了——上海AI实验室青年科学家，具身智能团队负责人。

8/11/2025 3:07:00 AM

丁莉

ICML25 视频问答中以语言为中心的结构化推理

一、前言由于现有的多模态大语言模型（MLLM）在推理过程中存在无法控制和不透明的问题，视频问答（VideoQA）在实现高级认知推理方面仍然具有挑战性。为了解决这一问题，哔哩哔哩Index团队联合上海交通大学提出了一种新颖的以语言为中心的树状推理（LTR）框架，旨在增强模型的推理能力，该论文已经被 ICML2025 收录，是继 ICLR2025 的工作（ICLR25 重新思考长尾识别中的分类器再训练：标签过平滑可以实现平衡）之后Index团队在AI三大顶会（ICLR/ICML/NeurIPS）的第二项收录。该框架通过递归地将原始问题划分为逻辑上可处理的子问题，并逐步解决这些子问题，从而提升现有MLLM的推理能力和可解释性。

8/11/2025 2:25:00 AM

GPT-5发布即翻车！奥特曼深夜承认：图表出错，模型变笨。用户只想用回GPT-4o

OpenAI在8月7日正式推出新一代旗舰大模型GPT-5。据说，这是该公司自成立以来最受关注的一次产品迭代，被宣称是“最强大、最智能”的语言模型，能够在推理、创意生成和多模态理解等多个方面实现质的飞跃。然而，就在发布后的不到24小时内，OpenAI首席执行官山姆·奥特曼就不得不面对现实。

8/11/2025 2:11:00 AM

资讯热榜

GPT-5发布即翻车！奥特曼深夜承认：图表出错，模型变笨。用户只想用回GPT-4o 2025 年多款 Deep Research 智能体框架全面对比 OpenAI夺金IOI，但输给3位中国高中生基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案，助力短剧出海和GPT聊了21天，我差点成为陶哲轩扎克伯格看OpenAI直播挖人，北大校友孙之清加入Meta Meta刚刚开源DINOv3，横扫60+任务，无标注封神！ OpenAI重磅发布ChatGPT-5！写作坠入谷底，编程一骑绝尘

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体论文英伟达 Anthropic 代码算法训练 Stable Diffusion 芯片蛋白质开发者腾讯 LLM 生成式苹果 Claude Agent AI新词神经网络 3D AI for Science 机器学习研究生成 xAI 人形机器人 AI视频计算 Sora GPU AI设计百度华为工具大语言模型搜索具身智能场景 RAG 字节跳动大型语言模型预测深度学习伟达视觉 Transformer 视频生成 AGI 神器推荐亚马逊架构 Copilot DeepMind 应用安全