理论

CEO卷走24亿，二号员工血亏99%！30亿Windsurf梦碎内幕曝光

Prem Qu Nair可能刚刚度过了一生中最跌宕起伏的时光。他是原Windsurf的2号员工。为了继续探索软件工程的未来，他从谷歌DeepMind离职，加入了AI初创Cognition。

7/28/2025 9:09:00 AM

马斯克擎天柱解决不了无「手」难题？跑酷炫技竟不会遛狗，机器人陷泥潭

机器人都能跑酷和跳街舞了，为啥还不能帮人类遛狗？昨天，英伟达AI大佬Jim Fan突发感慨，他将这一现象称之为迷你版「莫拉维克悖论」（Moravec's paradox）：对人类而言难度极高的体操动作，机器人做起来反而比做饭、打扫、组装这类不起眼的任务容易得多。这不仅让圈外人特别费解，就连Jim Fan父母也问过他无数次这个问题……这个「机器人莫拉维克悖论」还造成一种错觉，即机器人的物理AI能力远比实际上要先进。

7/28/2025 9:08:00 AM

Demis Hassabis最新采访：宇宙的本质是信息，一切都将被AI学习，2030年可实现AGI

谷歌DeepMind掌门人Demis Hassabis再度做客Lex Fridman播客，贡献了一场长达两个多小时、信息量爆炸的深度对话在这场对话中，Hassabis不仅给出了AGI实现的惊人时间表，更首次系统性地阐述了他关于宇宙、现实与AI的大一统哲学思想。他将AlphaFold、视频模型Veo、电子游戏、P vs NP问题，乃至生命的起源和意识，全部串联到了一个宏大的框架之下全程两个多小时，3万多字，强烈建议去看原视频：搜索Demis Hassabis: Future of AI, Simulating Reality, Physics and Video Games以下是我觉得比较有意的的点，分享给大家宇宙的本质是信息，因此万物皆可被AI高效学习信息第一性： Hassabis明确提出，信息是比能量和物质更根本的宇宙单位。

7/28/2025 9:06:04 AM

百元级硬件流畅运行百亿参数大模型！上交&本智激活开源端侧原生大模型

AI的下一个战场，不在云端，而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机，端侧AI已然成为兵家必争之地。背后的逻辑清晰而坚定：最懂你的AI，必须能安全地访问你的个人数据——邮件、照片、日程，而这一切的前提，就是将计算留在本地，将隐私还给用户。

7/28/2025 9:06:00 AM

字节跳动刚把自己招牌AI Agent开源了，可商用、超6000颗星

如果你是智能体资深玩家，相信一定用过字节跳动的招牌产品扣子（Coze），现在已经开源了，并且支持商业化。扣子是一个AI Agent开发平台，提供各类最新大模型、工具、多种开发模式和框架，从开发到部署提供可视化一站式开发环境。多数情况下，甚至不用编写代码就能完成所有开发流程。

7/28/2025 9:04:01 AM

刷新无监督异常检测上限！首提「匹配代价滤波for异常检测」范式 | ICML'25

你是否想过，工厂是如何在很多种不同产品中，精准识别出浅浅的划痕、缺失的元件，甚至是几乎察觉不到的微小缺陷？这远比「图像识别」要复杂。在工业质检、安防监控、医疗影像等场景中，无监督异常检测（Unsupervised Anomaly Detection, UAD）日益成为核心技术之一。

7/28/2025 9:03:00 AM

GPT-5实锤，悄悄上线代号「龙虾」！版本号曝光，实测编程惊人能改屎山代码

GPT-5来了？但是「龙虾」版！ GPT-5「Lobster」疑似现身WebDev Arena，引发社区狂热猜测：网友实测比Grok-4好的离谱。

7/28/2025 8:54:00 AM

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

当前最强大的大语言模型（LLM）虽然代码能力飞速发展，但在解决真实、复杂的机器学习工程（MLE）任务时，仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码，却无法模拟人类工程师那样，在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。为了打破这一瓶颈，来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo，一个专为训练和评测大模型智能体（LLM Agents）设计的“交互式武馆”。

7/28/2025 8:45:00 AM

超大模型推理加速2.18倍！SGLang联合美团技术团队开源投机采样训练框架

专门适用超大模型、带来2.18倍推理加速，最新投机采样训练框架开源！ SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。 SGLang，当前趋势下最受青睐的推理框架之一，为DeepSeek提供了专属优化，也深受英伟达、AMD、xAI等厂商喜爱。

7/28/2025 8:42:00 AM

研究人员发现奇怪现象：思考时间越长，大模型越笨

Michael Nuñez@MichaelFNunez译者 | 核子可乐审校 | 重楼Anthropic一项最新研究表明，AI模型耗费更长时间“思考”后表现未必更好，在某些情况下性能甚至会显著下降。这一发现，挑战了AI行业推理浪潮的理论根基。这项由Anthropic公司AI安全研究员Aryo Pradipta Gema及其他几位研究人员主导的项目，发现了所谓“测试时计算反比例”迹象，即延长大语言模型的推理长度实际上会降低其在多种任务中的表现。

7/28/2025 7:45:36 AM

核子可乐

数据的五宗罪，道出了数据治理的真正内涵

"老板，我们的数据量已经达到了PB级别！ " "那我们的业务决策准确率提升了吗？ " "这个......" 这就是当下企业面临的真实困境：数据的"富营养化"。

7/28/2025 6:00:00 AM

大数据AI智能圈

与Claude协作开发Go项目：AI编程实战指南

在软件开发领域，大语言模型正在改变我们编写代码的方式。作为一名有着丰富实践经验的开发者，我发现与Claude这样的AI工具协作时，关键不在于让AI完全接管开发工作，而在于建立合适的约束和工作流程。本文将分享我在使用Claude进行Go语言开发时总结的最佳实践，包括项目结构设计、代码质量控制、智能体协作以及如何构建一个可靠的AI结对编程工作流。

7/28/2025 4:22:00 AM

源自开发者

8个月1亿美元ARR神话：Lovable是如何"干翻"OpenAI和Cursor的？

你有没有发现，最近程序员圈子里又开始"内卷"了？不过这次不是卷技术，而是在卷一个让人震惊的数字：8个月，1亿美元ARR。说这个数字的时候，我自己都觉得有点不太现实。

7/28/2025 4:10:00 AM

阿丸笔记

协同 RAG-Reasoning：让大模型边想边查的“深度研究”范式

大家好我是肆〇柒。在AI领域，大型语言模型（LLM）已经展现出卓越的语言生成能力，并在诸多任务中取得了显著成果。然而，LLM 存在两大局限：一是知识幻觉，因其知识存储静态且参数化，易生成错误内容；二是复杂推理能力不足，难以应对现实世界的复杂问题。

7/28/2025 3:00:00 AM

肆零柒

Dify新版1.7发布，这两个重要更新你必须知道！

Dify 又发布新版了，这次也是直接从 V1.6.0 升级到 V1.7.0 了，那这次升级的主要内容是啥呢？接下来我们一起来看。这次升级除了修复了一些列 BUG 和部分功能优化之外，最大的升级是提升了 Dify 的安全性和版本兼容性。

7/28/2025 2:00:00 AM

磊哥

FastAPI开发AI应用：模型新增图片理解

本文将深入讲解如何在 FastAPI AI 聊天应用中实现图片理解功能，让 AI 能够理解和分析用户上传的图片内容。通过本教程，你将学会如何构建完整的多模态交互系统，包括图片上传、预处理、多模态消息格式化以及流式响应处理等核心技术。本文概述想象一下，当你向 AI 发送一张图片时，AI 不仅能看懂图片内容，还能基于图片进行深度分析和对话——就像一个拥有视觉能力的智能助手。

7/28/2025 1:55:00 AM

wayn

OpenAI 多智能体研究框架：构建高效协作的AI代理系统

在人工智能快速发展的今天，单一AI模型已难以满足复杂任务的需求，多智能体系统正成为解决复杂问题的重要方向。 OpenAI推出的多智能体研究框架（Multi-AI Agent Research Framework）通过协调多个各司其职的AI代理，实现了远超单一模型的研究能力和应用价值。本文将深入解析这一框架的核心原理、架构设计、实际应用及未来潜力，为开发者和企业提供全面的参考指南。

7/28/2025 1:33:00 AM

大模型之路

Claude Code官方揭秘！内部使用指南曝光：员工都是这样用CC的！把 AI 当老虎机，不改错直接重来！网友：你有钱你任性！

出品 | 51CTO技术栈（微信号：blog51cto）Claude团队，你是懂“写教程”的！昨天，Claude 官方发布了一篇实打实的案例报告，标题相当直白：《Anthropic 团队是怎么用 Claude Code 的？》标题越朴素，内容越干货。

7/28/2025 1:00:00 AM

伊风

资讯热榜

阿里推出 AI 医学助手 App“氢离子”：收录千万级核心期刊文献，还可查疾病、找药品 MyShell ShellAgent 2.0发布：一句话创建App，零前端的AI革命来袭 AI视频记忆革命来了！Memories.ai获800万美元融资，挑战千万小时视频分析极限因为不用AI写代码，我在终面挂了 | 一个程序员的奇葩面试经历彻底解决出图困难！超高效的Kontext工作流搭建+提示词技巧 Lovart 实战深度测评！仅需4小时帮你完成一整套品牌全案设计！性能比肩 Gemini-2.5 pro、o4-mini：阿里通义千问 Qwen 3 推理模型超级进化，现已开源 Memories AI携全球首个人工智能视觉记忆模型亮相，获800万美元种子轮融资

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文智能体 Anthropic 英伟达代码算法 Stable Diffusion 训练芯片开发者蛋白质腾讯生成式 LLM 苹果神经网络 Claude AI新词 3D 研究生成机器学习 AI for Science Agent xAI 计算人形机器人 Sora AI视频 GPU AI设计百度华为搜索大语言模型工具场景字节跳动具身智能 RAG 大型语言模型预测深度学习伟达视觉 Transformer AGI 视频生成神器推荐亚马逊 Copilot DeepMind 架构模态 LLaMA

理论