AI在线 AI在线

理论

CEO卷走24亿,二号员工血亏99%!30亿Windsurf梦碎内幕曝光

Prem Qu Nair可能刚刚度过了一生中最跌宕起伏的时光。 他是原Windsurf的2号员工。 为了继续探索软件工程的未来,他从谷歌DeepMind离职,加入了AI初创Cognition。
7/28/2025 9:09:00 AM

马斯克擎天柱解决不了无「手」难题?跑酷炫技竟不会遛狗,机器人陷泥潭

机器人都能跑酷和跳街舞了,为啥还不能帮人类遛狗? 昨天,英伟达AI大佬Jim Fan突发感慨,他将这一现象称之为迷你版「莫拉维克悖论」(Moravec's paradox):对人类而言难度极高的体操动作,机器人做起来反而比做饭、打扫、组装这类不起眼的任务容易得多。 这不仅让圈外人特别费解,就连Jim Fan父母也问过他无数次这个问题……这个「机器人莫拉维克悖论」还造成一种错觉,即机器人的物理AI能力远比实际上要先进。
7/28/2025 9:08:00 AM

Demis Hassabis最新采访:宇宙的本质是信息,一切都将被AI学习,2030年可实现AGI

谷歌DeepMind掌门人Demis Hassabis再度做客Lex Fridman播客,贡献了一场长达两个多小时、信息量爆炸的深度对话在这场对话中,Hassabis不仅给出了AGI实现的惊人时间表,更首次系统性地阐述了他关于宇宙、现实与AI的大一统哲学思想。 他将AlphaFold、视频模型Veo、电子游戏、P vs NP问题,乃至生命的起源和意识,全部串联到了一个宏大的框架之下全程两个多小时,3万多字,强烈建议去看原视频:搜索Demis Hassabis: Future of AI, Simulating Reality, Physics and Video Games以下是我觉得比较有意的的点,分享给大家宇宙的本质是信息,因此万物皆可被AI高效学习信息第一性: Hassabis明确提出,信息是比能量和物质更根本的宇宙单位。
7/28/2025 9:06:04 AM

百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型

AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
7/28/2025 9:06:00 AM

字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星

如果你是智能体资深玩家,相信一定用过字节跳动的招牌产品扣子(Coze),现在已经开源了,并且支持商业化。 扣子是一个AI Agent开发平台,提供各类最新大模型、工具、多种开发模式和框架,从开发到部署提供可视化一站式开发环境。 多数情况下,甚至不用编写代码就能完成所有开发流程。
7/28/2025 9:04:01 AM

刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25

你是否想过,工厂是如何在很多种不同产品中,精准识别出浅浅的划痕、缺失的元件,甚至是几乎察觉不到的微小缺陷? 这远比「图像识别」要复杂。 在工业质检、安防监控、医疗影像等场景中,无监督异常检测(Unsupervised Anomaly Detection, UAD)日益成为核心技术之一。
7/28/2025 9:03:00 AM

GPT-5实锤,悄悄上线代号「龙虾」!版本号曝光,实测编程惊人能改屎山代码

GPT-5来了? 但是「龙虾」版! GPT-5「Lobster」疑似现身WebDev Arena,引发社区狂热猜测:网友实测比Grok-4好的离谱。
7/28/2025 8:54:00 AM

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM

超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架

专门适用超大模型、带来2.18倍推理加速,最新投机采样训练框架开源! SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。 SGLang,当前趋势下最受青睐的推理框架之一,为DeepSeek提供了专属优化,也深受英伟达、AMD、xAI等厂商喜爱。
7/28/2025 8:42:00 AM

研究人员发现奇怪现象:思考时间越长,大模型越笨

Michael Nuñez@MichaelFNunez译者 | 核子可乐审校 | 重楼Anthropic一项最新研究表明,AI模型耗费更长时间“思考”后表现未必更好,在某些情况下性能甚至会显著下降。 这一发现,挑战了AI行业推理浪潮的理论根基。 这项由Anthropic公司AI安全研究员Aryo Pradipta Gema及其他几位研究人员主导的项目,发现了所谓“测试时计算反比例”迹象,即延长大语言模型的推理长度实际上会降低其在多种任务中的表现。
7/28/2025 7:45:36 AM
核子可乐

数据的五宗罪,道出了数据治理的真正内涵

"老板,我们的数据量已经达到了PB级别! " "那我们的业务决策准确率提升了吗? " "这个......" 这就是当下企业面临的真实困境:数据的"富营养化"。
7/28/2025 6:00:00 AM
大数据AI智能圈

与Claude协作开发Go项目:AI编程实战指南

在软件开发领域,大语言模型正在改变我们编写代码的方式。 作为一名有着丰富实践经验的开发者,我发现与Claude这样的AI工具协作时,关键不在于让AI完全接管开发工作,而在于建立合适的约束和工作流程。 本文将分享我在使用Claude进行Go语言开发时总结的最佳实践,包括项目结构设计、代码质量控制、智能体协作以及如何构建一个可靠的AI结对编程工作流。
7/28/2025 4:22:00 AM
源自开发者

8个月1亿美元ARR神话:Lovable是如何"干翻"OpenAI和Cursor的?

你有没有发现,最近程序员圈子里又开始"内卷"了? 不过这次不是卷技术,而是在卷一个让人震惊的数字:8个月,1亿美元ARR。 说这个数字的时候,我自己都觉得有点不太现实。
7/28/2025 4:10:00 AM
阿丸笔记

协同 RAG-Reasoning:让大模型边想边查的“深度研究”范式

大家好我是肆〇柒。 在AI领域,大型语言模型(LLM)已经展现出卓越的语言生成能力,并在诸多任务中取得了显著成果。 然而,LLM 存在两大局限:一是知识幻觉,因其知识存储静态且参数化,易生成错误内容;二是复杂推理能力不足,难以应对现实世界的复杂问题。
7/28/2025 3:00:00 AM
肆零柒

Dify新版1.7发布,这两个重要更新你必须知道!

Dify 又发布新版了,这次也是直接从 V1.6.0 升级到 V1.7.0 了,那这次升级的主要内容是啥呢? 接下来我们一起来看。 这次升级除了修复了一些列 BUG 和部分功能优化之外,最大的升级是提升了 Dify 的安全性和版本兼容性。
7/28/2025 2:00:00 AM
磊哥

FastAPI开发AI应用:模型新增图片理解

本文将深入讲解如何在 FastAPI AI 聊天应用中实现图片理解功能,让 AI 能够理解和分析用户上传的图片内容。 通过本教程,你将学会如何构建完整的多模态交互系统,包括图片上传、预处理、多模态消息格式化以及流式响应处理等核心技术。 本文概述想象一下,当你向 AI 发送一张图片时,AI 不仅能看懂图片内容,还能基于图片进行深度分析和对话——就像一个拥有视觉能力的智能助手。
7/28/2025 1:55:00 AM
wayn

OpenAI 多智能体研究框架:构建高效协作的AI代理系统

在人工智能快速发展的今天,单一AI模型已难以满足复杂任务的需求,多智能体系统正成为解决复杂问题的重要方向。 OpenAI推出的多智能体研究框架(Multi-AI Agent Research Framework)通过协调多个各司其职的AI代理,实现了远超单一模型的研究能力和应用价值。 本文将深入解析这一框架的核心原理、架构设计、实际应用及未来潜力,为开发者和企业提供全面的参考指南。
7/28/2025 1:33:00 AM
大模型之路

Claude Code官方揭秘!内部使用指南曝光:员工都是这样用CC的!把 AI 当老虎机,不改错直接重来!网友:你有钱你任性!

出品 | 51CTO技术栈(微信号:blog51cto)Claude团队,你是懂“写教程”的! 昨天,Claude 官方发布了一篇实打实的案例报告,标题相当直白:《Anthropic 团队是怎么用 Claude Code 的? 》标题越朴素,内容越干货。
7/28/2025 1:00:00 AM
伊风