AI在线 AI在线

理论

倒反天罡:ChatGPT教人说话?36万视频+77万播客已证实!

AI驯服人类第一步:教人重新说英语? 最近,越来越多的媒体发现:说话的方式,越来越像ChatGPT了! 这不是模仿,而是「入侵」。
7/16/2025 9:52:07 AM

错题本 × LLM:人机协作如何炼成“最严代码考官”

大家好,我是肆〇柒。 在 vibe coding 活跃的当下,有时,我们不得不思考一个问题:在软件开发流程中,我们能否完全依赖、使用 LLM 生成的代码? 大型语言模型(LLM)在代码生成基准测试中的卓越表现备受瞩目,从 HumanEval 到 LiveCodeBench,众多基准测试平台见证了 LLM 在代码生成任务上的飞速进步。
7/16/2025 9:51:43 AM
肆零柒

秘塔AI整大活,国内首个免费「深度研究」来了!搞研究证据链惊人

就在刚刚,国内第一家免费公开可用的「深度研究」产品来了! 这个产品,可以直接对标海外的Deep Research能力,性能十分强大。 在BrowseComp等评测集上,它们超越了上周刚开源且达到最好结果的WebSailor模型,准确率有明显提升。
7/16/2025 9:48:23 AM

五个月估值120亿!OpenAI前CTO自曝首个多模态AI,竟要免费开源

OpenAI前CTO初创,又拿到新融资了! 一早,Mira Murati官宣由a16z领投20亿美元融资,至此,Thinking Machines Lab估值120亿美元。 同时,英伟达、AMD、Accel、ServiceNow等多家明星风投也参与了本次融资。
7/16/2025 9:44:29 AM

月之暗面卷土重来?Kimi K2杀回来了

为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM
阿丸笔记

一篇被证明“理论有误”的论文,拿下了ICML2025时间检验奖

深度学习界的传奇论文,终于等来了它的“封神”时刻! 刚刚,ICML 2025会议上,2015年发表的Batch Normalization(批次归一化,简称BatchNorm)论文荣获时间检验奖。 这篇如今引用量超过6万次的开创性工作,是深度学习发展史上一个里程碑式的突破,极大地推动了深层神经网络的训练和应用。
7/16/2025 9:15:17 AM

AI分析的崛起及其在各行业中的重大影响

译者 | 刘涛审校 | 重楼如今,企业正面临着数据的海量冲击。 从在线购物行为到医院病历记录,每一项业务活动都会源源不断地产生大量信息。 然而,单纯的数据本身并无实际价值。
7/16/2025 8:45:06 AM
刘涛

帮助职场人士提高办公效率的十款免费人工智能工具

译者 | 李睿审校 | 重楼提高办公效率并不能只依赖埋头苦干。 在通常情况下,“巧干胜于蛮干”。 因此,为了持续领先,关键在于融合个人才智、专注投入,以及高效应对日常挑战的方案。
7/16/2025 8:37:02 AM
李睿

一文带你彻底理解 AIGC、Agent、MCP 的概念和关系

作者 | willzhen近两年 AI 技术发展迅猛,日新月异。 大语言模型 (LLM)、AIGC、多模态、RAG、Agent、MCP 等各种相关概念层出不穷,若不深入了解,极易混淆。 本文旨在简要介绍这些 AI 技术的核心概念、基本原理及其相互关系,主要帮助非 AI 行业的开发者建立基础认知。
7/16/2025 8:00:00 AM
腾讯技术工程

RAG系列:MinerU、Docling还是Unstructured?用OmniDocBench评测开源文档解析工具

引言从写 RAG 开发入门这一系列文章开始,特别是文档解析这个环节,有很多读者询问某个文档解析工具的能力怎么样,和其它工具对比如何,这表明开源社区虽然涌现出了很多的文档解析工具,但是它们在实际场景的表现到底如何,这在很多人中是没有太明确答案的。 因而,面对众多工具的选择,我们期望能有一个统一的基准来评估其实际效果,而且对于大部分人来说是需要开箱即用的。 本文我将介绍一款由上海人工智能实验室开源的多源文档解析评测框架  - OmniDocBench[1],凭借其多样性、全面性和高质量标注数据以及配套的评测代码,是一个不错的衡量文档解析工具性能的选择。
7/16/2025 1:00:00 AM

Gartner:数据可用性和质量是实施AI面临的首要挑战

7月15日消息,市场研究机构Gartner一项新调查显示,数据的可用性与质量始终是AI实施过程中面临的关键难题。 该调查于2024年第四季度进行,目的是了解企业如何使用AI和生成式人工智能(GenAI)。 来自美国、英国、法国、德国、印度和日本的432名受访者参与了此次调查。
7/16/2025 12:10:00 AM
Yu

马斯克又大嘴了!Grok 4 真实水平曝光,多项实测翻车,连前端都搞不定,还谈什么AGI?网友怒评:上当了,花大价钱买了个笑话!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,Grok 4 的发布给这个盛夏带来了一片狂热。 但太阳底下无新事,宣传往往大于实际。 在发布直播中,马斯克宣称这是“目前地表最强的 AI”,不仅全面超越了所有竞争对手,还在多个测试中打败了人类,比如所谓的 “人类终极考试”(Humanity’s Last Exam)、ARC-AGI 测试、Vending Bench 等。
7/15/2025 6:08:04 PM
云昭

小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”

快把硅谷大厂挖成筛子的小扎,终于站出来正面回应了:大把研究人员因为天价薪资被打动来了Meta? 这个说法基本不对哦,lol~他们加入Meta,并非贪图金钱,而是为了造神——build god。 他嘴皮子一秃噜滑,全都招了,Meta超级智能实验室为顶尖AI人才提供超乎想象的强大支持:直接向小扎汇报,并且最强GPU无上限随!
7/15/2025 4:28:35 PM

放世界任务成功率82%!美的攻克机器人泛化控制难题

还在担心机器人只能机械执行、不会灵活应变? 美的AI研究院和华东师范大学联合提出ChatVLA-2——一个具有开放世界具身推理能力的视觉-语言-动作模型(VLA)模型。 它引入动态混合专家架构,并结合双阶段训练流程,不仅最大程度保留了视觉-语言模型(VLM)的多模态认知和推理能力,还能将推理结果真正转化为可执行的动作。
7/15/2025 4:28:05 PM

Switch的救世主是老黄!?

Switch2发售后,内置图形API——NVN2首次公开亮相。 相较前代Switch发热、卡顿、续航短、画质缩水等问题,搭载英伟达NVN2的Switch2显然从容得多,面对各类3A大作也毫不吃力。 《赛博朋克2077》的联合开发者Eoin O'Grady表示,只要是Xbox上能跑满60帧的游戏,移植到Switch2几乎都不在话下。
7/15/2025 4:26:44 PM

卡帕西预言成真!华人团队开源全AI操作系统:神经网络模拟Windows,预测下一帧屏幕图像

疯狂,太疯狂了~大神卡帕西预测的「下一代GUI系统」这就水灵灵地实现了? 玩法相当easy,当你移动鼠标、点击图标或敲键盘时,这个完全由神经网络驱动的操作系统就和咱们平时的电脑一样,能在屏幕上实时显示对应的图形界面。 就是说,AI现在能完全模拟Windows,直接预测下一帧屏幕图像。
7/15/2025 4:26:16 PM

零售业加速布局GenAI投资

超过一半(56%)的零售企业今年相比去年增加了对GenAI的投资,这是凯捷另一份报告所指出的。 零售业是采用AI智能体或多智能体系统最先进的五大行业之一,有18%的零售企业已经实施了AI智能体或多智能体系统,该报告显示。 在所有行业中,大约40%追踪投资回报率的企业预计在一到三年内从AI中获得正回报。
7/15/2025 2:33:14 PM
Xanayra

Claude背后大厂终于出手!Kiro让氛围编码走出“造玩具”,开发流程结构化了!网友:氛围编程的游戏规则又要被改写!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)作为 Claude 背后的金主,亚马逊终于在 AI 编程领域终于出手了! 昨日,他们推出了自家的 Agentic IDE —— Kiro,一款由 Claude Sonnet 4 驱动的开发工具,目标明确:解决 vibe coding 应用难以上线的“最后一公里”问题。 乍看之下,Kiro 有些像 Cursor,但本质上,它走的是另一条路线。
7/15/2025 1:55:49 PM