AI在线 AI在线

理论

o1核心贡献者离职后首发声:AI是史上最强杠杆,超越人力、资本和代码

又一位离职OpenAI的核心研究员发声! 刚刚被曝加入Meta的Hyung Won Chung,分享了他对AI未来的深刻思考:人工智能正在成为有史以来最强大的杠杆机制。 Hyung Won Chung和一同离开OpenAI的Jason Wei是长期搭档,他们的合作可以追溯到谷歌大脑时期,两人曾共同作为第一作者发表了关于模型微调的重要论文《Scaling Instruction-Finetuned Language Models》。
7/18/2025 9:33:26 AM

人类击败OpenAI守住编程冠军!10小时激战两次反超,AI最后关头功亏一篑

10小时激战! 人类最后关头实现超越,获得编程总决赛冠军~而原本始终保持领先优势的OpenAI,最终屈居第二。 在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。
7/18/2025 9:28:55 AM

Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验

最近,我看了很多遍 Cursor 首席设计师 Ryo Lu 的访谈。 Ryo 曾是 Notion 的首席设计师,今年跳槽到了 Cursor。 Ryo 不是那种传统意义上只关注界面设计的设计师,尤其是加入 Cursor 之后,他已经开始通过 Vibe Coding 写代码,参与产品原型的开发。
7/18/2025 9:20:31 AM

一文彻底搞懂智能体Agent基于Function Calling的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
7/18/2025 8:46:33 AM
AI大模型应用开发

Codex CLI vs Gemini CLI:谁是更出色的编程智能体?

译者 | 布加迪审校 | 重楼开发者可以利用这些CLI提高代码理解能力、加快调试速度,并自动执行复杂的编程任务。 像Codex CLI这样的工具将基于AI的强大功能(比如代码生成、重构和内联文档)直接引入到命令行中,帮助用户更高效地编写、分析和改进代码。 随着谷歌推出轻量级开源替代品Gemini CLI,市场变得更激动人心,Gemini CLI 正迅速普及。
7/18/2025 8:06:07 AM
布加迪

构建专业级AI应用程序的七大高效工具

译者 | 晶颜审校 | 重楼想要像专业人士一样高效地构建AI应用程序? 这7大核心工具必不可少! 你是否曾好奇开发者如何在短短数日内将人工智能构想转化为功能完备的应用程序?
7/18/2025 7:54:02 AM
晶颜

将自主式AI应用于遗留系统时需应对的四大挑战

自主式AI在提升遗留系统转型的效率和速度方面具有巨大潜力,然而,鉴于遗留平台的复杂性及其在支持业务流程中的关键作用,充分利用智能体来协助遗留系统迁移和现代化可能是一项极具挑战性的任务。 幸运的是,这些问题是可以解决的,然而,这需要特殊的远见和规划,以应对在遗留软件环境中部署智能体时出现的众多复杂问题。 自主式AI在遗留系统中的应用:是什么及为何重要自主式AI是一种利用自主智能体来自动化复杂流程的AI技术,与单纯生成内容的GenAI不同,自主式AI可以在软件系统中执行操作。
7/18/2025 7:10:00 AM
Kausik

一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神

想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱? ”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。 你认为AI裁判会判定哪个答案正确?
7/18/2025 7:07:00 AM

十年六万引!BatchNorm 封神,ICML 授予时间检验奖

一篇发表于2015年的论文,在十年后,于国际机器学习大会(ICML)2025上,被授予了“时间检验奖”(Test of Time Award)。 这篇论文就是深度学习领域无人不晓的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。 它的出现,从根本上改变了研究者们训练深度神经网络的方式,成为AI技术发展进程中的一座关键里程碑。
7/18/2025 7:00:00 AM

具身与离身:智能的两种形态,终将走向何处?

当ChatGPT、通义千问、DeepSeek等大模型凭借海量的知识储备,在问答与创作领域展现出卓越能力时;当春晚舞台灯光亮起,宇树科技的人形机器人“福兮”身着艳色花袄,踏着欢快的鼓点,灵动地挥转着手绢时,我们已然窥见人工智能发展轨迹中呈现的两种鲜明样貌——一种是脱离物理躯体,在数据洪流中构建认知体系;另一种则是依托实体形态,在现实交互中生长实践能力。 在人工智能快速演进的今天,智能的形态呈现出多元分化的态势。 其中,具身智能与离身智能代表了两种不同的研究方向与理念,理解这两种智能形态的区别,不仅有助于我们把握人工智能的发展脉络,更能为探索通用智能的实现路径提供重要启示。
7/18/2025 2:00:00 AM
Yu

黄仁勋对话阿里云王坚爆猛料!未来芯片大如桌面,AI开启全新软件开发范式!中国AI研究全球领先!更断言:AI将定义未来一百年!

出品 | 51CTO技术栈(微信号:blog51cto)今天,在链博会现场。 老黄再次身穿皮衣,与之江实验室主任、阿里云创始人王坚进行了一场炉边谈话。 两个计算界的大佬,围绕着AI和算力展开了一场深刻的思想交锋。
7/17/2025 4:34:51 PM
伊风

加速AI技术落地的有效方法

GenAI的迅速崛起揭示了一个职场现实:一线员工往往比管理人员更快地接受新技术。 AI技术的发展速度之快,令人难以跟上其改变人们工作方式的众多新途径,然而,对于大多数企业而言,技术可能性与实际应用之间的差距正在不断扩大。 2024年麦肯锡全球调查发现,90%的员工在工作中使用GenAI,其中21%的员工是重度用户,然而,尽管员工热情高涨,但大多数企业对AI工具的正式采用却滞后:只有13%的受访员工认为自己的企业是早期采用者。
7/17/2025 2:26:06 PM
Bob

500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式

你可能听说过OpenAI的Sora,用数百万视频、千万美元训练出的AI视频模型。 但你能想象,有团队只用3860段视频、不到500美元成本,也能在关键任务上做到SOTA? 比如这个图生视频:攀岩者在小行星攀岩,人体运动与太空光影完美仿真。
7/17/2025 2:23:03 PM

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

近年来随着视频生成基础模型的涌现,音频驱动的说话人视频生成领域也取得了显著进展。 但现有方法主要聚焦于单角色场景,现有可生成两个角色对话视频的方法仅能单独地生成两个分离的说话人视频。 针对这一挑战,研究人员提出了首个专注同场景多角色说话视频生成的框架Bind-Your-Avatar该模型基于扩散Transformer(MM-DiT),通过细粒度的嵌入路由机制将「谁在说」与「说什么」绑定在一起,从而实现对音频–角色对应关系的精确控制。
7/17/2025 1:14:05 PM

ChatGPT还没学会打电话,谷歌搜索AI已经替你电话约服务,还会谈价砍单!

谷歌搜索要出新花样了! 想象一下,你想给你的宠物狗做一次美容,但是家附近好像没有这样的门店。 你打开搜索,输入「附近的宠物美容师」,并且勾选了「让AI查价格」,然后接下来你就什么都不用做了。
7/17/2025 1:08:56 PM

Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了

就在刚刚,KAIST、Mila和谷歌DeepMind团队等放出重磅炸弹——一个名为Mixture-of-Recursions的全新LLM模型架构。 这个崭新的架构,被业内认为有潜力成为Transformer杀手! 它的推理速度提升2倍,训练FLOP减少,KV缓存内存直接减半。
7/17/2025 1:05:35 PM

神作!我用Claude Code一人打造了一款macOS原生App!句句干货,未来的IDE会截然不同:构建上下文+反馈回路

作者 | Indragie Karunaratne编译 | 沈建苗审校 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Claude Code 出来之后,很多人都在说“一个人 AI 就可以独立写应用了”。 但真正有人用它从头到尾打造一个完整的 macOS 原生 App,还详细记录全过程的,几乎没有。 今天要分享的这篇文章,正好填补了这个空白。
7/17/2025 12:36:49 PM
沈建苗 云召

GenAI项目失败的五大常见原因

根据Gartner的研究,如果CIO误解了技术的成熟度,未能关联业务价值,就可能会遇到问题。 企业看到了GenAI的潜力,但也面临着诸多障碍。 从技术缺陷到规划初期的失误,技术领导者们有诸多原因导致项目滞后。
7/17/2025 11:28:42 AM
Lindsey Wilkinson