理论

Le Chat全方面对标ChatGPT，欧洲AI新贵穷追不舍

Le Chat全方面对标ChatGPT，欧洲AI新贵穷追不舍

最近几个月，由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。他们接连发布了好些个开源模型，覆盖不同的领域，包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。这样似乎也很难让这位欧洲 AI「新贵」感到满意，他们还想在应用层面好好地卷一卷 OpenAI。

7/18/2025 9:39:57 AM

两位AI传奇预测编程的未来，但你想不到

两位AI传奇预测编程的未来，但你想不到

当你刷着技术动态，忽然看到又一条大胆宣称：“AI将在2026年取代所有程序员。 ”这时，OpenAI联合创始人Andrej Karpathy和亚马逊、谷歌资深工程师Steve Yegge给出了他们的真实预测，结果完全颠覆了这种说法。他们的观点是：大家都想反了。

7/18/2025 9:35:43 AM 前端小智

o1核心贡献者离职后首发声：AI是史上最强杠杆，超越人力、资本和代码

o1核心贡献者离职后首发声：AI是史上最强杠杆，超越人力、资本和代码

又一位离职OpenAI的核心研究员发声！刚刚被曝加入Meta的Hyung Won Chung，分享了他对AI未来的深刻思考：人工智能正在成为有史以来最强大的杠杆机制。 Hyung Won Chung和一同离开OpenAI的Jason Wei是长期搭档，他们的合作可以追溯到谷歌大脑时期，两人曾共同作为第一作者发表了关于模型微调的重要论文《Scaling Instruction-Finetuned Language Models》。

7/18/2025 9:33:26 AM

人类击败OpenAI守住编程冠军！10小时激战两次反超，AI最后关头功亏一篑

人类击败OpenAI守住编程冠军！10小时激战两次反超，AI最后关头功亏一篑

10小时激战！人类最后关头实现超越，获得编程总决赛冠军~而原本始终保持领先优势的OpenAI，最终屈居第二。在刚刚落幕的AtCoder世界巡回总决赛上，12名决赛选手两天时间里展开角逐。

7/18/2025 9:28:55 AM

Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验

Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验

最近，我看了很多遍 Cursor 首席设计师 Ryo Lu 的访谈。 Ryo 曾是 Notion 的首席设计师，今年跳槽到了 Cursor。 Ryo 不是那种传统意义上只关注界面设计的设计师，尤其是加入 Cursor 之后，他已经开始通过 Vibe Coding 写代码，参与产品原型的开发。

7/18/2025 9:20:31 AM

一文彻底搞懂智能体Agent基于Function Calling的工具调用

一文彻底搞懂智能体Agent基于Function Calling的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。它结合了人工智能技术（如机器学习、自然语言处理、计算机视觉等），能够独立或协作完成目标。基于大语言模型（LLM）的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。

7/18/2025 8:46:33 AM AI大模型应用开发

Codex CLI vs Gemini CLI：谁是更出色的编程智能体？

Codex CLI vs Gemini CLI：谁是更出色的编程智能体？

译者 | 布加迪审校 | 重楼开发者可以利用这些CLI提高代码理解能力、加快调试速度，并自动执行复杂的编程任务。像Codex CLI这样的工具将基于AI的强大功能（比如代码生成、重构和内联文档）直接引入到命令行中，帮助用户更高效地编写、分析和改进代码。随着谷歌推出轻量级开源替代品Gemini CLI，市场变得更激动人心，Gemini CLI 正迅速普及。

7/18/2025 8:06:07 AM 布加迪

构建专业级AI应用程序的七大高效工具

构建专业级AI应用程序的七大高效工具

译者 | 晶颜审校 | 重楼想要像专业人士一样高效地构建AI应用程序？这7大核心工具必不可少！你是否曾好奇开发者如何在短短数日内将人工智能构想转化为功能完备的应用程序？

7/18/2025 7:54:02 AM 晶颜

将自主式AI应用于遗留系统时需应对的四大挑战

将自主式AI应用于遗留系统时需应对的四大挑战

自主式AI在提升遗留系统转型的效率和速度方面具有巨大潜力，然而，鉴于遗留平台的复杂性及其在支持业务流程中的关键作用，充分利用智能体来协助遗留系统迁移和现代化可能是一项极具挑战性的任务。幸运的是，这些问题是可以解决的，然而，这需要特殊的远见和规划，以应对在遗留软件环境中部署智能体时出现的众多复杂问题。自主式AI在遗留系统中的应用：是什么及为何重要自主式AI是一种利用自主智能体来自动化复杂流程的AI技术，与单纯生成内容的GenAI不同，自主式AI可以在软件系统中执行操作。

7/18/2025 7:10:00 AM Kausik

一行“解”字赢了全场？腾讯 x 普林斯顿发现AI裁判集体走神

一行“解”字赢了全场？腾讯 x 普林斯顿发现AI裁判集体走神

想象一下，你向一个AI提问一道数学题：“阿里有21美元，莱拉把她100美元的一半给了他，现在阿里有多少钱？ ”接着，你让一个“AI裁判”去评估两个答案，一个答案是一串错误的计算公式，另一个答案只有一个单词：“Solution”（解）。你认为AI裁判会判定哪个答案正确？

7/18/2025 7:07:00 AM

十年六万引！BatchNorm 封神，ICML 授予时间检验奖

十年六万引！BatchNorm 封神，ICML 授予时间检验奖

一篇发表于2015年的论文，在十年后，于国际机器学习大会（ICML）2025上，被授予了“时间检验奖”（Test of Time Award）。这篇论文就是深度学习领域无人不晓的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。它的出现，从根本上改变了研究者们训练深度神经网络的方式，成为AI技术发展进程中的一座关键里程碑。

7/18/2025 7:00:00 AM

具身与离身：智能的两种形态，终将走向何处？

具身与离身：智能的两种形态，终将走向何处？

当ChatGPT、通义千问、DeepSeek等大模型凭借海量的知识储备，在问答与创作领域展现出卓越能力时;当春晚舞台灯光亮起，宇树科技的人形机器人“福兮”身着艳色花袄，踏着欢快的鼓点，灵动地挥转着手绢时，我们已然窥见人工智能发展轨迹中呈现的两种鲜明样貌——一种是脱离物理躯体，在数据洪流中构建认知体系;另一种则是依托实体形态，在现实交互中生长实践能力。在人工智能快速演进的今天，智能的形态呈现出多元分化的态势。其中，具身智能与离身智能代表了两种不同的研究方向与理念，理解这两种智能形态的区别，不仅有助于我们把握人工智能的发展脉络，更能为探索通用智能的实现路径提供重要启示。

7/18/2025 2:00:00 AM Yu

黄仁勋对话阿里云王坚爆猛料！未来芯片大如桌面，AI开启全新软件开发范式！中国AI研究全球领先！更断言：AI将定义未来一百年！

黄仁勋对话阿里云王坚爆猛料！未来芯片大如桌面，AI开启全新软件开发范式！中国AI研究全球领先！更断言：AI将定义未来一百年！

出品 | 51CTO技术栈（微信号：blog51cto）今天，在链博会现场。老黄再次身穿皮衣，与之江实验室主任、阿里云创始人王坚进行了一场炉边谈话。两个计算界的大佬，围绕着AI和算力展开了一场深刻的思想交锋。

7/17/2025 4:34:51 PM 伊风

加速AI技术落地的有效方法

加速AI技术落地的有效方法

GenAI的迅速崛起揭示了一个职场现实：一线员工往往比管理人员更快地接受新技术。 AI技术的发展速度之快，令人难以跟上其改变人们工作方式的众多新途径，然而，对于大多数企业而言，技术可能性与实际应用之间的差距正在不断扩大。 2024年麦肯锡全球调查发现，90%的员工在工作中使用GenAI，其中21%的员工是重度用户，然而，尽管员工热情高涨，但大多数企业对AI工具的正式采用却滞后：只有13%的受访员工认为自己的企业是早期采用者。

7/17/2025 2:26:06 PM Bob

500美元刷新SOTA！训练成本砍到1/200，华人团队重构视频生成范式

500美元刷新SOTA！训练成本砍到1/200，华人团队重构视频生成范式

你可能听说过OpenAI的Sora，用数百万视频、千万美元训练出的AI视频模型。但你能想象，有团队只用3860段视频、不到500美元成本，也能在关键任务上做到SOTA？比如这个图生视频：攀岩者在小行星攀岩，人体运动与太空光影完美仿真。

7/17/2025 2:23:03 PM

免剪辑直出！AI生成多角色同框对话视频，动态路由精准绑定音频

免剪辑直出！AI生成多角色同框对话视频，动态路由精准绑定音频

近年来随着视频生成基础模型的涌现，音频驱动的说话人视频生成领域也取得了显著进展。但现有方法主要聚焦于单角色场景，现有可生成两个角色对话视频的方法仅能单独地生成两个分离的说话人视频。针对这一挑战，研究人员提出了首个专注同场景多角色说话视频生成的框架Bind-Your-Avatar该模型基于扩散Transformer（MM-DiT），通过细粒度的嵌入路由机制将「谁在说」与「说什么」绑定在一起，从而实现对音频–角色对应关系的精确控制。

7/17/2025 1:14:05 PM

ChatGPT还没学会打电话，谷歌搜索AI已经替你电话约服务，还会谈价砍单！

ChatGPT还没学会打电话，谷歌搜索AI已经替你电话约服务，还会谈价砍单！

谷歌搜索要出新花样了！想象一下，你想给你的宠物狗做一次美容，但是家附近好像没有这样的门店。你打开搜索，输入「附近的宠物美容师」，并且勾选了「让AI查价格」，然后接下来你就什么都不用做了。

7/17/2025 1:08:56 PM

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

就在刚刚，KAIST、Mila和谷歌DeepMind团队等放出重磅炸弹——一个名为Mixture-of-Recursions的全新LLM模型架构。这个崭新的架构，被业内认为有潜力成为Transformer杀手！它的推理速度提升2倍，训练FLOP减少，KV缓存内存直接减半。

7/17/2025 1:05:35 PM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉