AI在线 AI在线

理论

广义智能体理论:智能时代通向「万物理论」的新路径?

在现代科学的宏伟蓝图上,「万物理论」(Theory of Everything)代表着一个大一统的梦想:构建一个包罗万象、逻辑自洽的理论体系。 它的雄心在于,用最少的本源法则,去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲,到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋,直至智能的萌发与自我意识的诞生。 然而,通往这一「梦想」理论的道路上,横亘着现代物理学最深刻的两大鸿沟:其一,是在宏观尺度上描述引力的广义相对论,与在微观尺度上主导一切的量子力学之间,存在着根本性的不相容;其二,物理学中的四大基本作用力(引力、电磁力、强核力、弱核力)至今未能被纳入一个统一的理论之中。
7/18/2025 10:19:49 AM

清华陈麟九人天团,攻克几何朗兰兹猜想!30年千页证明,冲刺菲尔兹大奖?

耗时30年,近1000页论文,终于攻克了「几何朗兰兹猜想」! 朗兰兹纲领,又被称为「大一统理论」,困扰了数学家多半个世纪,至今仍是一个未解之谜。 如今,来自普朗克数学研究所Dennis Gaitsgory和耶鲁大学Sam Raskin领衔九人团队,在五篇论文中,完成了证明其中一个分支的壮举。
7/18/2025 10:15:36 AM

全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

全球最强的开源「定理证明器」诞生了! 来自普林斯顿、清华、英伟达、斯坦福等八大顶尖机构联手,祭出了第二版Goedel-Prover-V2模型。 项目地址: 2025顶会录用,曾在miniF2F Pass@32刷新SOTA,位列PutnamBench榜首。
7/18/2025 10:12:00 AM

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

在AI竞速的今天,大语言模型(LLM)早已不满足只在象牙塔里「背书解题」。 当GPT-4o刷题通过物理奥赛、DeepSeek熟练搭建网站之后,LLM必须直面一个更现实的问题:这些号称「专家级」的大模型,能不能真的下工地? 能不能帮工程打工人减负?
7/18/2025 10:08:17 AM

思维链之父跳槽Meta,不只因为1亿美元!离开OpenAI前泄天机

硅谷人才争夺战,火热升级! 过去,是OpenAI从谷歌等公司吸引人才;现在,Meta直接砸钱抢人。 顶尖AI人才的薪酬包可谓天价,1亿美元还是扎克伯格给的起步价!
7/18/2025 10:04:44 AM

刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了

今晚,ChatGPT和Deep Research、Operator「三剑客」首度合体! 奥特曼亲自带队,25分钟高能直播重磅发布ChatGPT agent,开启人类和智能体协作全新时代。 ChatGPT agent的核心,是一个统一的智能体系统。
7/18/2025 9:59:35 AM

AI招聘革命:为何专门招应届生?

想象一下这个场景:你是一个刚刚毕业的大学生,投简历屡屡碰壁,招聘方总是要求"3年以上工作经验"。 突然有一家公司告诉你:"我们专门招应届毕业生,因为你们是AI时代最有价值的员工。 "听起来是不是很不可思议?
7/18/2025 9:50:26 AM
阿丸笔记

Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍

最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。 他们接连发布了好些个开源模型,覆盖不同的领域,包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。 这样似乎也很难让这位欧洲 AI「新贵」感到满意,他们还想在应用层面好好地卷一卷 OpenAI。
7/18/2025 9:39:57 AM

两位AI传奇预测编程的未来,但你想不到

当你刷着技术动态,忽然看到又一条大胆宣称:“AI将在2026年取代所有程序员。 ”这时,OpenAI联合创始人Andrej Karpathy和亚马逊、谷歌资深工程师Steve Yegge给出了他们的真实预测,结果完全颠覆了这种说法。 他们的观点是:大家都想反了。
7/18/2025 9:35:43 AM
前端小智

o1核心贡献者离职后首发声:AI是史上最强杠杆,超越人力、资本和代码

又一位离职OpenAI的核心研究员发声! 刚刚被曝加入Meta的Hyung Won Chung,分享了他对AI未来的深刻思考:人工智能正在成为有史以来最强大的杠杆机制。 Hyung Won Chung和一同离开OpenAI的Jason Wei是长期搭档,他们的合作可以追溯到谷歌大脑时期,两人曾共同作为第一作者发表了关于模型微调的重要论文《Scaling Instruction-Finetuned Language Models》。
7/18/2025 9:33:26 AM

人类击败OpenAI守住编程冠军!10小时激战两次反超,AI最后关头功亏一篑

10小时激战! 人类最后关头实现超越,获得编程总决赛冠军~而原本始终保持领先优势的OpenAI,最终屈居第二。 在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。
7/18/2025 9:28:55 AM

Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验

最近,我看了很多遍 Cursor 首席设计师 Ryo Lu 的访谈。 Ryo 曾是 Notion 的首席设计师,今年跳槽到了 Cursor。 Ryo 不是那种传统意义上只关注界面设计的设计师,尤其是加入 Cursor 之后,他已经开始通过 Vibe Coding 写代码,参与产品原型的开发。
7/18/2025 9:20:31 AM

一文彻底搞懂智能体Agent基于Function Calling的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
7/18/2025 8:46:33 AM
AI大模型应用开发

Codex CLI vs Gemini CLI:谁是更出色的编程智能体?

译者 | 布加迪审校 | 重楼开发者可以利用这些CLI提高代码理解能力、加快调试速度,并自动执行复杂的编程任务。 像Codex CLI这样的工具将基于AI的强大功能(比如代码生成、重构和内联文档)直接引入到命令行中,帮助用户更高效地编写、分析和改进代码。 随着谷歌推出轻量级开源替代品Gemini CLI,市场变得更激动人心,Gemini CLI 正迅速普及。
7/18/2025 8:06:07 AM
布加迪

构建专业级AI应用程序的七大高效工具

译者 | 晶颜审校 | 重楼想要像专业人士一样高效地构建AI应用程序? 这7大核心工具必不可少! 你是否曾好奇开发者如何在短短数日内将人工智能构想转化为功能完备的应用程序?
7/18/2025 7:54:02 AM
晶颜

将自主式AI应用于遗留系统时需应对的四大挑战

自主式AI在提升遗留系统转型的效率和速度方面具有巨大潜力,然而,鉴于遗留平台的复杂性及其在支持业务流程中的关键作用,充分利用智能体来协助遗留系统迁移和现代化可能是一项极具挑战性的任务。 幸运的是,这些问题是可以解决的,然而,这需要特殊的远见和规划,以应对在遗留软件环境中部署智能体时出现的众多复杂问题。 自主式AI在遗留系统中的应用:是什么及为何重要自主式AI是一种利用自主智能体来自动化复杂流程的AI技术,与单纯生成内容的GenAI不同,自主式AI可以在软件系统中执行操作。
7/18/2025 7:10:00 AM
Kausik

一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神

想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱? ”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。 你认为AI裁判会判定哪个答案正确?
7/18/2025 7:07:00 AM

十年六万引!BatchNorm 封神,ICML 授予时间检验奖

一篇发表于2015年的论文,在十年后,于国际机器学习大会(ICML)2025上,被授予了“时间检验奖”(Test of Time Award)。 这篇论文就是深度学习领域无人不晓的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。 它的出现,从根本上改变了研究者们训练深度神经网络的方式,成为AI技术发展进程中的一座关键里程碑。
7/18/2025 7:00:00 AM