理论
刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了
今晚,ChatGPT和Deep Research、Operator「三剑客」首度合体! 奥特曼亲自带队,25分钟高能直播重磅发布ChatGPT agent,开启人类和智能体协作全新时代。 ChatGPT agent的核心,是一个统一的智能体系统。
7/18/2025 9:59:35 AM
AI招聘革命:为何专门招应届生?
想象一下这个场景:你是一个刚刚毕业的大学生,投简历屡屡碰壁,招聘方总是要求"3年以上工作经验"。 突然有一家公司告诉你:"我们专门招应届毕业生,因为你们是AI时代最有价值的员工。 "听起来是不是很不可思议?
7/18/2025 9:50:26 AM
阿丸笔记
Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍
最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。 他们接连发布了好些个开源模型,覆盖不同的领域,包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。 这样似乎也很难让这位欧洲 AI「新贵」感到满意,他们还想在应用层面好好地卷一卷 OpenAI。
7/18/2025 9:39:57 AM
两位AI传奇预测编程的未来,但你想不到
当你刷着技术动态,忽然看到又一条大胆宣称:“AI将在2026年取代所有程序员。 ”这时,OpenAI联合创始人Andrej Karpathy和亚马逊、谷歌资深工程师Steve Yegge给出了他们的真实预测,结果完全颠覆了这种说法。 他们的观点是:大家都想反了。
7/18/2025 9:35:43 AM
前端小智
o1核心贡献者离职后首发声:AI是史上最强杠杆,超越人力、资本和代码
又一位离职OpenAI的核心研究员发声! 刚刚被曝加入Meta的Hyung Won Chung,分享了他对AI未来的深刻思考:人工智能正在成为有史以来最强大的杠杆机制。 Hyung Won Chung和一同离开OpenAI的Jason Wei是长期搭档,他们的合作可以追溯到谷歌大脑时期,两人曾共同作为第一作者发表了关于模型微调的重要论文《Scaling Instruction-Finetuned Language Models》。
7/18/2025 9:33:26 AM
人类击败OpenAI守住编程冠军!10小时激战两次反超,AI最后关头功亏一篑
10小时激战! 人类最后关头实现超越,获得编程总决赛冠军~而原本始终保持领先优势的OpenAI,最终屈居第二。 在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。
7/18/2025 9:28:55 AM
Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验
最近,我看了很多遍 Cursor 首席设计师 Ryo Lu 的访谈。 Ryo 曾是 Notion 的首席设计师,今年跳槽到了 Cursor。 Ryo 不是那种传统意义上只关注界面设计的设计师,尤其是加入 Cursor 之后,他已经开始通过 Vibe Coding 写代码,参与产品原型的开发。
7/18/2025 9:20:31 AM
一文彻底搞懂智能体Agent基于Function Calling的工具调用
前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
7/18/2025 8:46:33 AM
AI大模型应用开发
Codex CLI vs Gemini CLI:谁是更出色的编程智能体?
译者 | 布加迪审校 | 重楼开发者可以利用这些CLI提高代码理解能力、加快调试速度,并自动执行复杂的编程任务。 像Codex CLI这样的工具将基于AI的强大功能(比如代码生成、重构和内联文档)直接引入到命令行中,帮助用户更高效地编写、分析和改进代码。 随着谷歌推出轻量级开源替代品Gemini CLI,市场变得更激动人心,Gemini CLI 正迅速普及。
7/18/2025 8:06:07 AM
布加迪
构建专业级AI应用程序的七大高效工具
译者 | 晶颜审校 | 重楼想要像专业人士一样高效地构建AI应用程序? 这7大核心工具必不可少! 你是否曾好奇开发者如何在短短数日内将人工智能构想转化为功能完备的应用程序?
7/18/2025 7:54:02 AM
晶颜
将自主式AI应用于遗留系统时需应对的四大挑战
自主式AI在提升遗留系统转型的效率和速度方面具有巨大潜力,然而,鉴于遗留平台的复杂性及其在支持业务流程中的关键作用,充分利用智能体来协助遗留系统迁移和现代化可能是一项极具挑战性的任务。 幸运的是,这些问题是可以解决的,然而,这需要特殊的远见和规划,以应对在遗留软件环境中部署智能体时出现的众多复杂问题。 自主式AI在遗留系统中的应用:是什么及为何重要自主式AI是一种利用自主智能体来自动化复杂流程的AI技术,与单纯生成内容的GenAI不同,自主式AI可以在软件系统中执行操作。
7/18/2025 7:10:00 AM
Kausik
一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神
想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱? ”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。 你认为AI裁判会判定哪个答案正确?
7/18/2025 7:07:00 AM
十年六万引!BatchNorm 封神,ICML 授予时间检验奖
一篇发表于2015年的论文,在十年后,于国际机器学习大会(ICML)2025上,被授予了“时间检验奖”(Test of Time Award)。 这篇论文就是深度学习领域无人不晓的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。 它的出现,从根本上改变了研究者们训练深度神经网络的方式,成为AI技术发展进程中的一座关键里程碑。
7/18/2025 7:00:00 AM
具身与离身:智能的两种形态,终将走向何处?
当ChatGPT、通义千问、DeepSeek等大模型凭借海量的知识储备,在问答与创作领域展现出卓越能力时;当春晚舞台灯光亮起,宇树科技的人形机器人“福兮”身着艳色花袄,踏着欢快的鼓点,灵动地挥转着手绢时,我们已然窥见人工智能发展轨迹中呈现的两种鲜明样貌——一种是脱离物理躯体,在数据洪流中构建认知体系;另一种则是依托实体形态,在现实交互中生长实践能力。 在人工智能快速演进的今天,智能的形态呈现出多元分化的态势。 其中,具身智能与离身智能代表了两种不同的研究方向与理念,理解这两种智能形态的区别,不仅有助于我们把握人工智能的发展脉络,更能为探索通用智能的实现路径提供重要启示。
7/18/2025 2:00:00 AM
Yu
黄仁勋对话阿里云王坚爆猛料!未来芯片大如桌面,AI开启全新软件开发范式!中国AI研究全球领先!更断言:AI将定义未来一百年!
出品 | 51CTO技术栈(微信号:blog51cto)今天,在链博会现场。 老黄再次身穿皮衣,与之江实验室主任、阿里云创始人王坚进行了一场炉边谈话。 两个计算界的大佬,围绕着AI和算力展开了一场深刻的思想交锋。
7/17/2025 4:34:51 PM
伊风
加速AI技术落地的有效方法
GenAI的迅速崛起揭示了一个职场现实:一线员工往往比管理人员更快地接受新技术。 AI技术的发展速度之快,令人难以跟上其改变人们工作方式的众多新途径,然而,对于大多数企业而言,技术可能性与实际应用之间的差距正在不断扩大。 2024年麦肯锡全球调查发现,90%的员工在工作中使用GenAI,其中21%的员工是重度用户,然而,尽管员工热情高涨,但大多数企业对AI工具的正式采用却滞后:只有13%的受访员工认为自己的企业是早期采用者。
7/17/2025 2:26:06 PM
Bob
500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式
你可能听说过OpenAI的Sora,用数百万视频、千万美元训练出的AI视频模型。 但你能想象,有团队只用3860段视频、不到500美元成本,也能在关键任务上做到SOTA? 比如这个图生视频:攀岩者在小行星攀岩,人体运动与太空光影完美仿真。
7/17/2025 2:23:03 PM
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频
近年来随着视频生成基础模型的涌现,音频驱动的说话人视频生成领域也取得了显著进展。 但现有方法主要聚焦于单角色场景,现有可生成两个角色对话视频的方法仅能单独地生成两个分离的说话人视频。 针对这一挑战,研究人员提出了首个专注同场景多角色说话视频生成的框架Bind-Your-Avatar该模型基于扩散Transformer(MM-DiT),通过细粒度的嵌入路由机制将「谁在说」与「说什么」绑定在一起,从而实现对音频–角色对应关系的精确控制。
7/17/2025 1:14:05 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型