AI在线 AI在线

资讯列表

你敢信?GPT-5的电脑操作水平只比人类低2%了

Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任务。 其中「计算机使用智能体」(computer-use agent,CUA)是一种能够直接在电脑环境中代替人类执行操作的智能体。 它和传统的对话式 AI 不同,不只是回答问题,而是模拟人类使用鼠标、键盘和操作软件来完成任务。
10/4/2025 2:45:00 PM
机器之心

吴恩达执教的深度学习课程CS230秋季上新,新增GPT-5专题

「人工智能是新的电力。 」——吴恩达吴恩达 (Andrew Ng) 执教的斯坦福 CS230 深度学习旗舰课程已更新至 2025 秋季版,首讲视频现已公开! 课程采用翻转课堂模式,学生需提前观看 Coursera 上的 deeplearning.ai 专项课程视频(包括神经网络基础、超参数调优、结构化机器学习项目等模块),然后参加线下课程。
10/4/2025 2:34:00 PM
机器之心

Insta360最新全景综述:全景视觉的挑战、方法与未来

本文作者团队来自 Insta360 影石研究院及其合作高校。 目前,Insta360 正在面向世界模型、多模态大模型、生成式模型等前沿方向招聘实习生与全职算法工程师,欢迎有志于前沿 AI 研究与落地的同学加入! 简历投递邮箱:[email protected]在虚拟现实、自动驾驶、具身智能等新兴应用中,全景视觉正逐渐成为不可或缺的研究方向。
10/4/2025 2:29:00 PM
机器之心

如何做好AI产品的用户体验?来看百度的实战案例复盘!

前言. 行业内持续探索 AI 内容生成与创作工具,由 AI 驱动的创作方式正逐步成为主流。 不仅为用户提供了个性化创作的有力支持,也能够激发灵感、降低门槛,使即便没有专业背景的用户也能轻松表达自己的想法。
10/4/2025 12:22:57 AM
百度MEUX 团队

1.5B推理模型新SOTA,RL训练新解法打破「简单题过拟合、难题学不动」的魔咒

QuestA(问题增强)引入了一种方法,用于提升强化学习中的推理能力。 通过在训练过程中注入部分解题提示,QuestA 实现两项重大成果:Pass@1 的 SOTA 性能:在 1.5B 模型上实现了最先进的结果,甚至在关键基准测试中超越了早期的 32B 模型。 提升 Pass@k:在提高 Pass@1 的同时,QuestA 不会降低 Pass@k 性能 —— 事实上,它通过让模型在多次尝试中进行更有效的推理,从而提升了模型能力。
10/3/2025 8:29:00 PM
机器之心

大规模分子电子密度数据集EDBench发布,AI驱动分子建模迈入「电子级」时代

作者 | 论文团队编辑 | ScienceAI在药物设计、新材料开发等领域,精确模拟分子行为至关重要。 传统的机器学习力场将分子视为由原子核和化学键构成的“骨架”,却忽略了真正决定分子性质的“灵魂”——电子。 电子密度,这一量子化学中的核心物理量,描述了电子在空间中的分布概率,从根本上决定了分子的能量、反应活性等所有性质。
10/3/2025 3:14:00 PM
ScienceAI

Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职

Meta 内部混战又有新剧情了,这次主角是 FAIR 实验室。 据 The Information 报道,两位知情人士透露,Meta 最近对 FAIR 实验室施加了一项新政策:所有研究成果在公开发表前,必须通过额外的内部审查。 这项政策在 FAIR 内部引起了轩然大波。
10/3/2025 3:01:00 PM
机器之心

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

推理训练促使大语言模型(LLM)生成长思维链(long CoT),这在某些方面有助于它们探索解决策略并进行自我检查。 虽然这种方式提高了准确性,但也增加了上下文长度、token / 计算成本和答案延迟。 因此,问题来了:当前的模型能否利用其元认知能力,在这一帕累托前沿上提供其他组合策略,例如在降低上下文长度和 / 或延迟的情况下提高准确性?
10/3/2025 2:56:00 PM
机器之心

NIPS 2025 Spotlight | 港大提出TreeSynth方法,一句话生成百万规模数据集

本文第一作者王升,陈鹏安与周靖淇均来自香港大学。 通讯作者为香港大学计算机科学系吴川教授与孔令鹏教授。 其他作者还包括来自香港大学的李沁桐、董经纬、高佳慧,以及香港中文大学的薛博阳、江继越。
10/3/2025 2:49:00 PM
机器之心

刚刚,Anthropic新CTO上任,与Meta、OpenAI的AI基础设施之争一触即发

就在刚刚,Anthropic 迎来了新的首席技术官(CTO)—— 前 Stripe 首席技术官 Rahul Patil。 据报道,Rahul Patil 于本周早些时候加入公司,接替了联合创始人 Sam McCandlish,后者将转任首席架构师一职。 Rahul Patil 在社媒上表达了自己加入 Anthropic 的激动之情与未来期许。
10/3/2025 2:39:00 PM
机器之心

全球价值最高创企诞生,OpenAI估值创纪录来到5000亿美元

几天前,OpenAI 重磅发布了全新一代的视频大模型 Sora 2,不仅在物理准确性、真实感和可控性方面都优于以往的系统,还具备同步的对话和音效能力。 Altman 称之为「ChatGPT for creativity」时刻。 就在昨天,OpenAI 的「身价」又涨了。
10/3/2025 2:36:00 PM
机器之心

Sora 2数手指翻车,奥特曼成第一批「受害者」,被AI玩成最惨打工人

奥特曼大型社死现场。 Sora 2,强大如斯,却也数不明白手指。 X 网友 @fofrAI 整了个提示词测试 Sora 2:a man counts out loud from 1 to 10, using his fingers and holding them up as he goes.(一名男子一边举起手指,一边大声数着从 1 到 10。
10/2/2025 3:29:00 PM
机器之心

开发者狂喜:Thinking Machines发布首款产品Tinker,后训练麻烦全给包了

对于大模型开发者 / 研究者来说,今天是重要的一天。 因为刚刚,OpenAI 前 CTO Mira Murati 创办的 Thinking Machines 推出了首款产品 ——Tinker。 简单来说,Tinker 是一个 API,用于帮开发者 / 研究人员微调语言模型。
10/2/2025 3:13:00 PM
机器之心

首个多模态 AI 可用的临床试验预测数据集平台,香港科技大学(广州)陈晋泰、南京大学符天凡等团队发布TrialBench

作者 | 论文团队编辑 | ScienceAI「临床试验是新药从实验室走向患者的关键桥梁,但其失败率高、周期长、成本巨大。 我们希望借助人工智能重塑这条桥梁。 」在制药与医学研究的世界里,临床试验是一项极其核心但也极其困难的工作:跨越多个阶段,耗时往往超过十年,平均成本可能高达数十亿美元,且成功率通常不足 15%。
10/2/2025 3:12:00 PM
ScienceAI

小红书发布FireRedChat:首个可私有化部署的全双工大模型语音交互系统

小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat,自研流式 pVAD 与 EoT 让语音交互更加自然,首发级联与半级联两套实现,端到端时延逼近工业级应用。 彻底开源、可私域落地,打造真正 “知冷暖、能共情、懂表达” 的语音 AI。 小红书智创音频团队发布 FireRedChat—— 业内首个支持私有化部署的全双工大模型语音交互系统,直击延迟高、噪声敏感、可控性差、依赖外部 API 等痛点。
10/2/2025 3:07:00 PM
机器之心

梦里啥都有?谷歌新世界模型纯靠「想象」训练,学会了在《我的世界》里挖钻石

只让机器人或虚拟智能体「想象」,不让它们和物理世界交互,它们也能学到和世界交互的技能? 谷歌的世界模型 Dreamer 4 为这一想法提供了新的支撑。 为了在具身环境中解决复杂任务,智能体需要深入理解世界并选择成功的行动。
10/2/2025 3:00:00 PM
机器之心

Sora 2干翻Veo 3?超全对比实测:会中文脱口秀,但体操翻车,附有效邀请码

这次,OpenAI 又搞了波大的,祭出 Sora2,可以直接生成最长 20 秒的 1080p 视频。 比如,有网友拿奥特曼生成了 GPU 外卖小哥,甚至还有去超市偷显卡的剧情。 相比于旧版本,Sora 2 在物理准确性、真实感和可控性方面都更胜一筹,而且它还和谷歌 Veo3 一样具备音画同步能力。
10/1/2025 8:17:00 PM
机器之心

Sora 2深夜来袭,OpenAI直接推出App,视频ChatGPT时刻到了

没想到吧,在别家节前卷大模型时,OpenAI 悄悄发布了 Sora2。 而且,这次是直接产品化,推出了 App,甚至还有配套的视频推送算法,声称可以防成瘾。 这是要做自己的 TikTok?
10/1/2025 11:01:00 AM
机器之心