AI在线 AI在线

资讯列表

怪异却奏效的实验设计,AI:我寻思这样可行

编辑丨%在物理学史上,实验设计往往需要研究者穷尽想象、反复试错:从光学元件的排布到粒子探测器的细微调校,无不凝聚着科学家的智慧与汗水。 但如今,人工智能(AI)正作为新的「合作者」,通过奇妙的「俺寻思」之力(whatever but works),以超越常规思维的方式,推动实验物理进入「怪异却奏效」的全新时代。 LIGO灵敏度优化加州理工学院(California Institute of Technology),主持 LIGO(激光干涉引力波天文台)优化的物理学家 Rana Adhikari 和同事,向 AI 求助以期突破 2015 年首波引力波探测后的瓶颈。
7/22/2025 4:04:00 PM
ScienceAI

Kimi K2官方技术报告出炉:采用384个专家,训练不靠刷题靠“用自己的话再讲一遍”

Kimi K2称霸全球开源模型的秘籍公开了! 没错,就是整整32页的Kimi K2官方技术报告。 业内人士第一波repo已火速出炉:这篇论文中有很多令人印象深刻的内容。
7/22/2025 3:14:28 PM
一水

李开复入场Agent!直接对话CEO走独特“一把手工程打法”

衡宇 奕然 发自 凹非寺. 量子位 | 公众号 QbitAI火到不能再火的Agent,零一万物也下场了。 就在今早,零一万物创始人兼CEO李开复博士宣布升级发布万智企业大模型一站式平台(下文简称万智平台)2.0版本,并推出零一万物企业级Agent智能体,昵称“万仔”。
7/22/2025 2:53:51 PM
衡宇

牛津团队推出百万级数据抗体-抗原模型,超大模型的上限到底在哪里?

编辑丨%抗体药物是抗癌、抗病毒的「利器」,但其疗效好坏,核心看抗体与抗原的结合强度(ΔΔG)。 长期以来,这个关键指标的预测难住了无数科研人员 —— 要么靠昂贵的实验测量,要么依赖 AI 模型却因数据不足屡屡翻车。 近日,牛津大学的研究团队开发了 Graphinity,一种直接从抗体-抗原结构构建的等变图神经网络架构,虽然在 ΔΔG 预测上的测试皮尔逊相关系数(Pearson Correlation Coefficient)——r可达 0.87,但也同样陷入了过拟合的困境。
7/22/2025 2:04:00 PM
ScienceAI

关于机器人数据,强化学习大佬Sergey Levine刚刚写了篇好文章

我们知道,训练大模型本就极具挑战,而随着模型规模的扩大与应用领域的拓展,难度也在不断增加,所需的数据更是海量。 大型语言模型(LLM)主要依赖大量文本数据,视觉语言模型(VLM)则需要同时包含文本与图像的数据,而在机器人领域,视觉 - 语言 - 行动模型(VLA)则要求大量真实世界中机器人执行任务的数据。 目前而言,Agent 是我们走向通用人工智能(AGI)的重要过渡。
7/22/2025 1:26:00 PM
机器之心

DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场

刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。 更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。 谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这是官方结果!
7/22/2025 1:22:00 PM
机器之心

行业新突破:行为基础模型可实现高效的人形机器人全身控制

人形机器人作为用于复杂运动控制、人机交互和通用物理智能的多功能平台,正受到前所未有的关注。 然而,由于其复杂的动力学、欠驱动和多样化的任务需求,实现高效的人形机器人全身控制 (Whole-Body Control,WBC) 仍然是一项根本性的挑战。 虽然基于强化学习等方法的控制器在特定任务中展现出优越的性能,但它们往往只具有有限的泛化性能,在面向新场景时需要进行复杂且成本高昂的再训练。
7/22/2025 1:18:00 PM
机器之心

聊聊AI Coding的现状与未来|沙龙招募

Vibe Coding的概念让更多人能够以更低的门槛,将想法变为现实。 但我们更想关注——AI Coding到底多大程度提升了生产力? 从插件到AI原生IDE,从补全代码到自主编程,AI Coding已经以不同方式与形态嵌入到了工作流中。
7/22/2025 1:07:05 PM
林樾

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。
7/22/2025 1:05:00 PM
闻乐

Cursor 新定价方案引发用户强烈不满

最近,Cursor 的开发商 nysphere 推出了每月 200 美元的高端订阅计划,但这不仅仅是新增了昂贵套餐,还在悄悄削弱了现有的 Pro 计划。 曾经承诺的 500 次请求保障,如今被标榜为“无限请求”却伴随着随意的限流规则。 据 Cursor 用户反馈,新推出的 “Ultra” 计划提供了比 20 美元的 Pro 方案高 20 倍的 AI 模型使用额度,但 Pro 用户的体验却大打折扣,甚至被描述为“完全无法生成内容”。
7/22/2025 12:58:26 PM
前端小智

MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步

MiniMax面向全球最新举办M1技术探讨会。 作为中国团队,现场,来自十几个国家地区的观众从世界各地加入,与M1团队和全球学者进行了技术交流。 M1团队与来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾在模型架构创新、RL训练、长上下文应用等领域探讨了当前的前沿话题。
7/22/2025 12:44:18 PM
西风

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景? 美国东北大学和波士顿动力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创“坐标系转移接口”,让机器人学习更高效、泛化更灵活。 总的来说,HEP框架具有以下亮点:极简高效的分层结构高层负责全局目标设定,低层自主在本地坐标下优化动作,显著提升操作的灵活性与效率;空间对称性自然泛化模型自动适应目标平移、旋转等变化,极大降低泛化对数据量的依赖;创新型体素编码器三维视觉信息高效表达,兼顾细节还原与计算速度。
7/22/2025 12:42:53 PM

零一万物发布万智企业大模型平台2.0及“万仔”Agent定制解决方案

今日,零一万物CEO、创新工场董事长李开复在媒体沟通会上宣布,万智企业大模型平台2.0正式升级发布,并同步推出创新成果——超级员工企业Agent定制解决方案“万仔”。 这一方案旨在通过高效、可靠的AI能力,与行业客户共同探索企业价值新边界。 “万仔”具备五大核心功能:**超级能干**,快速理解用户意图,整合内外部知识与工具,跨部门高效交付任务;**超级靠谱**,通过先进技术降低模型“幻觉”,确保结果准确;**自主晋升**,从错误中学习,持续优化性能;**超级装备**,基于万智平台,连接企业服务,实现系统互通;**可快速上岗**,部署便捷,快速投入使用。
7/22/2025 12:12:37 PM
AI在线

TRAE推出SOLO模式,业内首个「Context Engineer」来了

7 月 21 日,TRAE 宣布全新推出SOLO模式。 该功能是业内首个基于「Context Engineering」理念的AI开发助手,能够结合多模态上下文进行需求感知、任务分解、工具调度与执行反馈,并完整交付软件结果,旨在提供从任务理解到自动执行完整闭环的工程化实践体验。 SOLO 模式提供了一种高度自动化的开发方式,可自动规划并执行从需求理解、代码生成、测试,到成果预览的全流程。
7/22/2025 11:56:44 AM
十三

OpenAI 亲自下场!全能ChatGPT Agent发布,Manus们危险了

昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,这一产品整合了此前的Operator和DeepResearch两大系统。 图片Operator善于网页互动,能像人一样浏览网站、点击按钮、填写表单,但它读文章太慢,需要慢慢滚动。 DeepResearch擅长信息挖掘,能从全网抓取材料、整合分析并生成研究报告,但它基本不会和网页互动。
7/22/2025 11:56:26 AM

微软发布《与AI共事》:被AI影响的不是程序员,而是销售和媒体人!

微软研究院发布了一份名为《与AI共事》的报告,发现知识工作、沟通和销售类岗位,正处在被人工智能影响的最前沿。 图片地址: Copilot用户对话进行了分析,从用户意图和AI操作两个维度,评估AI在实际工作场景中的应用情况。 这些对话被映射到O*NET数据库,这是美国对所有职业的标准分类工具,涵盖每项工作的核心活动与职责。
7/22/2025 11:54:47 AM

35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。
7/22/2025 11:53:05 AM

AI原生创业公司的典范。他们15个人,做了5款产品,目前自负盈亏

我强烈建议所有的老板和团队管理者都看看这期内容,看完之后,让我真正理解了什么才是 AI 原生公司。 AI 创业公司 Every 的 CEO Dan Shipper 完整分享了自己团队使用 AI 的经验。 Every 是一家专注于 AI 领域的创业公司,目前团队只有 15 人,但业务覆盖非常广。
7/22/2025 11:45:12 AM
阿颖