AI在线 AI在线

理论

控制成本降低150%,用于微型反应堆的强化学习模型

编辑丨@在能源危机的当下,核能,或者说,微型核反应堆(后称核微反应堆)凭借规模化优势,成为了当下可再生能源的一大重要供应来源。 通常来说,核微反应堆的经济可行性取决于通过自主控制技术降低成本,尤其是这些反应堆与其他能源系统协同运行的时候。 密歇根大学研究人员领导了一项研究,探讨了深度强化学习(RL)模型在微反应器实时鼓控制中,特别是在负荷跟随场景中的性能。
7/7/2025 6:44:00 PM
ScienceAI

让AI自主设计并执行生物实验,机器人生物学家开启实验室自动化新时代

编辑 | ScienceAI在生物研究中,重复性实验如细胞培养、优化参数往往耗时耗力,且受人为误差影响。 传统自动化方案(如液体处理机器人)虽能辅助,却缺乏灵活性 —— 面对复杂协议、动态实验条件时,常需人工干预,难以自主应对错误或优化设计。 如何让 AI 真正 “理解” 并执行生物实验,成为科研加速的关键瓶颈。
7/7/2025 2:18:00 PM
ScienceAI

精度高,速度快!西湖大学团队开发端到端电子显微镜图像分析深度学习模型

编辑 | 萝卜皮冷冻电镜拍图虽然很高清,但是 AI 解结构却像新手拼乐高——步骤繁琐易跑偏,算力烧钱还挑数据。 为了应对这些挑战,西湖大学与新加坡国立大学的研究人员提出了 end-to-end and efficient CryoFold(E3-CryoFold),这是一种支持端到端训练和一次性推理的深度学习方法。 E3-CryoFold 使用三维和序列 Transformer 从密度图和序列中提取特征,并使用交叉注意力模块整合这两种模态。
7/7/2025 10:19:00 AM
ScienceAI

与一支由虚拟科学家组成的 AI 团队共事是怎样的体验?

编辑丨%4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一生中最超现实的会议之一。 在一个名为 Virtual Lab 的系统的在线测试界面中,Montine 构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。 他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。
7/7/2025 10:11:00 AM
ScienceAI

首个GUI多模态大模型智能体可信评测框架+基准:MLA-Trust

MLA-Trust 是首个针对图形用户界面(GUI)环境下多模态大模型智能体(MLAs)的可信度评测框架。 该研究构建了涵盖真实性、可控性、安全性与隐私性四个核心维度的评估体系,精心设计了 34 项高风险交互任务,横跨网页端与移动端双重测试平台,对 13 个当前最先进的商用及开源多模态大语言模型智能体进行深度评估,系统性揭示了 MLAs 从静态推理向动态交互转换过程中所产生的可信度风险。 此外,MLA-Trust 提供了高度模块化且可扩展的评估工具箱,旨在为多样化交互环境中 MLAs 的持续性可信度评估提供技术支撑。
7/4/2025 4:50:07 PM

10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个

前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩溃。 要是哪个 AI 能一键分析表格,我当场就能给它磕一个。 现在,终于有 AI 来整顿 Excel 表格了!
7/4/2025 4:47:35 PM

Agent RL和智能体自我进化的关键一步:TaskCraft实现复杂智能体任务的自动生成

近年来,基于智能体的强化学习(Agent RL)与智能体优化(Agent Optimization)在学术界引发了广泛关注。 然而,实现具备工具调用能力的端到端智能体训练,首要瓶颈在于高质量任务数据的极度稀缺。 当前如 GAIA 与 BrowserComp 等主流数据集在构建过程中高度依赖人工标注,因而在规模与任务复杂性方面均存在明显限制——BrowserComp 仅涵盖约 1300 个搜索任务,GAIA 则仅提供约 500 条多工具协同任务样本。
7/4/2025 4:46:57 PM

4000万样本炼出AI读心术,刷新七榜SOTA,最强「人类偏好感应器」开源

AI,到处都是AI! 早上起来,脑子里突然萦绕起一个旋律,于是便对着AI随便哼了几句让它找出来是哪首歌;到公司之后,打开电脑里的AI,开始准备关于昨天工作的汇报。 只见你熟练地敲入:「根据以下这些文档,写一份总结,要专业、有逻辑、内容简洁」。
7/4/2025 4:45:24 PM

Ilya尘封10年录音曝光!大二入Hinton门下,竟坦言机器学习反直觉

Ilya Sutskever因在深度学习方面的远见卓识而闻名。 他现在许多广为流传的言论其实都来自于他在2023年参加Dwarkesh播客时的发言。 此后,直到2025年Ilya创办SSI后,几乎不再有公开的言论,此前曾探讨过Ilya的去向。
7/4/2025 4:39:56 PM

百万年薪遍地走,Meta薪资接连曝光!AI人才身价水涨船高ing

20000000美金,码农身价堪比NBA球星? 就在小扎顶配高薪挖人之际,Meta各岗位薪资被接连曝出。 先是一份联邦文件曝光,将Meta包括AI研究科学家、软件工程师、产品经理等在内的岗位基本工资一次性大揭底。
7/4/2025 4:37:50 PM

硅谷的企业级AI正在这样赚钱|2025人工智能现状报告

企业级AI开发现状如何? 各企业在使用AI的战略上有什么变化? AI公司应该作出什么样的调整来应对挑战?
7/4/2025 4:34:43 PM

开源大佬炮轰MCP:我不是MCP的忠实拥趸!MCP是一个死胡同!根本不是为无推理自动化而设计的!绕开MCP,试试代码生成的世界

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天凌晨,知名开源 Web 框架作者 Ronacher 发表了一篇引起热烈反响的博客。 虽然他自谦地在X上称这篇“烂文章”,但网友们却非常认同。 图片这篇文章标题为:《Tools:Code is all your need》。
7/4/2025 12:35:32 PM
云昭

LeCun团队揭示LLM语义压缩本质:统计压缩牺牲细节

当我们读到“苹果”“香蕉”“西瓜”这些词,虽然颜色不同、形状不同、味道也不同,但仍会下意识地归为“水果”。 哪怕是第一次见到“火龙果”这个词,也能凭借语义线索判断它大概也是一种水果。 这种能力被称为语义压缩,它让我们能够高效地组织知识、迅速地对世界进行分类。
7/4/2025 9:53:57 AM

AI代码工具大地震:Anthropic核心创始人集体"叛逃"Cursor背后的惊天内幕

昨天在Twitter上看到一条消息,差点让我手中的咖啡洒出来——Claude Code的创始人@bcherny和@_catwu离开了Anthropic,加入了Cursor AI。 这感觉就像是你精心培养的孩子,突然跑到隔壁邻居家说"爸爸,我要跟着他们混了"。 作为一个天天和各种AI编程工具打交道的开发者,我深知这件事背后的分量。
7/4/2025 9:21:50 AM
阿丸笔记

刚刚,Ilya Sutskever宣布自任CEO:联创被Meta挖走了

Meta 的挖掘机,终于挖到了 Ilya 大神的头上。 周五凌晨,OpenAI 联合创始人 Ilya Sutskever(伊尔亚・苏茨克维)久违地在社交媒体发声。 我向我们的团队和投资者发送了以下信息:正如你们所知,Daniel Gross 在我们公司的时间已接近尾声,自 6 月 29 日起,他已正式退出 Safe .
7/4/2025 9:14:10 AM
机器之心

开源DeepSeek R1增强版:推理效率快200%,创新AoE架构

德国知名技术咨询公司TNG开源了DeepSeek R1的增强版DeepSeek-TNG-R1T2-Chimera。 Chimera是基于DeepSeek的R1-0528、R1和V3-0324三大模型混合开发而成,同时采用了一种全新的AoE架构。 这种架构在提升性能的同时,还能加快模型的推理效率并节省token输出。
7/4/2025 9:08:00 AM

首次!世界模型、动作模型融合,全自回归模型WorldVLA来了

岑俊,阿里巴巴达摩院具身智能大模型算法研究员,博士毕业于香港科技大学。 研究方向主要是:具身智能 VLA 模型,世界模型。 阿里巴巴达摩院提出了 WorldVLA, 首次将世界模型 (World Model) 和动作模型 (Action Model/VLA Model) 融合到了一个模型中。
7/4/2025 9:07:00 AM

本地LLM万字救场指南来了!全网超全AI实测:4卡狂飙70B大模型

今年上半年,随着DeepSeek R1的发布,国内大模型的应用迎来井喷式的发展,各种大模型的信息满天飞,连普通消费者都多多少少被大模型一体机给安利了,特别是满血版的DeepSeek 671B。 然而理性地来讲,671B模型的部署成本动辄百万起步,远超一般企业的IT预算。 同时,我们对大模型的使用与功能挖掘还停留在初期阶段,特别是在后千模大战的时代,32B/70B等中档模型已经可以满足许多企业的需求。
7/4/2025 9:06:00 AM