AI在线 AI在线

理论

把实验与计算「缝」到一张「地图」上:AI让材料发现路线更直观、可解释

编辑丨&不知道诸位读者都是否知道黑箱? 这是指对特定的系统开展研究时,仅从其输入输出的特点了解该系统规律,而并不会涉及到其中系统内部的结构和相互关系。 在材料科学里,很多研究者都困在「黑箱」里:实验结果零散,模拟结果庞杂,数据孤岛四处林立,导致新材料发现依然缓慢。
9/1/2025 2:00:00 PM
ScienceAI

科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生

GRPO 就像一个树节点,从这里开始开枝散叶。 大语言模型的发展真是日新月异。 从 DeepSeek 横空出世以来,其在大模型后训练的创新 GRPO 一跃成为强化学习黄金范式。
9/1/2025 11:33:00 AM
机器之心

对话顺丰科技网络安全总监梁博:大模型浪潮下物流网络安全的守与破

网络安全中的攻防一直是矛与盾的关系,它们是相互对立且不断发展的。 当大模型重塑产业形态时,网络安全的“攻防边界”正在被悄然改写,开始上演一场在用魔法打败魔法的战争,但最终谁会胜利,不得而知。 作为承载亿量级用户隐私数据、依托自动化场景运转的物流行业来说,既面临传统网络攻击的持续侵扰,又需应对大模型衍生的新型安全风险。
9/1/2025 9:26:54 AM

143亿美金买来一场空!小扎向谷歌OpenAI低头,史上最大AI赌注失速

自从Llama 4发布后,Meta深陷「性能评测造假」丑闻,声誉跌落神坛。 之后,小扎坐不住了,斥143亿美元(约1000亿元)收购Scale AI,同时大举用九位数年薪挖角AI顶尖人才。 然而,近日Meta爆出离职潮,大批人才甚至还未入职便决定告别Meta。
9/1/2025 9:15:00 AM

解码50%失败率:自主智能体的三大“死穴”与破局之道

大家好,我是肆〇柒。 最近,来自香港中文大学和新加坡管理大学的研究团队在一项关于自主智能体的实证研究中发现:当前主流智能体系统的任务完成率竟然只有约50%。 他们不仅构建了一个包含34个可编程任务的基准测试,还对104次失败案例进行了系统性归因,首次提出了“三层失败分类法”。
9/1/2025 9:13:54 AM
肆零柒

Hinton神预言!斯坦福惊人实锤:00后20%初级IT岗蒸发,AI失业潮来了

AI无声掀起就业地震! 斯坦福大学最新研究显示:AI正无情吞噬美国年轻人的「饭碗」。 过去三年,最容易被AI取代的岗位里,22-25岁新人就业率猛降13%!
9/1/2025 9:13:00 AM

R-Zero 深度解析:无需人类数据,AI 如何实现自我进化?

本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生,Google scholar citation 五百多次,目前的研究的兴趣是强化学习和大语言模型。 机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。 大型语言模型(LLM)的发展长期以来受限于对大规模、高质量人工标注数据的依赖,这不仅成本高昂,也从根本上限制了 AI 超越人类知识边界的潜力 。
9/1/2025 9:09:00 AM

谷歌"香蕉"模型震撼发布!图像编辑能力一骑绝尘

最近有个感觉特别强烈:AI图像生成领域正在迎来一个全新的时代。 谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型,这个有着可爱名字的模型,可能要彻底改写图像编辑的游戏规则。 说实话,刚看到"香蕉"这个名字时,我还以为谷歌是在开玩笑。
9/1/2025 9:08:41 AM
阿丸笔记

小白大模型底层教程:Zero-Shot 、One-Shot、Few-Shot,不训练模型,如何进行微调?

最近,有学员在公司要做一个用户反馈的智能分类功能,需要打上“积极”、“消极”、“中性”这样的标签,他的第一反应是要微调模型了,来问我如何微调模型,我说,并不一定要微调模型,可以先了解一下什么是:Zero-Shot Learning、One-Shot Learning、Few-Shot Learning。 假设我们现在有一个需要分类的用户反馈:“这新功能真是太棒了,体验感一流! ”第一种方式:Zero-Shot (零样本学习)我们直接向模型下达指令,不给它任何参考范例。
9/1/2025 9:04:51 AM
IT周瑜

GPT-5冷酷操盘,狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默

一群模型去玩狼人杀,谁能夺下冠军? 这不,GPT-5、Gemini 2.5 Pro、Qwen3-235B-Instruct、GPT-OSS-120B等七大顶尖模型组队,同擂台开战。 一共210场血战,最终,GPT-5以96.7%的胜率独占榜首。
9/1/2025 9:03:00 AM

硅谷炸雷!xAI创始老哥携机密叛逃OpenAI,马斯克:他上传了整个代码库

xAI最开始的前20位工程师之一,一个名叫Xuechen Li的老哥在卖出约700万美元xAI股票后,转身就要叛逃去马斯克现在的死对头——OpenAI。 这还不是最关键的。 这老哥还带走了xAI的核心机密作为献给新东家的投名状,按照马斯克的话说:他「上传了xAI整个代码库」!
9/1/2025 9:02:00 AM

马斯克亲口证实xAI代码库被盗!涉案前员工被起诉,已跳槽OpenAI

刚刚,马斯克自曝,xAI的整个代码库都被偷走了。 就在今天,xAI起诉了一名离职员工,指控他窃取商业机密。 而且按xAI的说法,这名员工已经跳槽到了OpenAI。
9/1/2025 9:00:00 AM

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。 在 AI 领域,这种情况被称为「过度思考」。 它的存在让 AI 大模型公司非常头疼,因为实在是太浪费算力了,那点订阅费根本 cover 不住。
9/1/2025 8:59:00 AM

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

近日,Anthropic的一项关于消费者条款的更新政策,把网友惹怒了。 在这次条款更新中,Anthropic一改往日坚决不使用用户数据来训练模型的承诺,让现有用户二选一:是否接受自己的数据被用于模型训练。 表面上,Anthropic是把「选择权」交给了用户,但只留了一个月的期限。
9/1/2025 8:58:00 AM

构建检索增强生成(RAG):从基础版到多智能体系统的演进之路

在企业人工智能领域,检索增强生成(RAG)无疑是一个令人向往的目标。 只需让大型语言模型(LLM)接入企业私有数据,就能瞬间拥有一位精通业务的“天才专家”。 然而,残酷的现实是,众多RAG项目纷纷折戟沉沙。
9/1/2025 8:53:57 AM
大模型之路

更懂国内APP的开源智能体!感知/定位/推理/中文能力全面提升,还能自己学会操作

最新开源多模态智能体,能自动操作手机、电脑、浏览器的那种! 开源评测榜单和中文场景交互成绩全面提升。 比如让它播放一首歌,它就能自己找到对应软件、找到对应歌手、选择歌曲,像人类一样点击、滑动、输入。
9/1/2025 8:52:00 AM

智能体革命:AI如何重塑数据管理的四大核心支柱

借助智能体增强关键数据管理领域随着数据的复杂性和重要性不断提升,企业亟需更智能、更敏捷且可扩展的方法来管理数据。 由智能体驱动的数据管理员,代表了数据管理的下一阶段演进——它融合了人类专业知识与AI的强大能力。 这些领域对于执行领域数据战略至关重要,它们基于战略主题和关键数据元素作为核心输入。
9/1/2025 7:13:00 AM
Maria

CIO与CDO合作:将数据混沌转化为AI驱动的战略

非结构化数据——这个数字时代的“副产品”——已成为现代企业面临的难题,它就像企业的信息阁楼,从邮件、合同到IoT日志和社交媒体对话,应有尽有。 讽刺的是,尽管非结构化数据占企业信息总量的80%,真正被有效利用的却不到10%,这意味着有一座尚未开发的“数据金矿”,原本能够推动创新。 更糟糕的是,其中超过30%的数据是冗余、过时或无关紧要,它们不仅悄然推高存储成本,还增加了安全与合规风险,这不仅仅是错失机遇,而是活生生的负担。
9/1/2025 7:07:00 AM