AI在线 AI在线

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍

编辑丨&实验室的光谱仪常常是科研流程中最昂贵、最慢的一环。 每当新材料被设计出来,它还需经过繁琐的扫描与验证——晶格结构、分子基团,诸如此类。 一次完整的表征,往往要切换多台设备、耗费数小时乃至几天。
图片

编辑丨&

实验室的光谱仪常常是科研流程中最昂贵、最慢的一环。每当新材料被设计出来,它还需经过繁琐的扫描与验证——晶格结构、分子基团,诸如此类。一次完整的表征,往往要切换多台设备、耗费数小时乃至几天。

而在另一端,人工智能的推演速度早已飞奔。计算模型每天生成成千上万种新配方,却被现实的实验节奏拖慢。MIT 的研究团队决定,从「理解光谱」的角度出发,让 AI 也能学会替科学家「测」一次材料。

该研究以「SpectroGen: A physically informed generative artificial intelligence for accelerated cross-modality spectroscopic materials characterization」为题,于 2025 年 10 月 14 日发布在《Matter》。

图片

论文链接:https://www.cell.com/matter/abstract/S2590-2385(25)00477-1

让 AI 理解「光谱的语言」

AI 驱动的材料发现能够快速设计新型材料成分,但合成与表征却相对滞后。尤其是表征环节,仍受限于依赖电磁光谱学、由专家操作仪器进行的劳动密集型实验。

MIT 推出了 SpectroGen,这是一种用于跨模态光谱生成的生成式 AI 模型,旨在加速材料表征。SpectroGen 生成的高分辨率、高信噪比光谱与真实值的相关性达 99%,均方根误差为 0.01 原子单位。

它的关键在于将光谱重新定义为一种数学分布,而非分子信号。每种光谱曲线——无论是高斯形的红外峰,还是洛伦兹形的拉曼线——都能用方程表达。团队据此为模型加入「物理先验」:AI 不再盲目拟合,而是受制于这些已知的分布规律。

图片

图 1:SpectroGen 工作流程。

图片

图 2:建模策略。

在此基础上,研究者构建了一个变分自编码器(VAE)架构。模型先将输入光谱压缩成潜空间的特征分布,再利用这些物理约束生成另一种模态的光谱。  这一「物理+生成」的混合逻辑,使 SpectroGen 既能保持可解释性,又能高速运行。它本质上是一台虚拟光谱仪——输入一种信号,生成另一种测量结果。

用数据打点样

团队以国际矿物学协会标准数据库 RRUFF 为验证集,共使用约 6000 个矿物样本。 在 IR–Raman 和 XRD–Raman 两类跨模态任务中,SpectroGen 生成的光谱与真实实验结果平均相关性达到 99%,强度均方误差仅 0.01 a.u.,结构相似度指数(SSIM)高达 0.96–0.97。

图片

图 3:对红外到拉曼和 X 射线衍射到拉曼任务的整个生成数据集进行了光谱特征评估。

更令人意外的是,AI 生成的光谱信噪比甚至优于实验数据——例如某矿物样本的信噪比由 3.1 提升至 11.1。在信息保持性测试中,研究者用生成光谱训练材料分类网络,准确率达 90.476%,比直接用实验光谱(69.878%)提升约 20 个百分点。

在效率上,SpectroGen 能在一分钟内完成一次完整生成,速度比传统测量快约一千倍。团队指出,这意味着在未来的生产线中,仅需一台红外摄像机即可完成多模态检测,而无需昂贵的 X 射线或拉曼设备。

结语

团队表示,SpectroGen 可以为任何类型的矿物生成光谱。在制造业,它可用于电池、半导体、药物等产业的质量控制,只需一次简单扫描便可获得多模态指标。在科研与药物研发中,研究者能快速筛查大规模候选样本,节省大量实验时间与设备成本。

通过将光谱数据视为一种抽象的数学分布表示,模型能够生成独立于键和晶体结构的标准物理表示的光谱,这种抽象使 SpectroGen 能够弥合物理实验与计算分析之间的差距,拓展光谱生成在各个领域的通用性。

SpectroGen 不是简单的数据拟合,而是一个具有物理意识的生成系统——它知道光谱为何成形,也能在不同实验模式间自洽地「迁移」信息。这类模型或将成为未来科学 AI 的基础模板。

相关链接:https://phys.org/news/2025-10-quality-materials-easier-ai-tool.html

相关资讯

AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊

编辑 | 2049在电磁波调控的舞台上,超材料曾凭借其人工设计的亚波长结构,打破了自然材料的物理限制,实现了负折射、隐身斗篷等奇异现象。 然而,当工程师试图将这类「魔法材料」应用于动态环境时,却发现传统超材料如同精密的机械手表 —— 虽能精准运行,却无法根据环境变化自主调整。 这种矛盾在自动驾驶、智能通信等实时场景中尤为突出,亟待新的技术范式突破。
2/8/2025 2:25:00 PM
ScienceAI

多模态大模型在化学与材料学的「体检表」——哪些能力靠谱,哪些还差很远?

编辑丨&当下,各类实验室非常热衷于把大型语言模型(LLMs)和视觉—语言模型(VLLMs)当作科研助手,但科学工作不像聊天那样单一:它要求把图像、表格、谱图、实验装置等多模态信息整合并进行多步推理与决策。 一个全面有效的评估基准显然是当下急缺的。 来自德国耶拿大学(Friedrich Schiller University Jena)等的团队提出了一个面向真实科研流程的评测框架——MaCBench,把科研活动粗分为「信息抽取」「实验执行」与「结果解读」三大支柱,以便系统评估模型在真实化学/材料任务中的表现与失败模式。
8/18/2025 10:16:00 AM
ScienceAI

从实验室到餐桌:Robert Langer团队杨昕博士用新材料破解全球「隐性饥饿」

作者 | 论文团队编辑 | ScienceAI缺铁是全球最常见的微量营养素缺乏症之一,影响着约 20 亿人。 它是导致贫血的主要原因,对能量水平、认知发育和孕产妇健康有显著影响。 众所周知,碘盐是历史上最成功的公共卫生干预措施之一,显著降低了全球碘缺乏率。
8/22/2025 2:38:00 PM
ScienceAI
  • 1