2025年7月20日,2025基础科学与人工智能论坛在中关村展示中心会议中心举行。

清华大学人工智能研究院常务副院长孙茂松教授主持,北京中关村学院院长、中关村人工智能研究院理事长刘铁岩博士、清华大学电子工程系主任汪玉教授、美国纽约州立大学石溪分校顾险峰教授、曦智科技创始人兼CEO沈亦晨博士四位顶尖AI专家齐聚一堂,围绕人工智能的根本问题展开了一场火花四溅的讨论。
从因果性到原创能力,从算力瓶颈到未来架构,这场论坛为我们勾勒出AI技术的前沿图景与未来挑战。
共有500名来自清华大学求真书院、北京各高校、中学和科研机构的观众到场。
此外,本次论坛还是2025国际基础科学大会的特别活动之一,由清华大学求真书院主办,中信证券股份有限公司与中关村科学城管理委员会协办。
现已连续举办3届,旨在推动交叉学科合作交流,为青年学生搭建了了解科研前沿、激发探索兴趣的平台。
我们将论坛交流内容整理如下:
相关性≠因果性:AI系统的科学化门槛仍在
面对人工智能技术发展的瓶颈与限制,顾险峰教授指出,目前AI技术在方法上仍以“相关性”建模为主,缺乏对“因果律”的深刻掌握。
他认为,缺乏因果建模的能力是当前AI在自然科学、数理建模等任务上受到限制的原因。
同时他也强调,真正的科学建模需要简约假设、逻辑自洽的因果体系,不能仅靠大量数据推导模式。
刘铁岩教授则补充称,虽然大模型底层是统计学习的结构,但在高层语义表达中已出现“因果性功能的涌现”,例如在处理逻辑推理、数学解题、文本论证等任务时,大模型展现出了“因为……所以……”的结构理解能力。
他呼吁对因果性的层次与表达保持开放态度,建议从“语义因果性”角度重新评估当前模型的能力边界。

Token范式的尽头:AI模型是否需要世界模型?
与会专家还就“Next Token Prediction是否是通往通用智能的正道”展开讨论。
孙茂松教授率先提出疑问:文本是天然一维的,图像是二维的,视频再加一维时间,世界则是四维的。当认知对象越来越复杂,是否需要彻底摒弃token预测,转向“世界模型”等新范式?
对此,汪玉教授持乐观态度。
他认为,“语言本身是人类认知的表达系统”,图像、视频、物理结构等都可以在二维语言序列中进行展开。
基于此,他提出一个“可描述性”的新边界概念:如果人类能够通过语言准确描述某一对象或规律,AI就有可能通过token prediction模型学会它;如果人类尚未找到语言描述方式,则AI也难以捕捉。
刘铁岩教授对此也补充道,“next token prediction 实际上是语言理解和创作领域的极佳范式”,其泛化能力远超以往所有任务特定模型。
但当AI任务转向如偏微分方程求解、量子系统建模、工业优化等非语言任务时,“当前范式将无法胜任,需要全新学习目标与系统架构。”
AI能否“原创”?推理与建模能力仍不可替代
其次,学者们还进一步聚焦于AI是否具备“原创能力”。
顾险峰教授直言:
另外他以自己学习拓扑学为例指出:
他强调,科学进步来自“对未知现象的预判与假设”,而非对已知结构的不断模仿。
沈亦晨博士以围棋为喻指出,尽管围棋规则简单,但由于搜索空间巨大(约10^360),“纯靠套路是不足以解决全部问题的。”
他区分了“90%可类推问题”与“10%原创性突破问题”,认为AI可以在大多数工程化问题中大显身手,但在人类科学的“皇冠上的明珠”领域,目前仍力有未逮。
刘铁岩教授则从产业视角提出:
他认为未来AI将在“从类比中发现新结构”方面具有巨大潜力,尤其是在AI for Science的具体子任务中表现出色。
高能效计算是AI基础设施的下一场革命
面对当前大模型对算力的依赖已呈指数增长的问题,孙茂松教授引用数据显示,最新一代大模型训练耗资约达100亿美元,需20万张GPU卡支持,预计2035年将可能突破至1亿张卡。
沈亦晨回应称:
他介绍了曦智科技在光互联和光计算芯片方面的进展:
他进一步强调,要充分发挥光计算的高能效优势,需在算法层面推动向低精度(int4/int8)模型优化。
汪玉补充指出,“未来的关键是让底层硬件异构对开发者透明。”即芯片无论是电计算还是光计算,对开发者应“看起来就是一台机器”,从而保障工程系统的稳定性与迁移效率。
刘铁岩则抛出一种范式设想:
他设想一个分布式交互学习系统,由100万个机器人在物理世界中实时感知、同步数据和模型权重,实现全域智能协同。
正如孙茂松教授在总结中所说: