AI在线 AI在线

硅基模型vs.碳基大脑:AI能否成为超越人类的超级预测者?

如果能精准预测未来,就能在生活中占尽先机,无论是预判房价涨跌,还是捕捉下一个产业风口,预测的魅力都无人可挡。 随着 AI 技术的蓬勃发展,一个核心问题开始引发思考:人工智能能否成为超越人类的超级预测者? 在这一思潮的推动下,预测领域正加速构建 AI 预测机器人。

硅基模型vs.碳基大脑:AI能否成为超越人类的超级预测者?

如果能精准预测未来,就能在生活中占尽先机,无论是预判房价涨跌,还是捕捉下一个产业风口,预测的魅力都无人可挡。随着 AI 技术的蓬勃发展,一个核心问题开始引发思考:人工智能能否成为超越人类的超级预测者?

在这一思潮的推动下,预测领域正加速构建 AI 预测机器人。事实上,这类技术早就已经出现在金融市场,比如 DeepSeek就是凭借算法交易模型起家的。但目前业界的共识是:顶尖人类预测者仍全面领先于机器。

以专业预测平台 Metaculus 为例,它定期举办季度预测锦标赛。最开始时赛事只允许人类参与,近年新增 AI 机器人组别。观察2024 年三季度、四季度及 2025年一季度的预测结果,我们可以发现人类超级预测者优于机器。

不过 Metaculus CEO 德格・图兰(Deger Turan)指出一个关键趋势:人类预测的能力基本稳定,而 AI 的进步肉眼可见,两者的差距正在缩小。

能否优化AI的预测能力

预测能力蕴含着巨大价值:律师想预判对手是否接受和解,建筑项目要估算竣工时间,电影制片人想押中爆款剧本,甚至单身者都想知道约会对象更爱咖啡还是啤酒。毫无疑问,人人都想成为预测大师。

从技术本质看,AI 预测的逻辑并不复杂:通过海量数据训练大模型,使其具备对未知场景的推演能力。预测已经形成独特的知识体系,比如“基础率”(某现象的历史发生概率,以避免过度乐观或悲观的预测偏差)、“布里尔分数”(用于衡量概率预测准确性的评估指标)、“校准度”(模型预测的概率与实际事件发生概率之间的一致性)已经成为预测学的基石。人类将终极目标指向 “超级预测者”,它们的准确率远超平均水平,预测结果具有持续可靠性。

2024 年 10 月,国际AI领域非营利组织人工智能安全中心(Center for AI Safety)宣称,仅通过大语言模型抓取新闻就能实现 “超人级” 预测,但这一结论很快因 “数据污染” 崩塌,模型误将本不该获取的信息纳入其中,导致结果无法复现。

相比之下,加州大学伯克利分校的方案更具参考价值,它的预测模型也是基于大模型开发的,但增加了许多限制,比如,不允许机器人自动运行,而是按特定顺序执行系列任务。具体来说就是增加的特定框架,首先要求模型制定一系列问题,根据问题获取相关新闻内容;第二步,新闻服务给出回应,大语言模型判断哪些回应最实用;然后根据相关度最高的回应进行汇总。

实验数据显示,若直接调用大语言模型进行预测,不做结构化处理,其准确率经常接近甚至低于随机猜测水平,这表明单纯依赖大模型难以有效捕捉复杂逻辑关系。而经过结构化训练后,AI 机器人的预测准确率显著提升。

尽管近年来 AI 能力取得显著进步,但在预测领域仍未能超越人类,更无法企及 "超级预测者" 水平。展望未来,预测模型将更趋 "结构化" 发展,人机协作的深度与广度也将进一步提升。

预测的难点在哪里

开发 AI 预测工具的 FutureSearch 公司 CEO 丹・施瓦茨指出:“从学术层面看,至今没有成果能超越加州大学伯克利分校的论文,而那篇研究已发布超一年。”在 AI 领域,一年时光足以见证技术迭代。这一现状既印证了伯克利团队的突破性,也暴露了 AI 预测的深层困境:语言模型在定量分析与逻辑推理上存在天然缺陷,面对复杂问题时,大模型的预测能力更糟糕。

但伯克利研究团队仍保持乐观。他们强调,尽管 AI 存在局限性,但从 ChatGPT 问世至今不过数年,当前 AI 预测能力已逼近人类平均水平。若能将专业预测概念深度植入 AI 系统,其表现完全有可能超越人类顶尖预测团队。

回望历史,人类本就是极不擅长预测的物种,无论是经济危机还是技术变革,无数误判早已证明这一点。

想拥有良好的预测能力,需要诚实面对错误,不断汲取教训,要不断调整观点,不能被新闻评论或者别人的讨论干扰,还要对所有信息都给予恰当重视,这本来就反人性的。如果让AI来处理,可能效果会更好。

几年前,美国曾出版过一本名叫《超级预测》的书,作者是宾夕法尼亚大学心理学家Philip Tetlock,虽然本书曾引起热议,但几乎没多少人认为有明确的预测策略存在。一个耐人寻味的现象是:当印巴冲突升级或中美关税谈判胶着时,鲜见 “超级预测者” 在媒体头条发表观点;在白宫政策制定过程中,也难觅他们的身影;就连最依赖预测的投资机构也极少将 “超级预测者” 纳入决策链条。

如此现状引出另一个问题:世界对人类超级预测者的需求并不强,但如果是由机器来预测呢,情况会不会改变?

从当前各大科技公司的研发方向看,"超级 AI 预测工具" 尚未成为重点研发领域。即便成功研发出强大的 AI 预测工具,如何获取决策者的信任仍是一大难题。

现代大语言模型本质上是一个 "黑箱" 系统:当人们提出问题并让其预测时,实际上无法知晓大模型是如何通过计算得出最终答案的。

未来,人类可能会要求 AI 对预测结果进行解释,而决策者往往只会在解释合理的情况下才采纳其建议。当工具出现时,我们最开始肯定会保持怀疑态度,随着时间推移,AI需要用令人信服的预测成绩征服人类,然后才能改变人类的决策方式。(小刀)

相关资讯

知乎直答:AI 搜索产品从 0 到 1 实践探索

一、知乎直答产品介绍知乎直答是具有强社区属性的通用 AI 搜索产品,但并非社区版 AI 搜索。 知乎直答具有以下几大优势:认真专业:与知乎专注专业内容生产的调性相符,严格把控参考来源与质量,确保回答认真且专业。 连接创作者:可在使用中关注、与创作者交流互动获取专业见解。
1/20/2025 10:40:08 AM
王界武

活性提高42倍,ML引导的无细胞表达加速酶工程,登Nature子刊

编辑 | 萝卜皮酶是人类生活中不可或缺的天然催化剂,不仅助我们消化食物,还能增强香水香味、提高洗衣效率,甚至用于疾病治疗。 科学家们正使用酶工程创造新酶,用于吸收温室气体、降解环境毒素、研发高效药物。 但是,酶工程受限于快速生成和使用大量序列功能关系数据集进行预测设计的挑战。
1/24/2025 2:55:00 PM
ScienceAI

Meta AI推出非入侵式脑机技术Brain2Qwerty,可将大脑信号转换为文本

2月11日消息,据外媒报道,Meta AI推出了Brain2Qwerty,这是一种新的人工智能系统,可以在不需要手术的情况下将大脑信号转换为文本。 该系统使用非侵入性方法,包括脑电图(EEG)和脑磁图(MEG)来记录大脑活动。 在这项研究中,健康的志愿者记住句子,然后在QWERTY键盘上打字,同时捕捉他们的大脑信号。
2/11/2025 12:41:57 PM
Yu
  • 1