AI在线 AI在线

研究人员揭示大模型并非真正推理,只是在 “找关系”

随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。 近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。 他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。

随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。

论文中,研究者们特别提到,尽管这些 AI 模型在给出答案之前,往往会生成一系列看似合理的中间过程,但这并不意味着它们在进行推理。研究小组强调,这种将 AI 模型行为拟人化的说法,可能会导致公众对其工作机制产生误解。他们指出,大模型的 “思考” 实际上是通过计算寻找数据之间的相关性,而非理解因果关系。

大模型 元宇宙 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

为了验证他们的观点,研究人员还提到了一些推理模型,如 DeepSeek R1,虽然在某些任务中表现优异,但这并不证明它们具备人类思考能力。研究表明,在 AI 的输出中,并没有真正的推理过程存在。因此,如果用户将 AI 模型生成的中间输入视作推理过程,可能会对其问题解决能力产生误导性信心。

这项研究提醒我们,在日益依赖 AI 的时代,必须更加谨慎地看待这些技术的能力。随着对大模型能力的认知深化,未来的人工智能研究将可能朝着更具解释性的方向发展,帮助用户更清晰地理解 AI 的实际工作原理。

相关资讯

反击AI论文!arXiv每年拒掉2%造假内容,自动化工具加入审核

AI生成论文泛滥成灾,arXiv平台看不下去了——. 紧急升级审核机制,用自动化工具来检测AI生成内容。 Nature最新发现,原来每年竟然都有2%的论文会因为AI使用被拒?
8/14/2025 3:45:49 PM
鹭羽

综述连arXiv都不给发了?最严新规出台:被会议、期刊接收才行,workshop都不行

arXiv 新规:综述、立场论文不再随意接收,会议、期刊接收之后才给发正在写综述和立场论文的学者注意了:即日起,所有想要投稿到 arXiv 计算机科学分类下的综述性文章和立场论文,必须先被正式的期刊或会议接受,并且完成同行评审。 这是 arXiv 刚刚出台的新规。 具体来说,作者在投稿时需要提供文章已被接收并成功完成同行评审的证据(包含同行评审的期刊参考文献和 DOI 元数据)。
11/2/2025 5:53:00 PM
机器之心

应对 AI 论文泛滥:arXiv CS 类别综述论文设“前置评审”门槛

近日,知名的预印本平台 arXiv 宣布更新其计算机科学(CS)类别的论文审核规则,以应对由 AI 生成或 AI 辅助生成的综述论文和立场论文数量激增,导致难以管理的问题。  新规:CS 综述与立场论文须先获同行评审根据新规,提交至 arXiv CS 类别的 综述论文(Review Papers) 和 立场论文(Position Papers),必须已被期刊或会议正式接收并完成同行评审之后才能上传。 在提交这两类论文时,作者必须附上成功通过同行评审的证明文件(如期刊参考文献和 DOI 元数据)。
11/5/2025 9:42:19 AM
AI在线