AI在线 AI在线

苹果再轰AI推理能力,GitHub大佬怒怼:这不是推理能力的真实面貌!

最近,苹果公司发布了一篇引发热议的论文,指出当前的大语言模型(LLM)在推理方面存在重大缺陷。 这一观点迅速在社交媒体上引起热议,尤其是 GitHub 的高级软件工程师 Sean Goedecke 对此提出了强烈反对。 他认为,苹果的结论过于片面,并不能全面反映推理模型的能力。

最近,苹果公司发布了一篇引发热议的论文,指出当前的大语言模型(LLM)在推理方面存在重大缺陷。这一观点迅速在社交媒体上引起热议,尤其是 GitHub 的高级软件工程师 Sean Goedecke 对此提出了强烈反对。他认为,苹果的结论过于片面,并不能全面反映推理模型的能力。

苹果的论文指出,在解决数学和编程等基准测试时,LLM 的表现并不可靠。苹果研究团队采用了汉诺塔这一经典的人工谜题,分析了推理模型在不同复杂度下的表现。研究发现,模型在面对简单谜题时表现较好,而在复杂度较高的任务中,推理模型往往选择放弃,不再继续推理。

image.png

例如,在处理十盘汉诺塔问题时,模型会觉得手动列出每一步几乎不可能,因此选择寻找 “捷径”,但最终却未能得出正确答案。这一发现表明,推理模型在某些情况下并非没有能力,而是意识到问题过于复杂而选择放弃。

不过,Sean Goedecke 对此表示质疑,他认为汉诺塔并不是测试推理能力的最佳例子,模型的复杂性阈值也可能并非固定。此外,他还提到,推理模型的设计初衷是为了处理推理任务,而不是执行数千次重复性步骤。用汉诺塔测试推理能力,就像在说:“如果某个模型不能写出复杂的诗歌,那它就不具备语言能力”,这并不公平。

虽然苹果的研究揭示了 LLM 在推理方面的一些局限,但这并不意味着这些模型完全没有推理能力。真正的挑战在于如何更好地设计和评估这些模型,以发掘它们的潜力。

相关资讯

阿里巴巴股价飙升,背后原因竟与人工智能有关

阿里巴巴的股价在近期表现出色,持续攀升,吸引了投资者的广泛关注。 这家知名的电子商务巨头上周发布了令人惊喜的财报,超出市场预期,进一步巩固了其在行业中的地位。 公司不仅在营收上实现了增长,同时也表现出良好的盈利能力,显示出其强大的市场竞争力。
2/21/2025 2:10:00 PM
AI在线

Apple Watch 将引入 AI 功能与摄像头,带来全新体验

根据彭博社的报道,苹果公司正在计划在其 Apple Watch 手表中集成摄像头。 这摄像头将使 Apple Watch 能够视觉观察用户的环境,并利用人工智能(AI)提供相关信息。 据悉,苹果可能会在标准系列手表和 Ultra 系列手表上都加入摄像头。
3/24/2025 5:31:00 PM
AI在线

​消息称苹果斥资 10 亿美元购买 NVIDIA 的 AI 系统

苹果公司近期在人工智能领域的投资动作引起了广泛关注。 根据 Loop Capital 分析师 Ananda Baruah 的报告,苹果公司正在斥资10亿美元购买 NVIDIA 的 AI 系统,以支持其 Apple Intelligence 的运行。 虽然苹果之前曾表示依靠自家的 Apple Silicon 服务器来处理相关任务,但如今的投资显示出其在技术领域的进一步布局。
3/26/2025 9:31:00 AM
AI在线
  • 1