AI在线 AI在线

研究:生成式 AI 更像是记忆大师而非推理高手

生成式 AI 的迅猛发展和广泛应用引发了诸多担忧,从隐私安全到潜在的失业危机。虽然 AI 聊天机器人如 ChatGPT 和微软 Copilot 在短短时间内取得了惊人进步,能够写代码、纠错甚至挑战人类创意,但它们真的像表面看起来那么聪明吗?麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项最新研究指出,这些强大的大型语言模型(LLM)似乎更依赖记忆而不是真正的推理能力。它们在熟悉的任务上表现出色,但在面对新问题时却显得力不从心。AI在线注意到,研究人员通过对比 AI 在不同任务上的表现得出这一结论。例如,G

生成式 AI 的迅猛发展和广泛应用引发了诸多担忧,从隐私安全到潜在的失业危机。虽然 AI 聊天机器人如 ChatGPT 和微软 Copilot 在短短时间内取得了惊人进步,能够写代码、纠错甚至挑战人类创意,但它们真的像表面看起来那么聪明吗?

研究:生成式 AI 更像是记忆大师而非推理高手

麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项最新研究指出,这些强大的大型语言模型(LLM)似乎更依赖记忆而不是真正的推理能力。它们在熟悉的任务上表现出色,但在面对新问题时却显得力不从心。

AI在线注意到,研究人员通过对比 AI 在不同任务上的表现得出这一结论。例如,GPT-4 在十进制算术方面表现优异,但在其他进制下却难以应对,类似的现象也出现在棋类游戏和空间推理等领域。研究人员认为,AI 更像是记忆力超群的“鹦鹉”,而非具备真正推理能力的“智者”。

研究结果表明,AI 在训练有素的领域内可以达到甚至超越人类水平,但这更多的是一种“记忆力”的体现。一旦面对全新的挑战,需要真正的推理能力时,AI 的优势便不再明显。

这一发现对 AI 的未来发展提出了新的挑战。虽然 AI 在某些领域已经展现出超越人类的能力,例如自动化大量重复性工作,但在创意、解决复杂问题等方面仍有巨大的提升空间。例如,一些媒体机构尝试用 AI 取代记者,结果却发现 AI 生成的新闻错误百出,反而增加了编辑的工作量。

游戏行业也面临类似的问题,AI 工具虽然能辅助开发过程,但核心创意和游戏体验的打造仍然离不开人类的智慧和创造力。

相关资讯

迪拜首家 “AI主厨” 餐厅即将开业,带你体验未来的美食之旅

迪拜首家 “AI主厨” 餐厅即将开业,带你体验未来的美食之旅

在即将到来的9月,迪拜市中心将迎来一家名为 WOOHOO 的餐厅,它将以 “未来式餐饮” 的理念震撼开业,位置紧邻世界最高建筑哈利法塔。 这家餐厅的独特之处在于其菜品的设计完全由一个名为 Chef Aiman 的大语言模型创造,而人类厨师则负责实际的烹饪过程。 WOOHOO 的联合创始人 Ahmet Oytun Cakir 透露,Chef Aiman 的名字结合了 “AI” 和 “man”,代表着人工智能在烹饪领域的创新应用。
7/11/2025 11:11:59 AM AI在线
AI 大战超级玛丽!Claude 3.7 封神:Gemini、GPT-4o 全军覆没,谁才是游戏界真王者?

AI 大战超级玛丽!Claude 3.7 封神:Gemini、GPT-4o 全军覆没,谁才是游戏界真王者?

谁是游戏界真王者?AI 竟向经典游戏《超级马力欧兄弟》发起挑战! 加州大学圣地亚哥分校 Hao 人工智能实验室传来惊人战报:在一场别开生面的 AI “马力欧” 大乱斗中,Anthropic 旗下的 Claude3.7模型 “一骑绝尘”,力压群雄,荣登 “最强 AI 马力欧” 宝座! 紧随其后的是同门师弟 Claude3.5,而谷歌 Gemini1.5Pro 和 OpenAI 的 GPT-4o 这两位 “AI 界大佬” 却意外 “翻车”,表现令人大跌眼镜!
3/4/2025 5:00:00 PM AI在线
最高 7.25 美元 / 分钟,Adobe 购买视频构建 AI 模型与 Sora 竞争

最高 7.25 美元 / 分钟,Adobe 购买视频构建 AI 模型与 Sora 竞争

感谢Adobe 公司已开始采购视频,用来构建其 AI 驱动的文本到视频生成器,在 OpenAI 展示类似技术(Sora)后,Adobe 试图赶上竞争对手。这家软件公司正在向其摄影师和艺术家网络提供每份 120 美元(IT之家备注:当前约 870 元人民币)的报酬,Adobe 要求他们提交人们从事日常活动(如行走)或表达各种情绪(包括喜悦和愤怒)的视频。该公司表示,这样做是为了给人工智能训练收集资料。Adobe 要求提供 100 多个参与动作和表达情感的人的短片,以及脚、手或眼睛的简单解剖镜头。该公司还希望获得人们“
4/11/2024 10:30:34 AM 沛霖(实习)