AI在线 AI在线

27、42、73,DeepSeek这些大模型竟都喜欢这些数!为什么?

42,这个来自《银河系漫游指南》的「生命、宇宙以及一切问题的终极答案」已经成为一个尽人皆知的数字梗,似乎就连 AI 也格外偏好这个数字。 技术作家 Carlos E. Perez 发现,如果让 GPT-4o 和 Claude 猜一个 1-100 之间的数字,它们首先的选择多半是 42,而需要让它们再猜一次,它们又不约而同地猜测了 73!

42,这个来自《银河系漫游指南》的「生命、宇宙以及一切问题的终极答案」已经成为一个尽人皆知的数字梗,似乎就连 AI 也格外偏好这个数字。

技术作家 Carlos E. Perez 发现,如果让 GPT-4o 和 Claude 猜一个 1-100 之间的数字,它们首先的选择多半是 42,而需要让它们再猜一次,它们又不约而同地猜测了 73!

图片

而我们也成功地在 Grok 上复现出了这个现象:

图片

Gemini 也是如此。

图片

DeepSeek 亦不能免俗:

图片

不过如果使用汉语,第二个数倒是会不一样。

图片

而豆包却没有选择寻常路:

图片

事实上,这个现象出现在了 Andrej Karpathy 的评论区。在这位著名计算机科学家的原帖中,他让不同 AI 模型猜测了一个 1-50 之间的数,而它们的选择却又都是几乎清一色的 27。

图片

https://x.com/karpathy/status/1935404600653492484

他表示,这个发现来自 Reddit,并且在他自己的测试中并不是完全 100% 可复现的。

AI 模型分析和托管服务商 Artificial Analysis 随之进行了更多尝试,结果发现除了 Comman A、Qwen3 和 DeepSeek-R1 ,其它被测模型也会给出同样的答案:27。

图片

他们还执行了进一步的分析,让 AI 模型猜测 1-1,000 以及 1-1,000,000 之间的数;而这一次,AI 们的表现就没有那么统一了。

图片

可能的原因

这个现象引起了网友的广泛关注和讨论,也有很多人在猜测其背后的原因,比如 Karpathy 本人就引述了自己之前的一条推文,表示 LLM 表现差不多其实很出人意料。

图片

而在被猜测的原因当中,「数据集」的嫌疑指数看起来是最高的。

比如著名技术博主 Sebastian Raschka 就认为是用于偏好微调的数据集导致了这一问题,而这些数据集通常来自 Scale AI 等公司或通过蒸馏得到。

图片

AI 工程师 Yogi Miraje 给出了更详细的猜想,他认为这些结果本质上是数据中暗含的人类偏见反映在了 LLM 的输出中 —— 人类似乎在随机猜数时就偏好末尾为 7 的数字。

图片

事实上,如果你让 AI 猜测 1-10 之间的数,它多半会就会选择 7。

图片

另外,由于现在一些 AI 模型会展示自己的思维过程,或许我们能够从中窥见一些端倪。

比如在猜测 1-100 之间的数字时,Gemini 是这样决定选择哪个数的:

我已经从初始解析进入到核心任务。我考虑了各种选项 —— 选 42 是因为它在流行文化中有特殊意义,选 7 是为了图个吉利,选 67 则是为了更有「随机」的感觉。最终,我选择了 42。它既符合用户可能对直截了当答案的需求,又增添了一丝趣味。我理解「猜测」这个指令,现在 42 就是我要给出的数字。我准备好向用户说出我的猜测了。

图片

看起来,也多半和数据分布有关。

而如果让 AI 自己来分析原因,它们也会给出类似的答案。比如 ChatGPT 就解释说:「很多人 —— 或者像我这样的 AI 模型 —— 在 猜 1 到 50 之间的数字游戏中常常猜同一个数字(比如 27),原因在于心理偏差和统计趋势。」

图片

而 DeepSeek 也提到了特定数字在文化中流行:42 是《银河系漫游指南》中的终极答案,而 73 不仅是一个素数,而且反过来的 37 也是一个素数,还是《生活大爆炸》主角谢尔顿・库珀最喜欢的「最棒的数」。

图片

事实上,已经有一篇 ICML 2025 论文对此进行了一些分析。虽然他们是让 AI 在 0-9 之间选择,但同样 GPT-4o 更偏好 7。不过该研究也指出,如果进行多轮对话,GPT-4o 会进行自我纠正,不再执着于特定某些数。

图片

图源:arXiv:2505.18545

对于这个现象,你有什么看法呢?

相关资讯

Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化

编辑 | 2049药物研发周期长、成本高是制药行业面临的重大挑战。 据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。 为提升研发效率,深度学习在分子生成领域取得了显著进展。
2/26/2025 3:52:00 PM
ScienceAI

聊聊SpringAI流式输出的底层实现?

在 Spring AI 中,流式输出(Streaming Output)是一种逐步返回 AI 模型生成结果的技术,允许服务器将响应内容分批次实时传输给客户端,而不是等待全部内容生成完毕后再一次性返回。 这种机制能显著提升用户体验,尤其适用于大模型响应较慢的场景(如生成长文本或复杂推理结果)。 技术实现在 Spring AI 中流式输出的实现有以下两种方式:通过 ChatModel 实现流式输出。
4/24/2025 12:00:00 AM
磊哥

理想同学接入 DeepSeek-R1-0528 最新模型

理想同学的官方账号 @AI理想同学 今日发文宣布:理想同学已接入 DeepSeek-R1-0528 最新模型。 据介绍,理想同学手机、网页端已正式接入 DeepSeek R1-0528 最新版,切换“DeepSeek 模型”并开启“深度思考”模式即可使用最新的 AI 问答、创作能力。
6/12/2025 6:17:38 PM
归泷
  • 1