谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

作者：故渊 2024-12-20 07:58

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

该模型不仅能够解答复杂问题，还能模仿人类逐步推理，展现其“思考”步骤，这一创新功能有望革新 AI 领域，和 OpenAI 的 o1 推理模型展开竞争。AI在线附上相关演示如下：

Google DeepMind 首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤解决物理问题；而 Google 产品负责人 Logan Kilpatrick 展示了模型如何处理包含图像和文本信息的推理问题。

该模型基于 Gemini 2.0 Flash 的速度和性能构建，在 Chatbot Arena LLM 排行榜上，Gemini 2.0 Flash Thinking 模型在所有类别中均排名第一，较之前的 Gemini-2.0-Flash 模型有显著提升，尤其在“硬提示”和“视觉”两项分别提升了 14 分和 16 分。

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

该模型目前已在 Google AI Studio 和 Vertex AI 平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到 Gemini 2.0 系列的主要模型中。

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

长上下文大模型帮助机器人理解世界。最近，谷歌 DeepMind 突然开始炫起了机器人。这个机器人可以轻松听从人类指令、进行视觉导览，用常识推理在三维空间中寻找路径。它使用的是最近谷歌发布的大模型 Gemini 1.5 Pro。在使用传统 AI 模型时，机器人常因上下文长度限制而难以回忆起环境细节，但 Gemini 1.5 Pro 的百万级 token 上下文长度为机器人提供了强大的环境记忆能力。在真实的办公室场景中，工程师引导机器人游览特定区域，并标出了需要回忆的关键地点，例如「刘易斯的办公桌」或「临时办公桌区域」

7/15/2024 11:16:00 AM 机器之心

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

“最开始我就知道谷歌相当有希望，谷歌能发展到现在的规模不过是水到渠成。 ”这位谷歌首席科学家在谷歌度过了近乎一半的人生，对谷歌的喜爱不减反增，到现在还依然坚守着谷歌最初的愿景并为此奋斗：组织全球信息并使其普遍可用和有用Jeff Dean 还记得刚加入谷歌的时候，每到周二的流量高峰期就开始担心系统会不会崩溃，还好后来及时增加了设备，对代码和搜索功能做了更多优化，谷歌搜索这才步入了正轨。后来吴恩达在谷歌担任顾问，Jeff Dean 和他商定了大型神经网络的研究目标，最终促成了 Google Brain 团队的成立。

9/19/2024 10:38:00 AM 刘洁

DeepMind夺得IMO官方「唯一」金牌，却成为OpenAI大型社死现场

刚刚，谷歌 DeepMind 宣布，其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平，成功解决了六道超高难度试题中的五道，拿下 35 分（满分 42 分），成为首个获得奥赛组委会官方认定为金牌的AI系统。更重要的是，该系统首次证明人工智能无需依赖专业编程语言，仅通过自然语言理解即可攻克复杂数学难题。谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调：这是官方结果！

7/22/2025 1:22:00 PM 机器之心

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

相关资讯

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

DeepMind夺得IMO官方「唯一」金牌，却成为OpenAI大型社死现场