AI 为何能查天气、订机票？揭秘大模型背后的“神秘工具箱”

作者：红绿灯灯灯灯 2025-07-15 09:44

你有没有想过，为什么 AI 能回答“今天上海天气怎么样？ ”这种实时问题，甚至帮你预订机票？明明它的训练数据截止到去年，怎么会对现在的事情了如指掌？

你有没有想过，为什么 AI 能回答“今天上海天气怎么样？”这种实时问题，甚至帮你预订机票？明明它的训练数据截止到去年，怎么会对现在的事情了如指掌？

答案就藏在一个核心技术里——工具调用（Tool Calling）。

简单说，工具调用就是让大模型在遇到自己搞不定的问题时，能像我们一样，打开一个“工具箱”，借用外部工具来完成任务。

这个“工具箱”里什么都有：网页搜索、计算器、API 调用、数据库查询……任何能帮它完成特定任务的，都可以是它的工具。

目前，工具调用技术已经相当成熟，几乎所有主流的 AI 大模型和开发平台都已支持。

AI 真的会“自己”调用工具吗？

一听到“工具调用”，很多人会误以为是 AI 服务器自己去执行了某个工具。

大错特错！

真相是：AI 只负责“提要求”，而真正干活的，是我们自己的应用程序。

整个过程更像是一个分工明确的团队协作。我们以“什么是 MCP？”这个问题为例，看看团队是如何配合的：

1. 用户：提出问题：“什么是 MCP？”

2. 程序（项目经理）：将问题转达给 大模型（技术专家）。

3. 大模型（技术专家）：分析后发现知识库里没有，判断需要上网搜索，于是向程序提要求：“我需要用「网页抓取工具」查一下，关键词是 MCP”。

4. 程序（项目经理）：收到请求，立刻安排 网页抓取工具（实习生） 去执行。

5. 网页抓取工具（实习生）：勤勤恳恳地完成抓取，把数据返回给程序。

6. 程序（项目经理）：将抓取到的信息整理好，再次交给 大模型（技术专家）。

7. 大模型（技术专家）：阅读信息，总结提炼，生成一份通俗易懂的回答。

8. 程序（项目经理）：最后，将这份完美的答案呈现给用户。

复制

看明白了吗？AI 只是“大脑”，负责思考和决策，而我们的应用程序才是“手脚”，负责执行和落地。

为什么要设计得这么“麻烦”？

你可能会问：为什么不让 AI 直接调用工具，一步到位？这样来回传递不浪费时间吗？

这背后最重要的考量是——安全！

这种设计确保了 AI 永远无法直接触碰你系统的核心资源。所有操作都必须经过你程序的“批准”，你拥有绝对的控制权，可以决定 AI 能做什么，不能做什么。

举个极端点的例子：假如你开发了一个“房屋爆破”工具。

现在的方式：用户对 AI 说“帮我把这栋楼炸了”。AI 分析后，会向你的程序申请：“我需要使用「房屋爆破」工具”。这时，你的程序可以立刻拒绝这个危险请求，从而避免灾难。
如果 AI 直接调用：AI 觉得这个需求很合理，直接就执行了。等你反应过来，房子可能已经没了。

把决定权留在我们自己手里，既能利用 AI 的智慧，又能保证系统的安全，还能减轻 AI 服务器的负担，何乐而不为呢？

工具调用 vs 功能调用

如果你在看技术文档时遇到 Function Calling（功能调用） 这个词，别懵，它和 Tool Calling（工具调用） 说的完全是同一件事！只是不同厂商或开发者习惯的叫法不同。

Spring AI 的官方文档开篇就明确了这一点：

我个人更喜欢“工具调用”这个说法，因为它更形象。“Function”一听就像是程序员的黑话，而“工具”则更加通俗易懂，不是吗？

好了，今天关于“工具调用”的分享就到这里。

希望这篇文章能帮你彻底搞懂 AI 是如何借助外部力量变聪明的。

OpenAI研究人员发现，AI无法解决大多数编程问题

2月24日消息，据外媒报道，OpenAI的研究人员承认，即使是最先进的AI模型仍然无法与人类程序员匹敌，尽管首席执行官山姆·奥特曼(Sam Altman)坚称，到今年年底，他们将能够击败“低级”的软件工程师。在一篇新论文中，该公司的研究人员发现，即使是前沿模型，或最先进、最具突破边界的人工智能系统，“仍然无法解决大多数”编码任务。研究人员使用了一种名为sw-lancer的新开发基准，该基准基于自由职业者网站Upwork的1400多个软件工程任务。

2/25/2025 10:21:12 AM Yu

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

在关于大模型应用方面，虽然也了解和应用过其中的一些技术；但经过这段时间的实践和思考发现，对大模型应用的认识还很浅显，因此在此记录一下自己的思考。大模型应用的思考大模型作为人工智能应用的底座技术，所有应用场景和技术都是构建在大模型之上；但很多时候我们都搞错了一件事，那就是我们没有搞清楚大模型能力和其它技术的关联和区别。因此，在这里我们要搞清楚一个概念，那就是大模型能力；所谓大模型的能力，就是模型开发人员怎么把模型做的更好更强，其中设计到模型的设计，训练等；具体有神经网络架构，模型蒸馏等等。

4/2/2025 8:40:00 AM DFires

揭秘大模型的魔法：从零开始你的AI冒险

你好，我是写代码的中年人！你有没有想过，那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事？它们其实是“大型语言模型”（Large Language Models，简称 LLM）的产物。

4/17/2025 9:00:00 AM 写代码的中年人

AI 为何能查天气、订机票？揭秘大模型背后的“神秘工具箱”

AI 真的会“自己”调用工具吗？

为什么要设计得这么“麻烦”？

工具调用 vs 功能调用

相关资讯

OpenAI研究人员发现，AI无法解决大多数编程问题

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

揭秘大模型的魔法：从零开始你的AI冒险