AI在线 AI在线

企业为何纷纷转向小AI模型?

当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。 大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。 相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。

企业为何纷纷转向小AI模型?

当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。

大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。

分析师告诉记者,虽然过去几年大型语言模型在企业中更为普遍,但轻量级模型已逐渐受到关注,并且其商业应用预计今年将进一步增加。

“代理模型和推理模型将是主要话题……但小型语言模型是整体商业价值讨论中的重要部分。”Gartner杰出副总裁分析师Arun Chandrasekaran表示。

对于小型AI模型的定义,众说纷纭。一些人根据参数数量来定义小型语言模型,其参数数量通常在数千万至数十亿之间,而大型语言模型的参数数量则达到数百亿或数千亿。

“我认为,理想的参数范围在10亿至100亿之间,”Chandrasekaran说。“在过去6到12个月里,至少50%的企业已经积极研究了参数范围在10亿至100亿之间的模型,以用于其应用场景。”

其他人则更少地基于模型大小来定义小型模型,而更多地关注开发方法,如通过蒸馏法。Forrester预测,随着拥有行业特定术语的企业寻求利用具有特定领域专业知识的模型,这种小型语言模型的集成今年将激增60%以上。

不同的定义可能会让CIO和采购团队感到困惑。

“小型语言模型并没有任意的规模界限,这确实使得这个领域非常令人困惑。”Forrester高级分析师Rowan Curran表示。

小型AI模型的供应商选项众多。谷歌的轻量级Gemma模型系列已推出近一年。微软推出了一系列名为Phi的小型模型,其中最新的Phi-4于去年12月向客户推出。OpenAI在1月底发布了o3-mini,此前该初创公司已于去年夏天推出了GPT-4o mini。

“构建大型模型的公司也在构建小型模型。”Chandrasekaran说。

企业的吸引力

小型AI模型与其大型同类模型一样,既有优势也有局限。

Curran表示,具有专业术语的行业和企业,如医疗保健或医疗器械零售商,是小型模型发展的理想领域。Forrester发现,约三分之一的技术决策者在购买时优先考虑特定领域的GenAI能力。

小型模型通常使用较少的计算能力,从而降低了资源紧张企业的成本。由于预算限制、技能差距和计算能力可用性,超过三分之一的公司已将AI项目推迟了三个月至半年。

小型模型在设备端、本地和云端都具有成本效益。例如,OpenAI表示,其GPT-4o mini的成本比GPT-3.5 Turbo低60%以上。在本地或私有云部署上运行的小型模型还可以缓解CIO对安全和隐私的担忧。

联合国教科文组织等组织已推广小型模型作为更环保的计算替代方案。

尽管人们希望GenAI最终能推动企业更接近可持续发展目标,但企业在控制支持AI计划所需资源方面一直面临挑战。根据谷歌的年度报告,随着计算强度和技术基础设施投资的增加,其温室气体排放量去年也有所上升,自2019年以来增长了48%。

Constellation Research的副总裁兼首席分析师Andy Thurai表示,虽然小型模型有其优势,但它们并非所有用例的最佳选择。

相关资讯

研究表明:AI工具能悄无声息地改变我们的观点

大型语言模型,那些能对我们的提示给出人类回答的智能聊天机器人,会影响我们的观点吗? 《IEEE智能系统》杂志中描述的一项实验表明,答案是肯定的。 这项研究的影响对教师批改论文、员工评估以及许多其他可能影响我们生活的情况都有深远意义。
2/12/2025 8:30:00 AM
Yu

当AI更加理解人类语言可能预示提示工程终结

多年来,大型语言模型(LLM)的兴起要求用户学习一种新技能:提示工程。 为了得到人工智能有用的回应,人们不得不精心设计他们的查询问题,学习人工智能如何理解语言的细微差别。 但这种情况可能正在发生变化。
2/24/2025 2:03:43 PM
AI情报室

人工智能的深远影响不仅仅是失业:数字幽灵的神秘力量

人工智能正在改变日常生活,从个人助理和推荐算法到高级生成模型。 但最深刻的变化可能是我们未曾预料到的。 虽然新闻头条往往聚焦失业或隐私问题,但人工智能的影响远不止这些。
3/10/2025 10:30:08 AM
晓晓
  • 1