AI在线 AI在线

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。

在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。首先,IBM 在 “按需部署”目录中提供了 Llama 蒸馏版,用户可部署专用实例以确保安全推理。其次,用户还可以通过 “自定义基础模型” 导入功能,上传 DeepSeek-R1的其他变体,例如 Qwen 蒸馏模型,从而满足多样化的应用需求。

DeepSeek

DeepSeek-R1具备强大的推理能力,适用于广泛的领域,为企业和开发者提供了高效且灵活的 AI 解决方案。此次更新进一步丰富了 watsonx.ai的模型生态系统,助力用户更便捷地开发和部署 AI 应用。

相关资讯

​IBM 与联想携手推进沙特阿拉伯生成式人工智能发展

在近期举行的 LEAP2025大会上,IBM 与联想宣布将进一步扩大两家公司之间的战略技术合作关系,旨在提升生成式人工智能在沙特阿拉伯的应用与影响力。 根据 IDC 的预测,到2026年,全球在人工智能相关系统上的年度支出将超过3000亿美元,沙特阿拉伯的众多领先组织也正在积极探索和投资生成式人工智能的应用场景,以应对即将到来的 “人工智能无处不在” 时代。 图源备注:图片由AI生成,图片授权服务商Midjourney此次合作将基于 IBM 与联想之间长达20年的伙伴关系,双方计划共同推出一系列 AI 解决方案。
2/11/2025 2:08:00 PM
AI在线

IBM 在纽约市推出全新 AI 创新中心,助力企业智能化转型

IBM 最近宣布在纽约市设立全新的 watsonx AI Labs 创新中心,旨在 “提升” AI 技术的开发速度并加速其大规模应用。 该实验室位于 IBM 位于曼哈顿的办公室,旨在连接 AI 开发者和初创企业,与 IBM 的研究人员和工程师网络合作,支持企业级智能 AI 系统的发展。 watsonx AI Labs 将重点解决日常商业挑战,包括客户服务、供应链优化、网络安全、负责任的 AI 治理以及开源 AI 等领域。
6/4/2025 11:00:55 AM
AI在线

一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

开源大模型领域,又迎来一位强有力的竞争者。近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。项目地址::DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V2 参数量达 236B,其中每个 token 激活 21B 参数,支持 128K token 的上下文长度。与
5/7/2024 2:26:00 PM
机器之心
  • 1