AI在线 AI在线

加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

加拿大AI初创公司Cohere发布轻量级AI模型Command A,仅需两块英伟达A100/H100 GPU即可部署,支持256k上下文长度和23种语言,性能媲美GPT-4o,适合中小型企业。 #AI技术 #轻量级AI

加拿大 AI 初创公司 Cohere 昨日发布了一款名为“Command A”的 AI 模型,该模型主打轻量化应用,号称只需要两块英伟达 A100 或 H100 GPU 即可轻松部署,号称“表现能和 GPT-4o 相媲美”,实现“用最少的硬件发挥最大的性能”。

加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

Cohere 表示,Command A 专门为中小型企业环境设计,其支持 256k 的上下文长度和 23 种语言,作为比较,其他竞争对手的“同类模型”需要 32 块 GPU 才能部署。

在性能测试中,Command A 最快每秒可以输出 156 个 Token,据称比 GPT-4o 快 1.75 倍。而在指令追踪、SQL、代理程序和工具任务的基准测试上,Command A 也表现出色。

加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

Cohere 援引相应性能数据,声称业界的大语言模型如果“规模过大”,反而在输出结果时可能会出现严重的延迟问题;如果只是想快速得到正确答案,Command A 相对是个不错的选择。

目前,Cohere 已将相应 Command A 发布在 Hugging Face 平台(点此访问),对学术界开放使用,未来还会登陆其他云服务平台。

相关资讯

350亿参数、开放权重,Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。今天,由 Transformer 作者之一 Aidan Gomez 参与创立的人工智能初创公司 Cohere 迎来了自家大模型的发布。Cohere 推出的模型名为「Command-R」,参数量为 35B,它是一个针对大规模生产工作负载的全新大语言模型研究版本。该模型属于「可扩展」模型类别,能够平衡高效率和高精度, 使企业用户超越概念验证,
3/12/2024 2:25:00 PM
机器之心

AI Programming Tools Gradually Shift to Terminal Interface, Future Development May Be Transformed Completely!

Recently, with the rapid development of artificial intelligence (AI) technology, the way programming tools are used has undergone significant changes. Not long ago, code editing tools like Cursor, Windsurf, and GitHub's Copilot were the mainstream of AI-driven software development. However, with the rise of "autonomous agent AI" and the popularity of "ambient programming," the way AI systems interact with software has quietly changed.
7/17/2025 3:51:41 AM
AI在线

​Cohere发布全新多模态AI模型Aya Vision,提供32B和8B两个版本

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。 该实验室声称,该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。
3/6/2025 2:54:00 PM
AI在线
  • 1