AI在线 AI在线

研究称,流行的人工智能基准 LMArena 据称有利于大型供应商

Salesforce AI Research发布多项创新,旨在解决企业AI系统在强大智能与稳定执行力之间的差距,即“锯齿状智能”。 核心目标是构建更智能、可信、适用于企业应用的AI代理,并向“企业通用智能”(EGI)迈进。 研究重点在于量化和解决AI性能不一致性,推出了SIMPLE数据集作为公开基准。

Salesforce AI Research发布多项创新,旨在解决企业AI系统在强大智能与稳定执行力之间的差距,即“锯齿状智能”。核心目标是构建更智能、可信、适用于企业应用的AI代理,并向“企业通用智能”(EGI)迈进。

研究重点在于量化和解决AI性能不一致性,推出了SIMPLE数据集作为公开基准。更重要的是,Salesforce推出了CRMArena,一个模拟真实CRM场景的基准测试框架,用于全面评估AI代理在服务、分析和管理等角色中的表现。早期测试显示,现有领先AI座席在函数调用成功率方面仍有提升空间。

人工智能 AI教育

在模型层面,Salesforce发布了SFR-Embedding,一种在文本嵌入基准测试中领先的新模型,旨在更深入地理解上下文。同时推出了针对代码搜索优化的SFR-Embedding-Code。此外,还推出了xLAM V2(大型动作模型),专注于预测和执行任务序列,尤其适用于需要与企业系统交互的自主代理。

为解决企业对AI安全性的担忧,Salesforce推出了SFR-Guard模型,增强了其信任层,为AI代理的行为提供保障。同时推出了ContextualJudgeBench,用于评估基于LLM的判断模型。在多模态领域,推出了TACO模型,通过思维行动链解决复杂的多步骤问题,并在相关基准测试中取得显著性能提升。

Salesforce强调与客户的共同创新,客户反馈是塑造企业AI路线图的关键。通过应用Atlas推理引擎等先进技术,AI性能已得到显著提升。

Salesforce的研究正值企业加速采用AI的关键时刻,其关注点在于将先进功能与可靠性能相结合。与追求更大模型的行业趋势不同,Salesforce更侧重于解决现实世界的业务需求。相关技术将在未来几个月内逐步推出,首先应用于数据云,并为Agentforce的未来版本提供支持。Salesforce认为,在企业AI竞争中,一致性和可靠性将最终胜出。

相关资讯

对标 GPT-4,消息称 Meta 最快下周发布两款 Llama 3 模型

感谢科技媒体 theinformation 近日发布博文,表示 Meta 公司将于下周预告两款 Llama 3 AI 模型,为今年夏季推出“完整形态” Llama 3 铺垫。Meta 公司本周二在伦敦举办的一场活动中,确认会在下个月之前发布 Llama 3 相关模型。IT之家翻译 Meta 公司全球事务总裁尼克・克莱格(Nick Clegg)采访内容如下:我希望下个月或者更短时间内,能够推出下一代 Llama 3。我们计划今年推出一系列具有不同功能、不同通用性的模型。Meta 首席产品官 Chris Cox 补充说
4/10/2024 10:20:29 AM
故渊

山姆・阿尔特曼眼球扫描加密项目推出 Orb 新品:在 AI 时代验证某人是否为人类

科技媒体 The Verge 今天(10 月 19 日)发布博文,报道称 Worldcoin 公司现已更名为 World,并推出了增强版研究扫描 Orb 设备。World 公司由 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)共同创立,主要在加密货币、人类身份网络等领域发展。该公司最新推出了 Orb 设备,旨在解决一个目前并不存在的问题:在“人工智能时代”验证某人是否为人类。
10/19/2024 2:51:47 PM
故渊

Salesforce CEO 炮轰微软 AI 战略:把 ChatGPT 包装成 Copilot,令客户失望

Salesforce 首席执行官马克・贝尼奥夫(Marc Benioff)在多个场合对微软的 AI 提出批评。贝尼奥夫认为,微软在 AI 领域对整个行业造成了“巨大的伤害”,并把微软的 Copilot 比作新的“大眼夹”(Microsoft Clippy,一款曾因功能不佳而被用户诟病的办公助手),暗示 Copilot 没有用或无法为用户创造价值。
3/13/2025 6:23:55 PM
远洋
  • 1