资讯列表
Meta 新模型 Llama-4-Maverick 排名骤降,引发刷榜质疑
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交特供版本以刷榜。 事情的起因要追溯到4月6日,Meta 发布了其最新的大模型 Llama4,包括 Scout、Maverick 和 Behemoth 三个版本。 其中,Llama-4-Maverick 在初期的评估中表现亮眼,位列 LMArena 排行榜的第二名,仅次于 Gemini2.5Pro。
4/14/2025 6:01:07 PM
AI在线
AI诺曼底时刻的“技术破壁者”:九章云极DataCanvas公司亮相2025 AI算力产业大会
当前,AI技术正在重构全球经济发展格局与人类生活方式,“存算一体”“云边端协同”绿色低碳”等前沿AI技术正从概念走向落地,催生智能制造、智慧城市、生命科学等领域的突破性应用。 当AI应用迎来突破性发展的“诺曼底”时刻,谁才是智能时代的“技术破壁者”? 在2025 AI算力产业大会,剑指当前AI算力产业成本高企、技术门槛高、供需错配三大痛点,九章云极DataCanvas公司以“弹性调度 智能开发 资源普惠”的全栈技术布局,给出了自己的“破壁答卷”。
4/14/2025 5:33:00 PM
新闻助手
商汤大装置SenseCore 2.0全新升级 推出1亿元代金券计划
4月14日,在北京举办的2025商汤技术交流日上,商汤科技正式宣布其大装置SenseCore2.0全面升级。 作为AI基础设施领域的领军者,商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务,以极致性价比推动大模型技术的高效落地与规模化应用。 商汤大装置SenseCore2.0的升级,旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及多模态技术带来的新场景需求。
4/14/2025 4:01:07 PM
AI在线
高德发布 AI 导航智能体:高速驾车场景下可感知车道级交通流变化、事件事故
据技术负责人介绍,其核心架构采用Planner-Executor模式,通过感知、规划、执行、表达四大模块构建智能闭环,集成多项高德核心技术。
4/14/2025 3:45:54 PM
清源
Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌,此前被质疑刷榜作弊
Meta最新开源大模型Llama-4-Maverick在LMArena排名从第2名暴跌至第32名,开发者质疑Meta提供特供版刷榜。Chatbot Arena官方确认Meta提交的是实验性优化版本,与开源版不同。#Meta大模型##AI刷榜#
4/14/2025 3:07:43 PM
远洋
Lazada 推出全新 AI 助手 Lazzie Seller,助力商家提升运营效率
阿里巴巴旗下的东南亚电商平台 Lazada 宣布推出一款全新的 AI 助手 ——Lazzie Seller,旨在为商家提供更为高效的运营支持。 Lazzie Seller 的推出标志着 Lazada 在电商领域进一步整合人工智能技术,以提升商家的运营效率。 Lazzie Seller 是基于 Lazada 多年来在电商运营方面的经验,采用自然语言处理技术,能够快速回答商家的各种运营问题,包括功能导航、店铺风险评估以及提供专业建议等。
4/14/2025 3:01:07 PM
AI在线
清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM,让小模型超越 GPT-4o
在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。 然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。 为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。
4/14/2025 3:01:07 PM
AI在线
伦敦AI创意工作室 Wonder 获 300 万美元融资 ElevenLabs、OpenAI负责人参与投资
近日,位于伦敦的创意工作室 Wonder 宣布成功获得300万美元的种子轮融资,融资由 LocalGlobe 领投,其他投资者包括澳大利亚风险投资公司 Blackbird、AI 语音初创公司 ElevenLabs 的联合创始人 Mati Staniszewski、OpenAI 初创团队负责人 Laura Modiano、以及谷歌 DeepMind 的设计负责人 Ammaar Reshi 等。 这家工作室致力于利用人工智能技术制作娱乐和广告领域的电影。 图源备注:图片由AI生成,图片授权服务商MidjourneyWonder 的创始人 Justin Hackney 是一位获得 BAFTA 奖的电影制片人,曾担任 ElevenLabs 的创意总监,而 CEO Xavier Collins 则是专注于收购动作电影知识产权的风险投资公司 Lumiere Ventures 的创始合伙人。
4/14/2025 3:01:07 PM
AI在线
顶级生成式AI用例揭晓:营销任务排名较低
根据最新的研究,生成性人工智能(Gen AI)在市场营销领域的应用远不如个人使用那么普遍。 一份由 Marc Zao-Sanders 发布的《Top-100Gen AI Use Case》报告显示,尽管人们在日常生活中越来越多地利用 AI 来获得情感支持,市场营销的相关任务,如广告创作和社交媒体内容生成,却位居使用排名的后列。 报告分析了人们对生成性 AI 的使用情况,并指出,过去一年中,使用重点从技术驱动转向了以情感和个人福祉为中心的应用。
4/14/2025 3:01:07 PM
AI在线
亚马逊推出新一代智能AI助手,开启家居生活新篇章
亚马逊近期推出了一款名为 “Nova Act” 的智能代理 AI 系统,旨在彻底改变我们在家中与技术互动的方式。 这一新兴的技术不仅能够执行复杂任务,还能更自主地操作,未来可能在市场上超越 OpenAI 和 Anthropic 等竞争对手。 随着家庭中越来越多的智能设备的普及,智能代理 AI 的出现将极大地简化我们与技术交互。
4/14/2025 3:01:07 PM
AI在线
阿里巴巴旗下Lazada推出AI助理Lazzie Seller助力商家运营
阿里巴巴集团旗下东南亚电商平台Lazada于4月14日宣布推出人工智能助理Lazzie Seller,旨在提升商家的运营效率和市场竞争力。 这款AI助理基于Lazada在电商运营领域的深厚积累,利用自然语言处理技术,能够快速回应商家在日常运营中遇到的各种问题。 其核心功能包括功能导航、店铺风险评估以及提供专业建议等,有效帮助商家降低运营成本。
4/14/2025 2:01:07 PM
AI在线
Google AI Studio开放Veo 2视频模型有限免费试用
人工智能视频生成技术持续掀起热潮。 近日,AIbase从社交媒体获悉,Google AI Studio已开始向部分用户开放其先进的Veo2视频模型有限免费试用。 这一消息引发了广泛关注,尽管试用次数受限且冷却时间尚未明确,Veo2的强大性能仍令人期待。
4/14/2025 2:01:07 PM
AI在线
清华大学推出全新 AI 辅修学位,助力学科交叉创新
根据最新消息,清华大学在经历了适度扩招和新书院的成立后,将于今年秋季学期推出一项全新的 AI 辅修学位。 这一举措旨在吸引有志于将人工智能与各自学科相结合的学生,通过系统的课程设置,帮助他们掌握 AI 相关的知识和技能。 图源备注:图片由AI生成,图片授权服务商Midjourney新设的 AI 辅修学位将对校内所有有意愿探索学科与人工智能交叉领域的学生开放。
4/14/2025 2:01:07 PM
AI在线
WOT大会7月北京启幕!12大AI主题诚征议题和嘉宾
WOT全球人工智能技术峰会是由51CTO开创的面向人工智能领域的高端技术会议品牌,它与另一大会品牌WOT全球技术创新大会一道,自2012年首次举办以来,历时十余年沉淀,累计吸引超过万名技术人员现场参与,同时吸引了数百家国内外知名科技企业和行业龙头、近千位技术领军人物深度合作。 ChatGPT引爆的热潮没有丝毫减缓之势,而DeepSeek又给这一热度添了一把火。 伴随大模型的快速迭代、持续演进,生成式AI技术从理念到实践,从应用落地到产品百花齐放,创新速度之快令人瞩目,这也正是WOT全球人工智能技术峰会2025召开的目的和初衷。
4/14/2025 1:55:31 PM
10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?
从 ChatGPT 引发认知革命到 GPT-4o 实现多模态跨越,AI 技术的每次跃迁都在印证一个底层逻辑 —— 数据质量决定智能高度。 而今,这场 AI 浪潮正在反哺数据库领域,推动其从幕后走向台前,完成智能时代的华丽转身。 在 DB AI 的舞台上,作为分布式数据库的领军者, OceanBase 正凭其一体化架构重新定义 AI 原生数据库。
4/14/2025 1:52:00 PM
机器之心
OpenAI CEO 奥尔特曼:DeepSeek 并未影响 GPT 的增长,将推更好的开源模型
OpenAI CEO萨姆・奥尔特曼在TED 2025上表示,DeepSeek的出现并未影响GPT的增长,并透露将推出更好的开源模型。ChatGPT在2025年3月成为全球下载量最高的非游戏应用。OpenAI计划在未来几个月内发布自GPT-2以来的首个开源语言模型。#OpenAI##人工智能#
4/14/2025 1:51:51 PM
远洋
更长思维并不等于更强推理性能,强化学习可以很简洁
今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。 他写到:「众所周知,推理模型通常会生成较长的响应,这会增加计算成本。 现在,这篇新论文表明,这种行为源于强化学习的训练过程,而并非更高的准确度实际需要更长的答案。
4/14/2025 1:46:00 PM
机器之心
过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o
赵俭,北京邮电大学本科三年级,研究方向为大语言模型。 刘润泽,清华大学硕士二年级,师从李秀教授,研究方向为大语言模型与强化学习,特别关注大模型推理能力增强与测试时间扩展,在 NeurIPS、ICML、ICLR、AAAI 等顶级学术会议发表多篇论文,个人主页:ryanliu112.github.io。 随着 OpenAI o1 和 DeepSeek R1 的爆火,大语言模型(LLM)的推理能力增强和测试时扩展(TTS)受到广泛关注。
4/14/2025 1:41:00 PM
机器之心