AI在线 AI在线

资讯列表

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型,适配苹果全家桶!千问打入苹果生态,国行版苹果智能即将落地?!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“源神”千问,又一次闷声干大事! 今天刷 Reddit 才发现:昨晚,阿里千问一口气开源了 32 款,适配苹果 MLX 架构的 Qwen3 模型。 没错,32 款,就是这么量大实惠。
6/17/2025 5:54:25 PM
伊风

AI助燃数字创新 SUSE Summit 2025创新峰会隆重召开

2025年6月13日 全球开源解决方案领导者SUSE在北京隆重举办了SUSE Summit 2025创新峰会。 本次峰会以“AI开源智选 助燃数字创新”为主题,汇集了行业领袖、技术专家以及众多合作伙伴,深入探讨在生成式AI浪潮下,如何基于SUSE开源模式,利用各种新功能和新技术拨开重重迷雾,快速实现企业级AI创新。 SUSE大中华区总裁陈毅威在新质生产力不断涌现的时代背景下,SUSE中国战略稳步推进。
6/17/2025 5:41:47 PM

反转!AI 推理能力遭苹果质疑后,Claude 合著论文反击:不是不会推理,是输给 Token

近日,Apple 机器学习研究团队发布了一篇名为《思考的幻觉(The Illusion of Thinking)》的论文。 图片这篇 53 页的技术报告并非普通评测,而是一记质疑当下主流 LLM 推理能力的重锤。 研究者们指出,OpenAI 的“o”系列、Google 的 Gemini 2.5、以及 DeepSeek-R 等所谓“推理型大模型”,本质上并没有从训练数据中学习到可泛化的第一性原理。
6/17/2025 5:19:31 PM

LLM 翻车现场!ChatGPT 挑战 1979《Video Chess》惨败:连车马象都认错

一场 ChatGPT 对战 Atari 2600 的象棋对局火了。 具体而言,在一场看似轻松的“AI玩具对决”里,ChatGPT输给了Atari 2600 的象棋引擎,对手只是一台48年前、频率1.19 MHz的8位主机。 图片起初,这只是Robert Jr.
6/17/2025 5:16:51 PM

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了? ? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。
6/17/2025 5:14:01 PM

​Poe平台上线即梦3. 0 图像模型与Seedance 1.0 Lite视频模型

Poe平台正式上线由字节跳动(ByteDance)研发的即梦3.0图像生成模型(Seedream3.0)与Seedance1.0Lite视频生成模型,为全球用户带来更高效、更高质量的多模态内容创作体验。 这一更新标志着Poe在图像与视频生成领域的进一步突破,为创作者提供了从静态图像到动态视频的无缝创作流程。 即梦3.0:图像生成新标杆即梦3.0(Seedream3.0)作为字节跳动旗下火山引擎的最新图像生成模型,以其出色的画质与语义理解能力引发行业关注。
6/17/2025 5:01:30 PM
AI在线

硅基流动上线全球首个开源大规模混合注意力推理模型 MiniMax-M1-80k

硅基流动(SiliconCloud)正式上线了全球首个开源的大规模混合注意力推理模型 ——MiniMax-M1-80k(456B)。 这一创新模型旨在为软件工程、长上下文理解和工具使用等复杂任务提供强有力的支持,并且在性能上可与目前顶尖的模型如 o3和 Claude4Opus 相媲美。 据悉,MiniMax-M1-80k 具备最大支持128K 的上下文长度,这为处理长文本提供了极大的便利。
6/17/2025 5:01:30 PM
AI在线

从“懂创作”到“超长待机”:百度文心大模型赋能数字人,助力电商营销变革

在近日举行的百度AI Day上,百度震撼宣布成功打造了业界首个超头主播罗永浩数字人,并同步发布了高说服力数字人的四大关键技术突破,旨在彻底革新直播营销和用户体验。 此次发布的第一项突破是上线了“业界首个”双数字人互动直播间,此举将显著提升营销转化率和C端用户体验,为未来的电商直播开辟了新的互动模式。 其次,基于文心4.5T的全面升级,百度数字人实现了“懂创作”和“有个性”的剧本模式,这意味着数字人能够更加智能地理解和执行复杂的直播脚本,展现出独特的风格和表现力。
6/17/2025 5:01:30 PM
AI在线

MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1

MiniMax 表示:M1 在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外的最领先模型,同时又有业内最高的性价比。
6/17/2025 4:31:40 PM
问舟

​前谷歌 CEO 投资的初创公司发布240亿参数化学推理模型,准确率超越多种领先模型

在人工智能领域,大模型的研究不断进展,尤其是在推理能力的提升上。 最近,由前谷歌 CEO 埃里克・施密特投资的初创公司 FutureHouse,开源了一个名为 ether0的化学任务推理模型,参数规模高达240亿。 这一模型在不需要额外领域预训练的情况下,通过后训练技术,展现出强大的化学领域能力,尤其是在数据需求上相比于传统领域专用模型显著减少。
6/17/2025 4:01:40 PM
AI在线

​月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面(Moonshot AI)宣布推出其新开源模型 Kimi-Dev-72B,这一模型专注于软件工程任务,并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。 Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。 在 SWE-bench Verified 测试中,Kimi-Dev-72B 获得了60.4% 的高分,成为当前开源模型中的新标杆。
6/17/2025 4:01:40 PM
AI在线

腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆

腾讯AI团队推出了一款令人振奋的AI唱歌模型LeVo,以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。 据悉,LeVo在多项关键指标上可媲美行业领先的Suno4.5,为中国AI音乐生成技术赢得一席之地。 AIbase整理最新信息,为您深度解析LeVo的突破性功能与潜力。
6/17/2025 4:01:39 PM
AI在线

突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star

港大、camel-ai 等多家机构联合提出了一种名为新的名为 Workforce 的创新多智能体框架,以及配套的 OWL(Optimized Workforce Learning)训练方法,在通用 AI Assistant 的标杆基准测试 GAIA 上取得了 69.70% 的准确率,不仅刷新了开源系统的最佳纪录,更是超越了多家商业系统以及 OpenAI Deep Research 的开源方案。 该研究成果所有代码均已开源,目前已经在 github 上收获了 17k 的 star。 论文标题:OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation论文地址:::多智能体系统的「领域壁垒」随着 LLM 的飞速发展,单一智能体在处理复杂现实任务时逐渐暴露出局限性。
6/17/2025 3:28:03 PM

同一天开源新模型,一推理一编程,MiniMax和月之暗面开卷了

同一天,国内大模型厂商扎堆发起了新模型。 AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。 其中,MiniMax 启动了「MiniMax Week」,并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。
6/17/2025 3:24:48 PM

苹果揭示当今先进模型存在严重缺陷,给企业高管敲响警钟

一份具有开创性的苹果研究论文在AI社区引发了轩然大波,该论文揭示了当今最先进模型中存在的严重局限性,这些缺陷此前一直未被发现。 论文《思考的错觉》表明,像GPT-4、Deep Seek和Claude Sonnet这样的高级模型所应用的“思维链”推理,在任务变得过于复杂时,会出现“完全的准确性崩溃”。 最令人担忧的方面似乎是,一旦任务复杂到一定程度,再投入更多的处理能力、标记或数据也无济于事。
6/17/2025 3:18:33 PM
Bernard Marr

DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭

编程新王,又有一位玩家成功晋级。 刚刚,LMArena公布了最新WebDev Arena排行榜,DeepSeek-R1(0528)冲进第一。 新版DeepSeek-R1编程能力,现与Gemini 2.5 Pro、Claude Opus 4并驾齐驱。
6/17/2025 3:16:15 PM
新智元

POE平台上线即梦3.0图像与Seedance1.0Lite视频模型

近日,全球知名AI模型整合平台POE正式上线字节跳动旗下即梦3.0图像模型与Seedance1.0Lite视频模型,标志着字节在海外AI市场的进一步发力。 据了解,即梦3.0图像模型在中文直出方面取得突破,显著提升了大字准确性、设计感和丰富度,支持2K高清图像生成,可呈现写实、卡通等多种风格,适用于复杂场景与艺术字体创作。 该模型通过创新的“缺陷感知训练范式”,优化图像质量,确保无水印输出,广泛应用于设计、广告等领域。
6/17/2025 3:01:49 PM
AI在线

颠覆传统!新多智能体框架OWL获17K Star,超越OpenAI开创智能协作新时代

随着大型语言模型(LLM)的迅猛发展,单一智能体在应对复杂现实任务时显露出诸多局限。 为了解决这个问题,香港大学与 camel-ai 等多家机构联合推出了一种名为 Workforce 的全新多智能体框架,并配套了一种名为 OWL(Optimized Workforce Learning)的训练方法。 最近,这一创新成果在权威基准测试 GAIA 上获得了69.70% 的准确率,不仅刷新了开源系统的记录,还超越了 OpenAI Deep Research 等多家商业系统。
6/17/2025 3:01:49 PM
AI在线