AI在线 AI在线

开源

手机也能跑大模型,腾讯混元推出多款小尺寸开源模型

手机也能跑大模型,腾讯混元推出多款小尺寸开源模型

8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
8/4/2025 4:12:39 PM 一水
开源AI是个伪概念!Claude之父语出惊人:DS是否开源都不影响我们的商业价值!不惧“年亏30亿”:做前沿模型就像风投

开源AI是个伪概念!Claude之父语出惊人:DS是否开源都不影响我们的商业价值!不惧“年亏30亿”:做前沿模型就像风投

出品 | 51CTO技术栈(微信号:blog51cto)硅谷很少有播客,比Anthropic CEO Dario更具戏剧性了。 他的发言之犀利,让人听得直冒冷汗——他谈和黄仁勋的不合,直言奥特曼做AI的使命“不够真诚”,不看好Meta的AI路线,甚至主动提起了马斯克的Grok前阵子的政治翻车事件。 不到一个小时,分分钟就把硅谷大半圈的人都“得罪”了个遍。
8/1/2025 5:55:47 PM 伊风
凝聚开源共识,第三届杭州产投融生态大会在杭召开

凝聚开源共识,第三届杭州产投融生态大会在杭召开

数字浪潮奔涌,开源引领未来。 7月31日,第三届杭州产投融生态大会在杭州圆满召开。 杭州市政府相关领导及市级有关部门代表到场支持。
8/1/2025 5:37:01 PM 鹭羽
VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源

VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源

VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
8/1/2025 2:32:01 PM
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升

1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升

当大模型在数学题和代码任务里“卷”参数规模时,一支来自快手和清华的团队给出了不同答案——. 他们用1.5B参数的小模型,在多个推理基准上干过了同量级SOTA。 秘密在于给模型的“学习过程”做了精细化管理:让该记牢的知识稳住,让该灵活的推理放开。
7/31/2025 12:13:29 PM 不圆
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了

1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了

听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了(doge)。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的“吉卜力”风暴,还是热度TOP。 △数据来自微信指数不仅由“万物皆可吉卜力”为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考:AIGC的范式,已经被悄然改变。
7/31/2025 8:45:00 AM
全球首次,「AI记忆」开源落地!MIRIX同步上线APP

全球首次,「AI记忆」开源落地!MIRIX同步上线APP

还记得第一次用 GPT 写邮件的惊喜吗? 却也一定遇到过今天的 AI「忘性」——聊得再深入,窗口一关,历史烟消云散。 因此,研究人员认为:从「对话」到「记忆」,将是AI进化的必经之路。
7/30/2025 9:15:00 AM
阿里开源电影级AI视频模型!MoE架构,5B版本消费级显卡可跑

阿里开源电影级AI视频模型!MoE架构,5B版本消费级显卡可跑

电影级视频生成模型来了。 来自阿里,来自通义——通义万相Wan2.2。 并且率先将MoE架构实现到了视频生成扩散模型中,能够实现电影级效果。
7/29/2025 9:12:00 AM
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

搞Agent开发也有开源一条龙了! 这不,扣子的两款子产品已于近期正式开源:扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop)。 才过了一个周末,两个项目就拿下了9K Star~再加上此前已经开源的开发框架Eino,扣子这是把Agent从开发、评测到运维的完整链路,全都打包开源了,堪称一步到位。
7/28/2025 6:06:04 PM
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型

百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型

AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
7/28/2025 9:06:00 AM
字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星

字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星

如果你是智能体资深玩家,相信一定用过字节跳动的招牌产品扣子(Coze),现在已经开源了,并且支持商业化。 扣子是一个AI Agent开发平台,提供各类最新大模型、工具、多种开发模式和框架,从开发到部署提供可视化一站式开发环境。 多数情况下,甚至不用编写代码就能完成所有开发流程。
7/28/2025 9:04:01 AM
超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架

超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架

专门适用超大模型、带来2.18倍推理加速,最新投机采样训练框架开源! SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。 SGLang,当前趋势下最受青睐的推理框架之一,为DeepSeek提供了专属优化,也深受英伟达、AMD、xAI等厂商喜爱。
7/28/2025 8:42:00 AM
媲美Claude 4,支持100万上下文!阿里开源超强代码AI Agent模型

媲美Claude 4,支持100万上下文!阿里开源超强代码AI Agent模型

阿里巴巴开源了超强AI Agent模型Qwen3-Coder-480B-A35B-Instruct。 根据阿里公布的测试数据显示,Qwen3-Coder在OpenAI发布的Agent测试基准SWE-bench Verified中,500轮交互的测试分数达到了69.6%,常规分数为67%,可媲美最强闭源代码模型之一Claude Sonnet 4的70.4%和68%。 同时Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。
7/25/2025 10:06:05 AM
vivo自研蓝河操作系统内核开源!Rust开发新机遇来了

vivo自研蓝河操作系统内核开源!Rust开发新机遇来了

芜湖~在AI重塑智能终端这个关键时刻,首个适用于嵌入式和移动设备的开源Rust内核,来了! vivo最新宣布,开源自研蓝河操作系统内核。 它完全由Rust语言编写,从根本上解决了传统C语言在内存安全、维护成本上的长期难点。
7/25/2025 9:35:47 AM
AREAL 开源:解耦架构与创新算法驱动的强化学习系统

AREAL 开源:解耦架构与创新算法驱动的强化学习系统

大家好,我是肆〇柒。 推理能力在当下 AI 领域,尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域,已然成为推动技术革新的关键要素。 然而,目前大型语言模型虽已取得瞩目成果,但在处理复杂逻辑时,常受困于逻辑连贯性把控,长链推理面临信息丢失、逻辑断裂问题,长序列输出任务下推理耗时久、资源消耗大,这些痛点严重制约模型应用场景拓展与性能深化。
7/25/2025 9:03:24 AM 肆零柒
AI破译生命!微软蛋白质研究「超级加速器」登上Science

AI破译生命!微软蛋白质研究「超级加速器」登上Science

来自微软团队研究蛋白质的「模拟神器」BioEmu,今日登上了Science! BioEmu能模拟蛋白质在平衡状态下的各种可能结构集合,为深入理解蛋白质功能提供了关键支持。 图片图片论文链接:,在纳米尺度,蛋白质是驱动生命活动的微型机器。
7/24/2025 1:10:32 PM 新智元
南洋理工、北大、上海AI实验室开源长记忆世界模型

南洋理工、北大、上海AI实验室开源长记忆世界模型

目前,世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。 许多模拟环境在视角移动或时间推移后会出现内容变化,导致 3D 空间不一致,严重影响了用户体验和模拟效果的可靠性。 为了解决这一难题,南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。
7/22/2025 10:45:55 AM
仅需0.7秒单图像实时3D重建,开源扩散模型

仅需0.7秒单图像实时3D重建,开源扩散模型

单图像3D重建,即从单一视角的二维图像中恢复出三维物体的形状和结构,是计算机视觉领域的一项基础且极具挑战的难题。 学术界和工业界主要探索了两种不同的技术路线:基于回归的建模方法和生成式建模方法。 基于回归的方法能够高效地推断出可见表面,但在处理遮挡区域时却力不从心,常常导致表面和纹理估计不准确。
7/21/2025 9:26:00 AM