开源
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
开源AI是个伪概念!Claude之父语出惊人:DS是否开源都不影响我们的商业价值!不惧“年亏30亿”:做前沿模型就像风投
出品 | 51CTO技术栈(微信号:blog51cto)硅谷很少有播客,比Anthropic CEO Dario更具戏剧性了。 他的发言之犀利,让人听得直冒冷汗——他谈和黄仁勋的不合,直言奥特曼做AI的使命“不够真诚”,不看好Meta的AI路线,甚至主动提起了马斯克的Grok前阵子的政治翻车事件。 不到一个小时,分分钟就把硅谷大半圈的人都“得罪”了个遍。
凝聚开源共识,第三届杭州产投融生态大会在杭召开
数字浪潮奔涌,开源引领未来。 7月31日,第三届杭州产投融生态大会在杭州圆满召开。 杭州市政府相关领导及市级有关部门代表到场支持。
VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源
VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
当大模型在数学题和代码任务里“卷”参数规模时,一支来自快手和清华的团队给出了不同答案——. 他们用1.5B参数的小模型,在多个推理基准上干过了同量级SOTA。 秘密在于给模型的“学习过程”做了精细化管理:让该记牢的知识稳住,让该灵活的推理放开。
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了(doge)。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的“吉卜力”风暴,还是热度TOP。 △数据来自微信指数不仅由“万物皆可吉卜力”为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考:AIGC的范式,已经被悄然改变。
全球首次,「AI记忆」开源落地!MIRIX同步上线APP
还记得第一次用 GPT 写邮件的惊喜吗? 却也一定遇到过今天的 AI「忘性」——聊得再深入,窗口一关,历史烟消云散。 因此,研究人员认为:从「对话」到「记忆」,将是AI进化的必经之路。
阿里开源电影级AI视频模型!MoE架构,5B版本消费级显卡可跑
电影级视频生成模型来了。 来自阿里,来自通义——通义万相Wan2.2。 并且率先将MoE架构实现到了视频生成扩散模型中,能够实现电影级效果。
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star
搞Agent开发也有开源一条龙了! 这不,扣子的两款子产品已于近期正式开源:扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop)。 才过了一个周末,两个项目就拿下了9K Star~再加上此前已经开源的开发框架Eino,扣子这是把Agent从开发、评测到运维的完整链路,全都打包开源了,堪称一步到位。
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星
如果你是智能体资深玩家,相信一定用过字节跳动的招牌产品扣子(Coze),现在已经开源了,并且支持商业化。 扣子是一个AI Agent开发平台,提供各类最新大模型、工具、多种开发模式和框架,从开发到部署提供可视化一站式开发环境。 多数情况下,甚至不用编写代码就能完成所有开发流程。
超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架
专门适用超大模型、带来2.18倍推理加速,最新投机采样训练框架开源! SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。 SGLang,当前趋势下最受青睐的推理框架之一,为DeepSeek提供了专属优化,也深受英伟达、AMD、xAI等厂商喜爱。
媲美Claude 4,支持100万上下文!阿里开源超强代码AI Agent模型
阿里巴巴开源了超强AI Agent模型Qwen3-Coder-480B-A35B-Instruct。 根据阿里公布的测试数据显示,Qwen3-Coder在OpenAI发布的Agent测试基准SWE-bench Verified中,500轮交互的测试分数达到了69.6%,常规分数为67%,可媲美最强闭源代码模型之一Claude Sonnet 4的70.4%和68%。 同时Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。
vivo自研蓝河操作系统内核开源!Rust开发新机遇来了
芜湖~在AI重塑智能终端这个关键时刻,首个适用于嵌入式和移动设备的开源Rust内核,来了! vivo最新宣布,开源自研蓝河操作系统内核。 它完全由Rust语言编写,从根本上解决了传统C语言在内存安全、维护成本上的长期难点。
AREAL 开源:解耦架构与创新算法驱动的强化学习系统
大家好,我是肆〇柒。 推理能力在当下 AI 领域,尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域,已然成为推动技术革新的关键要素。 然而,目前大型语言模型虽已取得瞩目成果,但在处理复杂逻辑时,常受困于逻辑连贯性把控,长链推理面临信息丢失、逻辑断裂问题,长序列输出任务下推理耗时久、资源消耗大,这些痛点严重制约模型应用场景拓展与性能深化。
AI破译生命!微软蛋白质研究「超级加速器」登上Science
来自微软团队研究蛋白质的「模拟神器」BioEmu,今日登上了Science! BioEmu能模拟蛋白质在平衡状态下的各种可能结构集合,为深入理解蛋白质功能提供了关键支持。 图片图片论文链接:,在纳米尺度,蛋白质是驱动生命活动的微型机器。
南洋理工、北大、上海AI实验室开源长记忆世界模型
目前,世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。 许多模拟环境在视角移动或时间推移后会出现内容变化,导致 3D 空间不一致,严重影响了用户体验和模拟效果的可靠性。 为了解决这一难题,南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。
仅需0.7秒单图像实时3D重建,开源扩散模型
单图像3D重建,即从单一视角的二维图像中恢复出三维物体的形状和结构,是计算机视觉领域的一项基础且极具挑战的难题。 学术界和工业界主要探索了两种不同的技术路线:基于回归的建模方法和生成式建模方法。 基于回归的方法能够高效地推断出可见表面,但在处理遮挡区域时却力不从心,常常导致表面和纹理估计不准确。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉