开源模型
成本仅DeepSeek三分之一!阿里发布全球最强开源大模型Qwen3系列
小道消息一直在说,前天深夜或者昨天凌晨,阿里会发 Qwen3。 然后我特意早早的睡了一两小时,凌晨 1 点起床,就为了等 Qwen3 发。 结果这一等,就是好几个小时。
5/1/2025 1:13:13 AM
数字生命卡兹克
智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元
北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。 智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。 智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。
4/18/2025 12:01:21 PM
AI在线
智谱华章获北京AI产业基金2亿元追加投资,开源模型战略获官方认可
北京市人工智能产业投资基金近日宣布,向北京智谱华章科技股份有限公司(简称"智谱")追加投资2亿元人民币。 据基金方面透露,智谱是该基金成立以来投资的第一家AI大模型企业,也是目前成长最快的企业之一。 智谱在文本、推理、语音、图像、视频和代码等领域的模型能力建设方面积累深厚,同时拥有完善的商业化布局,已经建立了超过百万规模的开发者社区和企业用户基础。
4/18/2025 10:01:29 AM
AI在线
智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型
智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。 这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。 此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。
4/15/2025 10:01:27 AM
AI在线
昆仑万维推出 Skywork-OR1 系列模型:全面开放、免费使用、完全开源
昆仑万维今日发文宣布,天工团队在首款中文逻辑推理大模型 Skywork-o1 基础上迭代优化,推出了全新升级的 Skywork-OR1(Open Reasoner 1) 系列模型。
4/13/2025 9:53:09 PM
归泷
谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B
Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
3/21/2025 2:01:00 PM
AI在线
32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo
近日,艾伦人工智能研究所(AI2)重磅发布了其最新的大型语言模型——OLMo232B。 这款模型一经亮相便自带光环,因为它不仅是OLMo2系列的最新力作,更以“完全开放”的姿态,向那些高墙深垒的专有模型发起了强有力的挑战。 OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。
3/18/2025 2:53:00 PM
AI在线
开源图片超分模型Thera:可以提升图片清晰度,让模糊从此“下岗”
各位追求高清无码的视觉动物们,请注意!图像处理界又添一枚猛将——Thera,一款开源的任意尺度超分辨率模型,带着满满的黑科技和友好的开源姿态,闪亮登场啦! 这位新晋“美图秀秀Plus”不仅能让你的模糊照片重见天日,还能以你意想不到的灵活方式进行放大,简直是细节控们的福音,模糊党的克星!想放多大就多大?还在为固定倍数的图片放大而烦恼吗?Thera 告诉你,那都是过去式了!这款由苏黎世联邦理工学院和苏黎世大学的大佬们联手打造的神器,最引人注目的特点就是其任意尺度超分辨率能力。 你可以随心所欲地指定放大倍数,无论是3.14倍这种略显“调皮”的数字,还是其他任何你想要的比例,Thera 都能轻松应对,真正实现了“我的清晰度我做主”!
3/17/2025 9:47:00 AM
AI在线
潞晨科技推全新开源视频模型Open-Sora 2.0 训练流程全开源
还在为动辄百万美金的视频生成模型望而却步?还在感叹AI视频创作只是巨头的游戏?今天,开源社区用实力告诉你: “No!” 一款名为 Open-Sora2.0的全新开源模型横空出世,彻底颠覆了视频生成的“氪金”规则。 难以置信的是,这款性能直逼商业级水准的110亿参数大模型,竟然只花费了区区20万美元(224张GPU)就训练成功! 要知道,那些动辄耗资数百万美元的闭源模型,在 Open-Sora2.0面前,性价比简直弱爆了!Open-Sora2.0的发布,无疑是视频生成领域的一场“平民革命”。
3/13/2025 11:43:00 AM
AI在线
智谱开源文生图模型CogView4,支持中英双语提示词输入
智谱AI最新开源文生图模型CogView4正式亮相,CogView4不仅在参数数量上达到了6亿,还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”。 CogView4以支持中英双语提示词输入为核心亮点,尤其擅长理解和遵循复杂的中文指令,成为中文内容创作者的福音。 作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域的一大空白。
3/4/2025 1:44:00 PM
AI在线
阿里万相视频生成大模型宣布开源:8.2GB 显存就能跑,测试超越 Sora
此次开源采用最宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在 Github、HuggingFace 和魔搭社区下载体验。
2/25/2025 10:49:15 PM
汪淼
腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望
近日,腾讯混元视频模型(Hunyuan Video)在 X 平台上正式公开招募测试伙伴,标志着这一前沿 AI 视频生成技术迈入关键测试阶段。 根据官方透露,测试结束后,该模型有很大概率会开源,为全球 AI 社区贡献其技术成果。 混元视频模型是腾讯在 AI 视频生成领域的重要创新,拥有超过13B 的参数量,是目前开源模型中规模最大的视频生成模型之一。
2/24/2025 9:47:00 AM
AI在线
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“太令人震惊了!”
2/24/2025 7:59:13 AM
清源
再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
1/28/2025 9:33:49 PM
汪淼
阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场
继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
1/27/2025 11:08:00 AM
AI在线
DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源
还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。
1/19/2025 10:19:33 PM
汪淼
解决“佛跳墙、老婆饼”问题,联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”
同时通过引入海量中文图文对数据进行预训练,模型对中文专属名词,如鼠标-老鼠、仙鹤-吊车等英文模型易混淆的对象,以及中文菜谱等英文模型无法理解的名词,都能够准确理解并生成对应的图片。
1/8/2025 6:01:41 PM
汪淼
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。
12/16/2024 4:10:15 PM
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind