开源模型
昆仑万维推出 Skywork-OR1 系列模型:全面开放、免费使用、完全开源
                        昆仑万维今日发文宣布,天工团队在首款中文逻辑推理大模型 Skywork-o1 基础上迭代优化,推出了全新升级的 Skywork-OR1(Open Reasoner 1) 系列模型。
                    
                    4/13/2025 9:53:09 PM
                        归泷
                    谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B
                        Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
                    
                    3/21/2025 2:01:00 PM
                        AI在线
                    32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo
                        近日,艾伦人工智能研究所(AI2)重磅发布了其最新的大型语言模型——OLMo232B。 这款模型一经亮相便自带光环,因为它不仅是OLMo2系列的最新力作,更以“完全开放”的姿态,向那些高墙深垒的专有模型发起了强有力的挑战。 OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。
                    
                    3/18/2025 2:53:00 PM
                        AI在线
                    开源图片超分模型Thera:可以提升图片清晰度,让模糊从此“下岗”
                        各位追求高清无码的视觉动物们,请注意!图像处理界又添一枚猛将——Thera,一款开源的任意尺度超分辨率模型,带着满满的黑科技和友好的开源姿态,闪亮登场啦!  这位新晋“美图秀秀Plus”不仅能让你的模糊照片重见天日,还能以你意想不到的灵活方式进行放大,简直是细节控们的福音,模糊党的克星!想放多大就多大?还在为固定倍数的图片放大而烦恼吗?Thera 告诉你,那都是过去式了!这款由苏黎世联邦理工学院和苏黎世大学的大佬们联手打造的神器,最引人注目的特点就是其任意尺度超分辨率能力。 你可以随心所欲地指定放大倍数,无论是3.14倍这种略显“调皮”的数字,还是其他任何你想要的比例,Thera 都能轻松应对,真正实现了“我的清晰度我做主”!
                    
                    3/17/2025 9:47:00 AM
                        AI在线
                    潞晨科技推全新开源视频模型Open-Sora 2.0 训练流程全开源
                        还在为动辄百万美金的视频生成模型望而却步?还在感叹AI视频创作只是巨头的游戏?今天,开源社区用实力告诉你: “No!” 一款名为 Open-Sora2.0的全新开源模型横空出世,彻底颠覆了视频生成的“氪金”规则。  难以置信的是,这款性能直逼商业级水准的110亿参数大模型,竟然只花费了区区20万美元(224张GPU)就训练成功!  要知道,那些动辄耗资数百万美元的闭源模型,在 Open-Sora2.0面前,性价比简直弱爆了!Open-Sora2.0的发布,无疑是视频生成领域的一场“平民革命”。
                    
                    3/13/2025 11:43:00 AM
                        AI在线
                    智谱开源文生图模型CogView4,支持中英双语提示词输入
                        智谱AI最新开源文生图模型CogView4正式亮相,CogView4不仅在参数数量上达到了6亿,还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”。 CogView4以支持中英双语提示词输入为核心亮点,尤其擅长理解和遵循复杂的中文指令,成为中文内容创作者的福音。 作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域的一大空白。
                    
                    3/4/2025 1:44:00 PM
                        AI在线
                    阿里万相视频生成大模型宣布开源:8.2GB 显存就能跑,测试超越 Sora
                        此次开源采用最宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在 Github、HuggingFace 和魔搭社区下载体验。
                    
                    2/25/2025 10:49:15 PM
                        汪淼
                    腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望
                        近日,腾讯混元视频模型(Hunyuan Video)在 X 平台上正式公开招募测试伙伴,标志着这一前沿 AI 视频生成技术迈入关键测试阶段。 根据官方透露,测试结束后,该模型有很大概率会开源,为全球 AI 社区贡献其技术成果。 混元视频模型是腾讯在 AI 视频生成领域的重要创新,拥有超过13B 的参数量,是目前开源模型中规模最大的视频生成模型之一。
                    
                    2/24/2025 9:47:00 AM
                        AI在线
                    DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
                        Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“太令人震惊了!”
                    
                    2/24/2025 7:59:13 AM
                        清源
                    再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
                        Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
                    
                    1/28/2025 9:33:49 PM
                        汪淼
                    阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场
                        继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
                    
                    1/27/2025 11:08:00 AM
                        AI在线
                    DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源
                        还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。
                    
                    1/19/2025 10:19:33 PM
                        汪淼
                    解决“佛跳墙、老婆饼”问题,联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”
                        同时通过引入海量中文图文对数据进行预训练,模型对中文专属名词,如鼠标-老鼠、仙鹤-吊车等英文模型易混淆的对象,以及中文菜谱等英文模型无法理解的名词,都能够准确理解并生成对应的图片。
                    
                    1/8/2025 6:01:41 PM
                        汪淼
                    全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
                        全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。
                    
                    12/16/2024 4:10:15 PM
                        
                    北交开源 o1 代码版:强化学习 + 蒙特卡洛树搜索,放出源代码、精选数据集以及衍生模型
                        团队认为编码是一个需要 System-2 思维方式的典型任务,涉及谨慎、逻辑、一步步的问题解决过程。而他们的策略是将强化学习(RL)与蒙特卡洛树搜索(MCTS)相结合,让模型能够不断生成推理数据,提升其 System-2 能力。
                    
                    12/9/2024 12:34:55 PM
                        汪淼
                    DeepMind 开源大模型 GenCast 登 Nature:8 分钟预测 15 日天气
                        DeepMind 大模型再登上 Nature —— 气象预测大模型 GenCast,8 分钟内完成 15 天的预测,而且不管常规还是极端天气都能分析。
                    
                    12/5/2024 12:37:01 PM
                        汪淼
                    2024年AI趋势看这张图,LeCun:开源大模型要超越闭源
                        能感受到其中的趋势吗?2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时,另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀?是否能够媲美专有模型的性能?迄今为止,我们一直还只能说是某些方面接近。即便如此,开源模型总会给我们带来经验的表现,让我们刮目相看。开源模型的兴起正在改变游戏规则。如 Meta 的 LLaMA 系列以其快速迭代、可定制性和隐私性正受到追捧。这些模型被社区迅速发展,给专有模型带来了强有力的挑战,能够改变
                    
                    12/12/2023 2:50:00 PM
                        机器之心
                    
        资讯热榜
    
    
                LangChain V1.0 深度解析:手把手带你跑通全新智能体架构
        全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
        消息称软银批准对 OpenAI 追加 225 亿美元投资,助力未来上市
        OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务
        软银豪掷225亿美元加码OpenAI,AI音乐与超级融资计划全面提速
        OpenAI进军音乐创作领域,携手茱莉亚学院学生打造全新AI音乐模型
        Transformer 之父“叛逃”:我已经受够了 Transformer!警告:AI研究变得越来越窄,我们需要找到新的架构
        LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                