AI在线 AI在线

开源

超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS

今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
6/27/2025 9:26:50 AM

谷歌AI Agent刚开源!多任务智能体+MCP+谷歌搜索,狂揽9000颗星

今天凌晨,谷歌在官网开源了AI Agent框架Gemini CLI,直接将Gemini大模型融入到终端中。 Gemini CLI最大亮点之一就是可以直接调用,谷歌最新发布的视频模型 Veo和图像模型Imagen,同时集成了MCP、谷歌搜索、自定义自动化等众多实用功能。 开源地址:,用Gemini CLI自动制作一个短视频,展示一只姜猫在澳大利亚的冒险故事。
6/26/2025 10:07:11 AM

谷歌放大招!Gemini CLI开源发布,免费提供AI编程助手挑战Cursor

谷歌今日重磅发布Gemini CLI,一款开源的终端AI代理工具,直接向商业化AI编程工具发起挑战。 该项目一经发布即在GitHub收获9000 星标,展现了开发者社区的强烈关注。 免费策略颠覆市场谷歌此次采用了极具冲击力的免费策略:零成本使用:仅需个人Google账号即可获得Gemini Code Assist许可顶级模型:免费提供Gemini2.5Pro模型,配备100万token超大上下文窗口业界最高免费额度:每分钟60次请求,每日1000次请求完全免费这一配置对个人开发者和学习者而言几乎等同于无限制使用,涵盖编程、调试、学习和自动化等全场景需求。
6/26/2025 10:01:32 AM
AI在线

重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练

过去几年,随着基于人类偏好的强化学习(Reinforcement Learning from Human Feedback,RLHF)的兴起,强化学习(Reinforcement Learning,RL)已成为大语言模型(Large Language Model,LLM)后训练阶段的关键技术。 RL 不仅显著提升了模型的对齐能力,也拓展了其在推理增强、智能体交互等场景下的应用边界。 围绕这一核心范式,研究社区不断演化出多种优化策略和算法变体,如 Agentic RL、RLAIF、GRPO、REINFORCE 等。
6/25/2025 1:44:09 PM

华科开源MonkeyOCR:3B小模型,居然把GPT-4o给比下去了

看到这个标题,你可能会想"又一个号称吊打GPT的模型"。 但这次不一样,华中科技大学真的搞出了点名堂。 前几天,华科和金山办公联合开源了一个叫MonkeyOCR的文档解析模型。
6/25/2025 9:14:00 AM
阿丸笔记

如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!

TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能,为用户带来逼真的虚拟交互体验。 它是如何实现的呢? 本文将为您揭秘 TaoAvatar 背后的黑科技!
6/25/2025 9:11:16 AM

3D VLA新范式!中科院&字节Seed提出BridgeVLA,斩获CVPR 2025 workshop冠军!

只需要三条轨迹,就能取得 96.8% 的成功率? 视觉干扰、任务组合等泛化场景都能轻松拿捏? 或许,3D VLA 操作新范式已经到来。
6/24/2025 11:50:37 AM

AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解: Kimi-Researcher月之暗面推出Kimi-Researcher,多轮搜索与推理能力强,在HLE测试中超越谷歌和OpenAI同类产品。 【AiBase提要:】🌐 Kimi-Researcher基于k-系列模型,通过端到端强化学习训练。
6/23/2025 5:00:38 PM
AI在线

AI时代的开源进化论:安全、成本与选择的破局之道

自ChatGPT横空出世引爆AI大模型热潮以来,科技界一场关于"开源"与"闭源"的辩论被推向新的高潮。 这场争论的源头可追溯至计算机文明的启蒙时代——1998年2月3日,自由软件运动活动家克里斯汀·彼得森(Christine Peterson)首次提出"Open Source"这一革命性术语,次日Linux创始人林纳斯·托瓦兹(Linus Torvalds)发布具有里程碑意义的GPL版权许可说明,正式为开源运动奠定法律基石。 在开源运动早期,埃里克·雷蒙德(Eric S.
6/23/2025 3:55:46 PM

开源AI设计工具Jaaz发布 Lovart AI的本地化免费替代品

一款名为Jaaz的开源AI设计工具在开发者社区引发热议,被誉为Lovart AI的本地化免费替代品。 Jaaz利用先进的AI模型与图像生成技术,支持通过聊天对话完成图像设计、编辑及生成,涵盖海报、故事板等多种创意场景。 其强大的功能和本地运行特性为设计师提供了高效、灵活的创作体验。
6/23/2025 3:00:38 PM
AI在线

​Firecrawl即将推出Fireplexity,打造开源Perplexity克隆版

在AI搜索引擎领域,Firecrawl正以迅猛之势掀起新波澜。 根据最新社交媒体动态,Firecrawl宣布将于下周正式推出Fireplexity,一款定位为开源的Perplexity克隆版,旨在为开发者提供强大的AI驱动问答引擎,挑战现有AI搜索工具的格局。 以下是AIbase整理的最新信息,带您深入了解这一备受期待的项目。
6/23/2025 11:00:48 AM
AI在线

PyTorch 从 0 到 1:超详细的安装与入门实战指南

PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。 它以其灵活性、易用性和强大的GPU加速功能而闻名,已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性:张量 (Tensor) 计算:类似于 NumPy 的多维数组,但提供了强大的 GPU 加速能力,使得大规模数值计算变得极其高效。
6/23/2025 10:20:00 AM
用户007

开源版MetaQuery来了!OpenUni用1.1B参数媲美BLIP3-o-8B,数据代码完全开源

随着 GPT-4o 展现出令人印象深刻的多模态能力,将视觉理解和图像生成统一到单一模型中已成为 AI 领域的研究趋势(如MetaQuery 和 BLIP3-o )。 南洋理工大学 S-Lab 和商汤科技的研究团队推出 OpenUni,一个开源版 MetaQuery,仅用 1.1B 参数达到 8B 模型性能,更将代码、权重、数据全部开源! 技术报告: OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation机构: 南洋理工大学 S-Lab、商汤科技新加坡研究院作者: Size Wu*,  Zhonghua Wu*, Zerui Gong* (* 同等贡献), Qingyi Tao, Sheng Jin, Qinyue Li, Wei Li, Chen Change Loy开源代码: : [email protected]架构图,OpenUni 架构:通过 256 个可学习查询和 6 层轻量连接器,桥接冻结的 InternVL(理解)与 SANA(生成)图 1:OpenUni 在生成任务上的性能表现,展示了其高效的参数利用三大核心优势🏗️ 架构极简仅 6 层连接器,相比 MetaQuery 的 24 层大幅精简⚡ 参数高效1.1B 参数达到 GenEval 0.84 分,与 BLIP3-o-8B 模型性能相当 📂 完全开源模型权重 训练代码 2300 万数据集全部公开架构设计与训练策略OpenUni 遵循 MetaQuery 的设计理念,包含四个核心组件:1.256 个可学习查询 - 从用户指令中提取条件信息2.
6/23/2025 9:01:00 AM

AI助燃数字创新 SUSE Summit 2025创新峰会隆重召开

2025年6月13日 全球开源解决方案领导者SUSE在北京隆重举办了SUSE Summit 2025创新峰会。 本次峰会以“AI开源智选 助燃数字创新”为主题,汇集了行业领袖、技术专家以及众多合作伙伴,深入探讨在生成式AI浪潮下,如何基于SUSE开源模式,利用各种新功能和新技术拨开重重迷雾,快速实现企业级AI创新。 SUSE大中华区总裁陈毅威在新质生产力不断涌现的时代背景下,SUSE中国战略稳步推进。
6/17/2025 5:41:47 PM

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了? ? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。
6/17/2025 5:14:01 PM

突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star

港大、camel-ai 等多家机构联合提出了一种名为新的名为 Workforce 的创新多智能体框架,以及配套的 OWL(Optimized Workforce Learning)训练方法,在通用 AI Assistant 的标杆基准测试 GAIA 上取得了 69.70% 的准确率,不仅刷新了开源系统的最佳纪录,更是超越了多家商业系统以及 OpenAI Deep Research 的开源方案。 该研究成果所有代码均已开源,目前已经在 github 上收获了 17k 的 star。 论文标题:OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation论文地址:::多智能体系统的「领域壁垒」随着 LLM 的飞速发展,单一智能体在处理复杂现实任务时逐渐暴露出局限性。
6/17/2025 3:28:03 PM

同一天开源新模型,一推理一编程,MiniMax和月之暗面开卷了

同一天,国内大模型厂商扎堆发起了新模型。 AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。 其中,MiniMax 启动了「MiniMax Week」,并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。
6/17/2025 3:24:48 PM

刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4

在开源模型领域,DeepSeek 又带来了惊喜。 上个月 28 号,DeepSeek 来了波小更新,其 R1 推理模型升级到了最新版本(0528),并公开了模型及权重。 这一次,R1-0528 进一步改进了基准测试性能,提升了前端功能,减少了幻觉,支持 JSON 输出和函数调用。
6/17/2025 9:09:00 AM