开源
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
字节跳动 发布了一款名为 BAGEL 的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。 BAGEL 在标准多模态理解基准测试中表现出色,超越了当前一些顶级开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2.5。 此外,在文本到图像的生成质量上,BAGEL 的表现也与强大的专业生成器 SD3相媲美。
5/21/2025 12:01:15 PM
AI在线
VS Code 宣布开源 GitHub Copilot Chat 扩展,加速 AI 编程
微软在 Build2025大会上宣布了一项重大举措:Visual Studio Code(VS Code)将开源 GitHub Copilot Chat 扩展,并以 MIT 许可证发布。 这一决定标志着 VS Code 在 AI 驱动开发领域的进一步开放与创新,旨在通过社区协作打造一个透明、高效的 AI 代码编辑平台。 开源 GitHub Copilot Chat 扩展:社区驱动的 AI 创新根据最新消息,VS Code 团队计划将 GitHub Copilot Chat 扩展的代码以 MIT 许可证开源,并逐步将其核心 AI 功能整合到 VS Code 的核心架构中。
5/20/2025 10:01:11 AM
AI在线
微软放大招!VS Code转型开源AI编辑器,狙击Cursor与Windsurf
微软在Build2025大会上宣布了一项震撼举措:旗下广受欢迎的代码编辑器Visual Studio Code(VS Code)将转型为全球首款开源AI编辑器,并将GitHub Copilot Chat扩展完全开源,遵循MIT许可证。 这一战略不仅深化了微软对开源社区的承诺,还通过整合AI功能重塑开发者工具生态,对Cursor、Windsurf等竞品形成强力挑战。 AIbase综合最新动态,深入解析这一里程碑式发布的技术亮点与行业影响。
5/20/2025 9:00:55 AM
AI在线
数学建模的AI助手MathModelAgent,给出题目就能完成分析到写论文全流程
一款名为MathModelAgent的AI助手在开源社区引发热议。 这款专为数学建模设计的智能工具,能够自动完成从问题分析、模型构建、代码编写到论文撰写的全流程,展现了AI在学术与技术领域的深远潜力。 MathModelAgent:数学建模的革命性助手MathModelAgent是一个多智能体协作系统,集成了多个专业模块,包括负责数学建模的“建模手”、代码编写与调试的“代码手”以及论文撰写的“论文手”。
5/19/2025 12:00:55 PM
AI在线
深入 GraphRAG:构建更强大的知识增强问答系统的六大开源项目
前几天我分享了一篇文章知识图谱 向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。 然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。 Microsoft GraphRAG微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。
5/19/2025 9:28:31 AM
贝塔街的万事屋
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
强化学习(RL) 真实搜索引擎,可以有效提升大模型检索-推理能力。 但问题来了:一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。 另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。
5/19/2025 8:47:00 AM
DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨
昨天,全球著名开源大模型平台DeepSeek在huggingface发布了,超强开源模型V3的论文。 主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。 其中,DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。
5/16/2025 8:58:09 AM
所有AI工具共享记忆!MCP协议杀疯了:100%本地运行,Cursor、Claude都能用
聊完就忘? 当下多数AI助手和开发工具各自独立运行,会话结束上下文即消失,严重影响了使用体验和效率。 OpenMemory MCP,一款可以解决AI工具记忆痛点,并且实现不同工具之间共享上下文信息的开源工具,他来了!
5/15/2025 8:35:00 AM
腾讯混元携手科研机构推出首个多模态统一CoT奖励模型并开源
近日,腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下,正式推出了全新研究成果 —— 统一多模态奖励模型(Unified Reward-Think),并宣布全面开源。 这一创新模型不仅具备了强大的长链推理能力,还首次实现了在视觉任务中 “思考” 的能力,使得奖励模型能够更准确地评估复杂的视觉生成与理解任务。 统一多模态奖励模型的推出,标志着奖励模型在各类视觉任务中的应用达到了新的高度。
5/14/2025 10:01:03 AM
AI在线
谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱
传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
5/14/2025 9:20:59 AM
从图像出发构建可控交互世界!昆仑万维正式开源Matrix-Game
5月13日,昆仑万维集团宣布正式开源Matrix-Game大模型,这是一款专注于交互式世界生成的先进模型,标志着交互式世界生成技术的新突破。 Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B 空间智能大模型,专为开放式环境中的高质量生成与精确控制而设计。 这一开源举措不仅刷新了交互式世界生成的技术上限,也为构建通用虚拟世界基座树立了全新标杆。
5/13/2025 11:00:52 AM
AI在线
阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定!
阿里巴巴开源项目MNN(Mobile Neural Network)发布了其移动端多模态大模型应用MnnLlmApp的最新版本,新增对Qwen-2.5-Omni-3B和7B模型的支持。 这款完全开源、运行于移动端本地的大模型应用,支持文本到文本、图像到文本、音频到文本和文本到图像生成等多种模态任务,以其高效性能和低资源占用引发开发者广泛关注。 AIbase观察到,MNN的此次更新进一步推动了多模态AI在移动端的普及。
5/13/2025 10:01:07 AM
AI在线
字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移
字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。 AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。 框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现无缝整合。
5/13/2025 10:01:02 AM
AI在线
月之暗面开源音频模型Kimi-Audio,从「语音转文字」到「读心对话」,让AI听懂人类 “弦外之音”!
近期,Kimi在语音交互领域发布了Kimi-Audio模型,这是一个开源音频基础模型,在音频理解、生成和对话方面表现出色。 AI让机器不仅 “听到” 声音,更能 “听懂” 语言背后的情感、意图和语境。 Kimi-Audio 的核心突破,在于构建了一个全流程端到端的实时语音对话系统。
5/13/2025 9:21:30 AM
AIGC Studio
OpenAI深夜开源HealthBench,60个国家合力开发5000段真实对话
今天凌晨1点30,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。 与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。 并且采用了多轮对话测试,而不是简单的答题或选择题模式。
5/13/2025 9:08:00 AM
阿里通义千问成为日本AI发展的新基石
近日,日本经济新闻(NIKKEI)发表了一篇引人注目的报道,指出阿里巴巴的通义千问大模型正迅速成为日本人工智能开发的重要基础。 随着全球 AI 技术的飞速发展,通义千问的表现已在国际舞台上崭露头角,尤其是在日经新闻对各大 AI 模型进行的综合评测中,通义千问 Qwen2.5-Max 一举夺得第六名,超越了许多国内外知名模型,包括 DeepSeek-V3和 OpenAI 的 o3-mini 等。 日本的众多新兴企业正纷纷借助通义千问的强大能力,开发适用于自身的企业级 AI 模型。
5/12/2025 3:00:52 PM
AI在线
Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频
本周二,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具,来验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 在项目中,他开发了一个用于自动(或半自动)证明分析中估计值的框架。 估计值是 X≲Y(在渐近记法中表示 X=O (Y))或 X≪Y(在渐近符号中表示 X=o (Y))形式的不等式。
5/12/2025 9:05:00 AM
字节跳动开源深度研究框架DeerFlow
字节跳动宣布正式开源其全新研发的社区驱动深度研究框架 DeerFlow,这一举措迅速引发了AI研究领域的广泛关注。 作为一款基于LangChain和LangGraph框架构建的智能研究助手,DeerFlow将语言模型与网络搜索、爬虫、Python代码执行等专业工具深度整合,为自动化研究和内容创作提供了全新可能。 DeerFlow核心功能:智能化与人机协作的完美结合DeerFlow旨在通过AI技术提升研究效率,同时强调“人在回路”(Human-in-the-loop)理念,支持用户随时介入调整研究计划。
5/9/2025 5:00:51 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP