开源

开源革命！Kyutai TTS发布：超低延迟语音合成，AI语音新纪元来袭！

开源革命！Kyutai TTS发布：超低延迟语音合成，AI语音新纪元来袭！

近日，法国AI实验室Kyutai宣布，其全新文本转语音模型 Kyutai TTS 正式开源，为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。这一突破性发布不仅推动了开源AI技术的发展，也为多语言语音交互应用开辟了新的可能性。 AIbase为您独家解析这一技术亮点及其潜在影响。

7/5/2025 7:46:46 AM AI在线

从封闭到放开：百度开源文心 4.5 全家桶，多项基准上领先 Deepseek，行业天花板再抬高

从封闭到放开：百度开源文心 4.5 全家桶，多项基准上领先 Deepseek，行业天花板再抬高

百度突然宣布，将旗下最新的大语言模型文心大模型4.5（ERNIE 4.5）全系列开源，震动整个AI行业。此次开源采用Apache 2.0许可协议，意味着全球开发者不仅可以免费下载和使用，也可以自由修改与商用。图片这标志着百度战略方向的重大转变。

7/3/2025 4:27:26 PM

RL缩放王炸！DeepSWE开源AI Agent登顶榜首，训练方法、权重大公开

RL缩放王炸！DeepSWE开源AI Agent登顶榜首，训练方法、权重大公开

今天凌晨，著名大模型训练平台Together.ai联合Agentica开源了创新AI Agent框架DeepSWE。 DeepSWE是基于阿里最新开源的Qwen3-32B模型之上，完全使用强化学习训练而成。除了权重之外，训练方法、日志、数据集等所有内容也全部开源，以帮助开发人员深度学习和改进Agent。

7/3/2025 2:58:16 PM

ElementPlusX + RuoyiAI：Vue3 首个 AI 开发模板开源了！

ElementPlusX + RuoyiAI：Vue3 首个 AI 开发模板开源了！

在 AI 技术飞速发展的今天，开发一款自己的 AI 应用成为了许多开发者的追求。然而，从零开始搭建一个完整的 AI 开发环境，往往需要耗费大量的时间和精力。为了帮助开发者快速进入 AI 开发领域，一个基于 Vue3.5 的全新 AI 开发模板——ruoyi-element-ai 正式开源了！

7/3/2025 9:36:35 AM 小4子

MoE那么大，几段代码就能稳稳推理 | 开源

MoE那么大，几段代码就能稳稳推理 | 开源

混合专家网络模型架构（MoE）已经成为当前大模型的一个主流架构选择，以最近开源的盘古Pro MoE为例，其基于MoGE架构构建的混合专家架构，总参数量达720亿，激活参数量为160亿，专门针对昇腾硬件优化，在性能与效率上表现突出。盘古还实现了在推理时做到又快又稳。在技术特性上，盘古模型引入 “快思考” 和 “慢思考” 双系统，可根据问题复杂度自动切换响应模式，并在推理性能上实现突破——在昇腾800I A2上单卡推理吞吐性能达1148 tokens/s，经投机加速技术可提升至1528 tokens/s，显著优于同等规模稠密模型。

7/3/2025 9:05:40 AM

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

如果一个视觉语言模型（VLM）只会“看”，那真的是已经不够看的了。因为现在真实世界的任务简直不要太复杂，要想让AI干点实事儿，光有多模态还不够，必须还得有深度思考的强推理能力。而就在刚刚，智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking，在28项评测中一举拿下23个SOTA！

7/2/2025 2:39:29 PM

微软开源适用于 VS Code 的 GitHub Copilot Chat 扩展，助推 AI 编程自动化

微软开源适用于 VS Code 的 GitHub Copilot Chat 扩展，助推 AI 编程自动化

这意味着开发社区可以深入了解和洞察聊天式编码助手的完整实现，包括“智能体模式”的实现细节、发送给大型语言模型（LLM）的上下文数据以及系统提示的设计。

7/2/2025 1:37:36 PM 故渊

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

如果一个视觉语言模型（VLM）只会“看”，那真的是已经不够看的了。因为现在真实世界的任务简直不要太复杂，要想让AI干点实事儿，光有多模态还不够，必须还得有深度思考的强推理能力。而就在刚刚，智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking，在28项评测中一举拿下23个SOTA！

7/2/2025 1:04:17 PM 十三

开源端到端语音大模型：直接从原始音频输入，生成语音输出

开源端到端语音大模型：直接从原始音频输入，生成语音输出

目前，大模型LLMs能胜任知识问答、代码辅助等多种任务，但传统模型大多只能输出文本，无法直接生成自然语音，这让人机音频交互不够顺畅。要知道，人类交流和感知环境可不只是靠文字，语音里藏着音色、情感、语调等丰富信息，其他音频也包含着现实场景的关键信息。所以，能根据语音或音频输入直接回应的音频语言模型就很重要，也是迈向AGI的关键一步。

7/2/2025 9:46:30 AM

华为又开源了个大的：超大规模MoE推理秘籍

华为又开源了个大的：超大规模MoE推理秘籍

超大规模MoE模型（如DeepSeek），到底该怎么推理才能做到又快又稳。现在，这个问题似乎已经有了标准答案——华为一个新项目，直接把推理超大规模MoE背后的架构、技术和代码，统统给开源了！这个新开源项目名叫Omni-Infer，整体来看，它对于企业用户来说是非常利好的。

7/2/2025 8:55:00 AM

突发！微软刚开源GitHub Copilot Chat，超强AI Agent自动化编程

突发！微软刚开源GitHub Copilot Chat，超强AI Agent自动化编程

今天凌晨4点30，微软首席执行官Satya Nadella分享了，VS Code的最新AI开源编辑器GitHub Copilot Chat。 GitHub Copilot Chat最大技术亮点支持AI Agent自动化编程模式，可以执行多步骤的编码任务，自动处理编译和语法检查错误，监控终端和测试输出，并持续迭代直至编程任务完成。此外，用户也可以直接用自然语言与GitHub Copilot Chat交互，例如，这段代码的作用是什么？

7/1/2025 9:07:52 AM

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

近日，百度正式宣布开源其文心大模型4.5系列，共推出了十款模型，包括47B、3B 激活参数的混合专家（MoE）模型，以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开，还提供了推理代码，标志着百度在大模型领域的重大进展。这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署，同时，百度智能云千帆大模型平台也提供了相应的 API 服务。

6/30/2025 3:00:50 PM AI在线

RAG终极框架！港大开源RAG-Anything：统一多模态知识图谱

RAG终极框架！港大开源RAG-Anything：统一多模态知识图谱

RAG-Anything的核心技术创新在于构建了统一的多模态知识图谱架构，能够同时处理并关联文档中的文字内容、图表信息、表格数据、数学公式等多种类型的异构内容，解决了传统RAG系统仅支持文本处理的技术限制，为多模态文档的智能理解提供了新的技术方案。项目地址：: （RAG）系统，专注解决复杂场景下的智能问答与信息检索难题。该系统提供完整的端到端多模态文档处理解决方案，能够统一处理文本、图像、表格、数学公式等多种异构内容，实现从文档解析、知识图谱构建到智能问答的全流程自动化，为下一代AI应用提供了可靠的技术基础。

6/30/2025 1:57:59 PM

百度文心大模型4.5系列正式开源，同步开放API服务

百度文心大模型4.5系列正式开源，同步开放API服务

百度文心大模型开源，如期而至。就在今天，百度官宣文心大模型4.5系列正式开源，还同步提供API服务。此番，百度一次性推出10款开源模型，涵盖从47B参数的混合专家（MoE）模型到轻量级0.3B稠密型模型，覆盖文本、多模态等多种任务需求。

6/30/2025 1:54:34 PM

百度文心系列大模型在飞桨平台开源，涵盖多款最新模型

百度文心系列大模型在飞桨平台开源，涵盖多款最新模型

据新浪科技消息，百度旗下文心系列大模型近日已在其飞桨（PaddlePaddle）平台开源，其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。尽管百度方面尚未主动披露此次开源行动，但飞桨平台的更新信息显示，这一系列动作集中在6月29日至6月30日，是其最新的举措。有内部人士证实:“官网上新并公布了开源代码，足见公司确实已在推进开源举措。

6/30/2025 11:00:50 AM AI在线

华为开源盘古7B稠密和72B混合专家模型

华为开源盘古7B稠密和72B混合专家模型

6月30日，华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型，以及基于升腾的模型推理技术。此次开源举措，是华为践行升腾生态战略的关键一步，旨在推动大模型技术的研究与创新发展，加速人工智能在各行业的应用并创造价值。目前，盘古Pro MoE72B模型权重、基础推理代码，以及基于升腾的超大规模MoE模型推理代码，均已正式上线开源平台。

6/30/2025 10:01:04 AM AI在线

媲美DeepSeek！腾讯开源新版混元模型：AI Agent强化，超30种智能体指令

媲美DeepSeek！腾讯开源新版混元模型：AI Agent强化，超30种智能体指令

腾讯开源了混元大模型的最新版本Hunyuan-A13B。 Hunyuan-A13B是一个专家混合模型，拥有800亿参数，其中130亿参数处于激活状态。支持快、慢两种思考模式：快速思维模式，提供简洁高效的输出，适用于高效、简单的日常任务；慢速思维模式，支持更深层次的推理步骤包含反思和回溯，生成更长的思维链，提升复杂任务的准确性。

6/30/2025 9:04:00 AM

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合（MoE）架构，总参数规模达800亿，激活参数为130亿，在保持顶尖开源模型效果的同时，大幅降低了推理延迟与计算开销，为个人开发者和中小企业提供了更具性价比的AI解决方案。据腾讯方面介绍，混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署，用户可通过Github、HuggingFace等技术社区下载使用，模型API也已在腾讯云官网上线。

6/27/2025 4:00:52 PM AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉