开源
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
强化学习(RL) 真实搜索引擎,可以有效提升大模型检索-推理能力。 但问题来了:一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。 另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。
5/19/2025 8:47:00 AM
DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨
昨天,全球著名开源大模型平台DeepSeek在huggingface发布了,超强开源模型V3的论文。 主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。 其中,DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。
5/16/2025 8:58:09 AM
所有AI工具共享记忆!MCP协议杀疯了:100%本地运行,Cursor、Claude都能用
聊完就忘? 当下多数AI助手和开发工具各自独立运行,会话结束上下文即消失,严重影响了使用体验和效率。 OpenMemory MCP,一款可以解决AI工具记忆痛点,并且实现不同工具之间共享上下文信息的开源工具,他来了!
5/15/2025 8:35:00 AM
腾讯混元携手科研机构推出首个多模态统一CoT奖励模型并开源
近日,腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下,正式推出了全新研究成果 —— 统一多模态奖励模型(Unified Reward-Think),并宣布全面开源。 这一创新模型不仅具备了强大的长链推理能力,还首次实现了在视觉任务中 “思考” 的能力,使得奖励模型能够更准确地评估复杂的视觉生成与理解任务。 统一多模态奖励模型的推出,标志着奖励模型在各类视觉任务中的应用达到了新的高度。
5/14/2025 10:01:03 AM
AI在线
谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱
传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
5/14/2025 9:20:59 AM
从图像出发构建可控交互世界!昆仑万维正式开源Matrix-Game
5月13日,昆仑万维集团宣布正式开源Matrix-Game大模型,这是一款专注于交互式世界生成的先进模型,标志着交互式世界生成技术的新突破。 Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B 空间智能大模型,专为开放式环境中的高质量生成与精确控制而设计。 这一开源举措不仅刷新了交互式世界生成的技术上限,也为构建通用虚拟世界基座树立了全新标杆。
5/13/2025 11:00:52 AM
AI在线
阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定!
阿里巴巴开源项目MNN(Mobile Neural Network)发布了其移动端多模态大模型应用MnnLlmApp的最新版本,新增对Qwen-2.5-Omni-3B和7B模型的支持。 这款完全开源、运行于移动端本地的大模型应用,支持文本到文本、图像到文本、音频到文本和文本到图像生成等多种模态任务,以其高效性能和低资源占用引发开发者广泛关注。 AIbase观察到,MNN的此次更新进一步推动了多模态AI在移动端的普及。
5/13/2025 10:01:07 AM
AI在线
字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移
字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。 AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。 框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现无缝整合。
5/13/2025 10:01:02 AM
AI在线
月之暗面开源音频模型Kimi-Audio,从「语音转文字」到「读心对话」,让AI听懂人类 “弦外之音”!
近期,Kimi在语音交互领域发布了Kimi-Audio模型,这是一个开源音频基础模型,在音频理解、生成和对话方面表现出色。 AI让机器不仅 “听到” 声音,更能 “听懂” 语言背后的情感、意图和语境。 Kimi-Audio 的核心突破,在于构建了一个全流程端到端的实时语音对话系统。
5/13/2025 9:21:30 AM
AIGC Studio
OpenAI深夜开源HealthBench,60个国家合力开发5000段真实对话
今天凌晨1点30,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。 与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。 并且采用了多轮对话测试,而不是简单的答题或选择题模式。
5/13/2025 9:08:00 AM
阿里通义千问成为日本AI发展的新基石
近日,日本经济新闻(NIKKEI)发表了一篇引人注目的报道,指出阿里巴巴的通义千问大模型正迅速成为日本人工智能开发的重要基础。 随着全球 AI 技术的飞速发展,通义千问的表现已在国际舞台上崭露头角,尤其是在日经新闻对各大 AI 模型进行的综合评测中,通义千问 Qwen2.5-Max 一举夺得第六名,超越了许多国内外知名模型,包括 DeepSeek-V3和 OpenAI 的 o3-mini 等。 日本的众多新兴企业正纷纷借助通义千问的强大能力,开发适用于自身的企业级 AI 模型。
5/12/2025 3:00:52 PM
AI在线
Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频
本周二,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具,来验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 在项目中,他开发了一个用于自动(或半自动)证明分析中估计值的框架。 估计值是 X≲Y(在渐近记法中表示 X=O (Y))或 X≪Y(在渐近符号中表示 X=o (Y))形式的不等式。
5/12/2025 9:05:00 AM
字节跳动开源深度研究框架DeerFlow
字节跳动宣布正式开源其全新研发的社区驱动深度研究框架 DeerFlow,这一举措迅速引发了AI研究领域的广泛关注。 作为一款基于LangChain和LangGraph框架构建的智能研究助手,DeerFlow将语言模型与网络搜索、爬虫、Python代码执行等专业工具深度整合,为自动化研究和内容创作提供了全新可能。 DeerFlow核心功能:智能化与人机协作的完美结合DeerFlow旨在通过AI技术提升研究效率,同时强调“人在回路”(Human-in-the-loop)理念,支持用户随时介入调整研究计划。
5/9/2025 5:00:51 PM
AI在线
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
英伟达开源其 Open Code Reasoning(OCR)模型套装,含 32B、14B 和 7B 三种参数规模,均采用 Apache 2.0 许可证发布,模型权重和配置已在 Hugging Face 平台开放下载。
5/9/2025 2:28:51 PM
故渊
开源社区新添利器:DeerFlow深度研究框架融合AI与专业工具
DeerFlow,一个由社区驱动的全新深度研究框架日前发布,旨在将语言模型与专业工具相结合,为开源社区提供强大的自动化研究解决方案。 这款基于LangGraph构建的模块化多智能体系统,秉持"源于开源,回馈开源"的理念,为研究人员和开发者提供了一套完整的工具链。 DeerFlow的核心优势在于其全面的功能整合。
5/9/2025 11:04:20 AM
AI在线
IBM 将三大 AI 项目移交给 Linux 基金会,推动开源 AI 发展
IBM 宣布将三项关键的人工智能(AI)项目移交给 Linux 基金会的 LF AI & Data 基金会,进一步推动开源 AI 的发展。 这三项新项目分别是 Docling、BeeAI 和数据准备工具包(Data Prep Kit),反映了业界对开放和协作式 AI 开发的日益重视。 与传统的封闭式解决方案不同,这些开源工具为开发者提供了更大的灵活性,使他们能够根据不同的需求进行修改和适配。
5/9/2025 10:01:42 AM
AI在线
Multiverse发布全球首款AI生成多人在线游戏,以超低成本改写游戏开发规则
昨日,游戏开发与AI技术领域见证了一场颠覆性创新——EnigmaLabsAI团队正式发布Multiverse,这款号称全球首款由AI生成的多人在线游戏标志着游戏开发进入全新纪元。 这一突破性项目不仅以其AI驱动的动态世界引发广泛关注,更凭借惊人的低成本研发模式震撼行业。 Multiverse核心优势在于其革命性的实时动态世界模拟技术。
5/9/2025 10:01:41 AM
AI在线
阿里巴巴开源 ZeroSearch 搜索引擎:训练成本大幅降低 80%
近日,阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎,这一新工具通过强化学习框架,极大地提高了搜索能力,并且在训练过程中不需要与真实搜索引擎互动。 ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识,快速生成相关内容,并且可以动态控制生成内容的质量。 与传统的搜索引擎相比,ZeroSearch 的训练成本显著降低。
5/9/2025 9:00:59 AM
AI在线
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊