AI在线 AI在线

开源

全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

DeepSeek的含金量还在上升。 就在最近,Hugging Face联创、首席科学家Thomas Wolf表示——DeepSeek的出现,是开源AI领域的ChatGPT时刻! 用他的话说,「正如ChatGPT让全世界认识到AI的存在,DeepSeek则让全世界意识到,原来还有着这样一个充满活力的开源社区。
5/9/2025 8:55:00 AM
新智元

超过谷歌搜索,成本猛降80%!阿里开源创新大模型搜索引擎

昨天,阿里巴巴开源了一种创新大模型搜索引擎——ZeroSearch。 ZeroSearch是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。
5/9/2025 8:31:11 AM

微软开源 Phi-4 推理模型:啰嗦AI,反卷出圈

AI圈子最有意思的事,已经不是“谁家模型参数最多”,而是——谁家小模型,能把大模型打趴下。 最近,微软研究院开源了一款“小而强”的研究:Phi-4-reasoning-plus。 这是一款专为深度结构化推理任务设计的开源语言模型。
5/8/2025 4:45:32 PM
文摘菌

SmartPDFs:PDF文档快速总结AI工具 分段总结核心内容

一款名为 SmartPDFs 的 AI 驱动 PDF 处理工具在社交媒体上引发热议。 这款免费且开源的工具通过先进的 AI 技术,自动将 PDF 文档内容总结并划分为逻辑清晰的章节,为用户提供高效的信息提取与浏览体验。 智能总结与结构化:重塑 PDF 阅读体验SmartPDFs 的核心功能在于其 AI 驱动的文档总结与结构化能力。
5/8/2025 11:00:55 AM
AI在线

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑新方法,比当前SOTA方法提高9.19%的性能,只用了1/30的训练数据和1/13参数规模的模型。 做到这一切无需额外预训练任务和架构修改,只需要让强大的多模态模型(如GPT-4o)来纠正编辑指令。 这一方法旨在解决现有图像编辑模型中监督信号有噪声的问题,通过构建更有效的编辑指令提升编辑效果。
5/8/2025 8:57:59 AM
量子位

微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」

本论文第一作者为微软 DKI 团队的 Chaoyun Zhang,其为 Windows 平台首个智能体系统 ——UFO 的核心开发者,该项目已在 GitHub 上开源并获得约 7,000 Stars,在社区中引发广泛关注。 同时,他也是一篇超过 90 页的 GUI Agent 综述文章的主要撰写者,系统梳理了该领域的关键进展与技术框架。 其余项目的主要贡献者亦均来自微软 DKI 团队,具备深厚的研究与工程背景。
5/7/2025 9:16:00 AM

阿里通义Qwen3语言模型上线 ,开源实力再升级!

在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。 今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。 此次发布的旗舰模型 Qwen3-235B-A22B 以其2350亿个参数的规模在多个基准测试中展现出强大的竞争力,超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等顶级模型。
5/6/2025 6:00:51 PM
AI在线

MinerU vs DeepDoc:集成方案+图片显示优化

如上篇文章最后所言,进一步优化原始文档解析和分块策略是控制变量法下,提高最后检索效果天花板的务实做法。 从这篇开始,在对历史项目进行迭代的同时,会陆续对不同的文档解析方法和动态分块策略给出更多的原理解析和案例参考。 图片来源:,试图说清楚文档解析工具大致构成,MinerU 和 Deepdoc 对比,MinerU 部署,以及如何和图片服务方案结合使用。
5/6/2025 9:38:50 AM
韦东东

64页论文揭示AI模型排行榜黑幕:Llama4发布前私下测试27个版本,只取最佳成绩

近日,一篇名为《排行榜幻觉》的论文在学术界引发了广泛关注,尤其是对大型语言模型(LLM)领域中备受推崇的 Chatbot Arena 排行榜提出了严厉质疑。 研究指出,排行榜的可信度因数据访问不平等、模型私下测试等问题而受到挑战。 论文显示,一些大型科技公司可以在公开发布之前对多个模型版本进行私下测试。
5/3/2025 11:00:48 AM
AI在线

DeepSeek-Prover-V2-671B 模型开源,数学推理领域迎来新突破

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。 这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。 根据社交媒体上的最新讨论,这一模型被认为是 DeepSeek 在数学领域的重要里程碑,或将推动全球 AI 研究与应用的进一步发展。
4/30/2025 6:00:51 PM
AI在线

​Meta 召开首届 LlamaCon 大会,意在对抗 OpenAI

Meta 在其位于加州门洛帕克的总部举行了首届人工智能开发者大会 ——LlamaCon。 在此次大会上,Meta 推出了一款面向消费者的 AI 聊天机器人应用程序,并发布了一个开发者 API,允许用户在云端访问 Llama 模型。 这些新产品旨在扩大 Meta 开源 Llama AI 模型的采用率,但实际上,Meta 的真正动机可能是超越 OpenAI。
4/30/2025 11:00:50 AM
AI在线

阿里Qwen3-235B-A22B模型正式登陆HuggingChat

由阿里巴巴云开发的 Qwen3-235B-A22B 模型正式在 HuggingChat 平台上线。 这一开源大型语言模型以其强大的推理能力、灵活的模式切换和高效的性能表现,迅速成为业界关注的焦点。 AIbase 通过整理 Twitter 上的最新信息,为您深入解析 Qwen3-235B-A22B 的技术亮点及其对开源 AI 生态的影响。
4/30/2025 10:00:51 AM
AI在线

炸裂登场!Qwen3:等了这一个月,开源AI新王带着“思考引擎”杀来了!

全世界的AI圈子,似乎都在屏息等待。 从各种小道消息到官方偶尔泄露的只言片语,过去这一个月,大家都在猜测阿里通义千问的下一代大模型——Qwen3,到底会带来怎样的惊喜。 今天,靴子终于落地!
4/30/2025 9:11:15 AM
墨风如雪

国内首个「混合推理模型」Qwen3开源,盘点它的N种对接方式!

今日凌晨,通义千问团队正式开源了 Qwen3 大模型,并且一口气发布了 8 个型号,其中包括 0.6B、1.7B、4B、8B、14B、32B 以及 30B-A3B 和 235B-A22B,使用者可以根据自己的业务情况,选择合适的版本进行使用。 更让人惊喜的是,最新的 Qwen3 系列模型具备双模推理能力(深入思考/快速响应)、支持 119 种语言及方言,并强化了 Agent 功能与代码执行能力,全面满足复杂问题处理与全球化应用需求。 “PS:Qwen3 也是国内首个「混合推理模型」,「快思考」与「慢思考」集成进同一个模型,对简单需求可低算力「秒回」答案,对复杂问题可多步骤「深度思考」,大大节省算力消耗。
4/30/2025 2:00:00 AM
磊哥

通义App全面上线千问3 第一时间体验全球最强开源模型

4月29日,通义App与通义网页版(tongyi.com)全面上线阿里新一代通义千问开源模型Qwen3(简称千问3)。 用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强开源模型的顶级智能能力。 据了解,千问3一经发布便登顶全球最强开源模型。
4/29/2025 12:01:00 PM
AI在线

Orange:一个免费的交互式数据挖掘与机器学习平台

Orange 是一款开源的数据分析与可视化工具,专注于数据挖掘和机器学习领域。 它提供了直观的图形化界面,用户无需编程和数学知识即可完成数据科学工作流程,同时也支持通过 Python 脚本实现高级功能。 功能简介Orange 图形化编程对于初学者非常友好,他们可以专注于数据分析本身,而不是耗时的编程工作。
4/29/2025 9:26:34 AM
不剪发的Tony老师

阿里发布开源Qwen3,成本大幅降低仅需DeepSeek-R1的三分之一

阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。 阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。 相比于 DeepSeek-R1,千问3的参数量仅为其三分之一,而部署成本大幅降低,使用仅需四张 H20显卡即可实现满血版的部署。
4/29/2025 9:00:40 AM
AI在线

图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」

全球AI大模型智能涌现,现在正在进入“多模态时间”。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI应用和落地的需求中,多模态也是最重要的能力。
4/28/2025 2:13:43 PM