AI在线 AI在线

AI模型

GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类

GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类

大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM 肆零柒
填补AI模型治理鸿沟:CISO必知的五大关键发现

填补AI模型治理鸿沟:CISO必知的五大关键发现

尽管大多数企业都意识到对AI模型进行强有力治理的必要性,但许多企业仍在努力弥补可能减缓AI应用速度并增加风险的种种差距。 Anaconda一项针对300多名AI从业者和决策者的新调查结果凸显了开源工具存在的安全隐患、模型监控不一致以及AI工具链碎片化带来的运营挑战。 尽管经过验证,安全担忧依然居高不下开源软件是AI开发的核心,但同时也带来了需要谨慎管理的供应链风险,大多数受访者都制定了相关流程,以验证Python软件包的安全性和合规性,这些流程包括从自动化漏洞扫描到维护内部软件包注册表以及进行人工审查等多种方式。
8/20/2025 7:18:00 AM Anamarija
Meta 发布 DINOv3,无需标注数据的通用图像处理 AI 新模型

Meta 发布 DINOv3,无需标注数据的通用图像处理 AI 新模型

Meta 近日宣布推出 DINOv3,这是一种无需标注数据的通用图像处理 AI 模型。 该模型基于 17亿张图像进行自监督学习训练,并构建了 70亿个参数,使其能够处理各种图像任务和领域,几乎无需任何调整。 这一特性使得 DINOv3在那些标注数据有限的专业领域,如卫星图像处理,具有尤其重要的应用价值。
8/18/2025 10:32:15 AM AI在线
免费开源!超多案例实测AI生图模型Flux.1 Krea Dev

免费开源!超多案例实测AI生图模型Flux.1 Krea Dev

嗨大家好! 我是阿真! 7 月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev,最近终于有时间进行测评了。
8/9/2025 12:46:03 AM 阿真Irene
全新的AI模型带来更快速的漏洞检测方案

全新的AI模型带来更快速的漏洞检测方案

一组研究人员开发出一种名为White-Basilisk的新型AI模型,该模型检测软件漏洞的效率高于许多大型系统。 当前,开发人员和安全团队在保障复杂代码库安全方面面临着越来越大的压力,且往往缺乏部署大规模AI工具的资源,该模型正是在这一背景下发布的。 小模型,大成效与需要数十亿参数和强大计算能力的大型语言模型(LLM)不同,White-Basilisk模型非常紧凑,仅有2亿个参数,然而,在多个用于漏洞检测的公共基准测试中,它的表现优于规模超过其30倍的模型,这至少在专门的安全任务方面,对“模型越大越好”的观点提出了质疑。
8/1/2025 2:38:14 PM Mirko Zorz
MedGemma开源发布:谷歌推出支持多医学任务的AI模型套件

MedGemma开源发布:谷歌推出支持多医学任务的AI模型套件

谷歌和DeepMind联合发布了一个全新的开源人工智能模型套件:MedGemma。 这一套件面向医疗领域打造,不仅支持文本、图像和多模态输入,还能广泛适配放射学、皮肤病学、组织病理学和眼科学等多个分支。 它在今年的I/O开发者大会上首次亮相,MedGemma包含两个版本:一个是体量为40亿参数的4B模型,支持图文混合处理;另一个是更强大的270亿参数的27B模型,提供文本和多模态两种版本。
7/31/2025 2:00:15 AM
万字盘点!2025上半年值得推荐的AI模型与产品清单

万字盘点!2025上半年值得推荐的AI模型与产品清单

今年已经过去了一半,突然心血来潮,来更新一期「2025 年上半年,我最推荐的 AI 清单」了。 综合我半年使用的个人看法,不覆盖所有的产品,凭自己印象,直接码出这篇文章。 实在没记起来的好产品,也就不算“我的上半年推荐”了,还请包容。
7/28/2025 1:48:56 AM 一泽Eze
我国自主研发“磐石・科学基础大模型”发布:系统掌握数理化天地生六大学科核心定理

我国自主研发“磐石・科学基础大模型”发布:系统掌握数理化天地生六大学科核心定理

AI在线 7 月 26 日消息,中国科学院“磐石・科学基础大模型”今日在 2025 世界人工智能大会上正式发布。 该模型实现了对波、谱、场等多种科学模态数据的深入理解,具备科学文献萃取融合、科学知识表征推理和科学工具编排规划等核心能力。 当前,“人工智能 科学”研究普遍采用领域数据微调通用大模型、各自构建单一领域专用工具的模式,存在科学数据孤岛、专业推理能力不足、研发生态封闭三大挑战。
7/26/2025 3:12:33 PM 汪淼
AMD 联手 Stability 推首款 BF16 精度 SD 3.0 Medium 模型,针对 XDNA 2 NPU 优化

AMD 联手 Stability 推首款 BF16 精度 SD 3.0 Medium 模型,针对 XDNA 2 NPU 优化

AI在线 7 月 22 日消息,AMD 当地时间昨日一篇博客中宣布,其与 Stability AI 的合作结出了新成果:世界首款采用 BF16 精度格式的 Stable Diffusion 3 Medium 图片生成开源模型。 这一模型专为 AMD 锐龙 AI 300 / 锐龙 AI Max 300 系列处理器搭载的 XDNA 2 架构 NPU 进行优化,需要系统内存 24GB、运行实际内存占用 9GB,可在总内存不足 32GB 的笔记本电脑上实现高质量本地图片生成。 此外,搭载 XDNA 2 NPU 的平台还支持 XDNA 超分辨率:通过两级流水线将 Stable Diffusion 3 Medium 生成的 1024×1024 原始图像增强到分辨率更高的 2048×2048。
7/22/2025 5:15:17 PM 溯波(实习)
一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神

一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神

想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱? ”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。 你认为AI裁判会判定哪个答案正确?
7/18/2025 7:07:00 AM
Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现

AI在线 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。 该系列模型以开源形式推出,可以更低价格提供领先的低错误率表现,支持真实世界的语音智能生产应用。 Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。
7/16/2025 4:53:39 PM 溯波(实习)
AI分析的崛起及其在各行业中的重大影响

AI分析的崛起及其在各行业中的重大影响

译者 | 刘涛审校 | 重楼如今,企业正面临着数据的海量冲击。 从在线购物行为到医院病历记录,每一项业务活动都会源源不断地产生大量信息。 然而,单纯的数据本身并无实际价值。
7/16/2025 8:45:06 AM 刘涛
MiniMax 新股东曝光:新增“上海国资”,近 3 亿美元新融资基本完成

MiniMax 新股东曝光:新增“上海国资”,近 3 亿美元新融资基本完成

7 月 14 日晚间消息,新浪科技从知情人处获悉,大模型公司 MiniMax 近期已基本完成近 3 亿美元新一轮融资。 本轮融资后公司估值超 40 亿美元(约 300 亿元人),本轮融资出资方有上市公司,也有交叉基金和大型国资平台 —— 上海国资。 据知情人士透露,此轮融资在半年前便已经开启,目前已经基本确定。
7/14/2025 10:45:58 PM 文猛
输出效率拉满,体验全面进化!深度测评豆包超能创意2.0

输出效率拉满,体验全面进化!深度测评豆包超能创意2.0

嗨大家好! 周末愉快! 今天是豆包的铁粉阿真!
7/14/2025 1:48:05 AM 阿真Irene
亚马逊宣布全球已部署100万台机器人 新AI模型助力物流效率提升

亚马逊宣布全球已部署100万台机器人 新AI模型助力物流效率提升

据外媒报道,亚马逊近日宣布其全球机器人部署数量已达 100 万台,标志着该公司在自动化与人工智能领域实现重大突破。 与此同时,亚马逊推出名为 DeepFleet 的生成式 AI 基础模型,将进一步提升物流网络运行效率。 资料显示,作为全球最大的移动机器人制造商和运营商,亚马逊自2012 年起持续推进机器人化进程,目前已在全球 300 多个设施中部署机器人系统。
7/2/2025 9:37:02 AM
Chai Discovery发布Chai- 2 模型:零样本抗体设计突破16-20%命中率

Chai Discovery发布Chai- 2 模型:零样本抗体设计突破16-20%命中率

Chai Discovery于2025年6月30日推出全新AI模型Chai-2,标志着抗体设计领域的重大突破。 Chai-2以零样本抗体设计能力著称,实验命中率达16-20%,远超传统方法的0.1%行业标准,为生物制药研发注入新动力。 Chai-2采用多模态生成架构,整合全原子结构预测与生成式建模,可在仅提供目标结构和表位的情况下,从头设计抗体的互补决定区(CDR)。
7/1/2025 11:00:51 AM AI在线
Gemini2.5Pro API 免费回归,开发者社区热烈响应

Gemini2.5Pro API 免费回归,开发者社区热烈响应

近日,谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级,这一消息引发了开发者社区的广泛关注和热烈讨论。 根据AIbase报道,这一举措标志着谷歌在AI技术普及化方面的又一重要进展,为开发者提供了更低门槛的创新机会。 Gemini2.5Pro作为谷歌迄今为止最先进的AI模型,以其卓越的多模态能力和强大的推理性能而闻名。
6/30/2025 11:00:50 AM AI在线
「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。 更多AI资讯访问:、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。 该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。
6/27/2025 5:00:52 PM AI在线