模型

超越OpenAI、拿下全球双料第一，“AI吴彦祖”背后大模型SOTA了！

超越OpenAI！国产大模型突袭，AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02，同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一！

5/16/2025 10:15:06 AM

Llamafile 0.9.3震撼支持Qwen3！单文件运行大模型，跨平台便携性炸裂，AI推理更简单！

近日，Mozilla旗下开源项目Llamafile发布0.9.3版本，正式宣布支持Qwen3系列大语言模型。这一更新通过融合llama.cpp与Cosmopolitan Libc，将复杂的大模型推理过程浓缩为一个可执行文件，极大提升了跨平台便携性和部署效率。 AIbase深入解读这一突破性进展，探索Llamafile如何为AI开发者与用户带来全新体验。

5/16/2025 10:01:05 AM AI在线

Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA

Meta 近日重磅发布了其迄今为止规模最大的 AI 驱动化学开放数据集 OMol25，并同步推出了用于预测分子和材料化学性质的通用人工智能模型 UMA（Universal Atom Model）。这两项创新成果旨在加速药物研发、电池材料开发和催化剂研究等关键领域。据 Meta 介绍，OMol25数据集包含了超过1亿次高精度的分子计算数据，其规模远超此前任何公开的同类数据集。

5/16/2025 10:01:05 AM AI在线

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外大模型。如今，在语音 AI 领域，国产大模型第一梯队的重量级选手 MiniMax 又抛下了一颗「重磅炸弹」。

5/16/2025 9:12:00 AM

阿里开源全能视频模型！生成编辑都精通，1.3B版本消费级显卡可跑

业界功能最全、消费级显卡可跑、而且还是开源的？不卖关子了，这就是阿里最新开源的通义万相Wan2.1-VACE，号称当前业界功能最全的视频生成与编辑模型。有多全呢？

5/16/2025 9:08:00 AM

个人开发者训400亿参数大模型：分布式算力，DeepSeek架构，3090单卡部署

打破科技巨头算力垄断，个人开发者联手也能训练超大规模AI模型？ Nous Research宣布推出Psyche Network，可以将全球算力整合起来训练强大的人工智能。 Psyche是一个基于Deepseek的V3 MLA架构的去中心化训练网络，测试网首次启动时直接对40B参数LLM进行预训练，可以在单个H/DGX上训练，并在3090 GPU上运行。

5/16/2025 9:06:00 AM

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

5/16/2025 9:02:00 AM

DeepSeek-V3 发布新论文，揭示低成本大模型训练的奥秘

近日，DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文，重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。这篇长达14页的论文不仅总结了 DeepSeek 在开发 V3过程中的经验与教训，还为未来的硬件设计提供了深刻的见解。值得注意的是，DeepSeek 的 CEO 梁文锋也参与了论文的撰写。

5/16/2025 9:00:55 AM AI在线

Meta 推迟 Behemoth 发布引发内部担忧，股价一度下跌超3%

5/16/2025 9:00:55 AM AI在线

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

昨天，全球著名开源大模型平台DeepSeek在huggingface发布了，超强开源模型V3的论文。主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。其中，DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。

5/16/2025 8:58:09 AM

ICML 2025 | 大模型深度思考新范式：交替「推理-擦除」解决所有可计算问题

作者介绍：本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓，研究兴趣是机器学习理论和大模型推理，在 ICML，NeurIPS，ICLR 等顶级会议上发表过论文。本文提出一个交替「推理 - 擦除」的深度思考新范式 PENCIL，比传统 CoT 更高效地解决更复杂的推理任务。理论上，我们证明 PENCIL 可用最优空间与最优时间下解决所有可计算问题，而这对于传统的 CoT 是不可能的！

5/16/2025 8:44:01 AM

Poe 报告：可灵大模型视频生成量约占30%份额领先Runway

近日，全球知名的大模型整合应用平台 Poe 发布了2025年春季 AI 模型使用趋势报告。报告显示，在文生视频领域，中国的快手可灵多款视频生成模型迅速崛起，已占据了约30% 的市场份额，领先于 Runway 和谷歌的 Veo2。图源备注：图片由AI生成，图片授权服务商Midjourney特别值得一提的是，可灵2.0模型自今年4月推出以来，仅仅在三周内就取得了21% 的使用比例，展现出其强大的市场吸引力和应用能力。

5/15/2025 3:00:45 PM AI在线

新版Claude曝光：“极限推理”成最大亮点

O家（OpenAI）刚免费上线GPT-4.1，A家（Anthropic）这边也被曝出新消息——新版Claude Sonnet和Claude Opus，已经在路上了！这一消息来自The Information，根据它的说法，新版模型最大的亮点，就是“极限推理”（Extreme reasoning）。简单来说，这个新功能是通过在推理和工具使用之间建立动态循环，能够更智能地处理问题。

5/15/2025 2:39:17 PM

一个提示攻破所有模型，OpenAI谷歌无一幸免！

如果一句不足200字的提示词系统就能轻松撕开顶级大模型的安全护栏，让ChatGPT、Claude、Gemini统统「叛变」，你会作何感想？这正是HiddenLayer最新研究抛出的震撼炸弹——一种跨模型、跨场景、无需暴力破解的「策略傀儡」提示。只需把危险指令伪装成XML或JSON配置片段，再配上一段看似无害的角色扮演，大模型便乖乖奉上危险答案，连系统提示都能原封不动「倒带」出来。

5/15/2025 2:37:17 PM

新晋顶流Agent颠覆设计师！Lovart一手实测来了：是该刷屏爆火

又一个Agent火爆全网——一句话搞定专业视觉设计，就连专业设计师大V都在疯狂安利！画风be like：咱就是说，一整个被fashion住了。创作出它们的设计从业者@Ege表示，自己用这个AI设计助手轻松搞定了一整套时装品牌视觉设计方案，而原本他自己一个人需要“花好几天时间”。

5/15/2025 1:43:44 PM

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

vivo自研大模型用的数据筛选方法，公开了。香港科技大学和vivo AI Lab联名提出PreSelect，目前已被ICML 2025接收。这是一种轻量级且高效的数据选择方法：只需要训练和部署一个基于fastText的评分器，就可以减少10倍的计算需求。

5/15/2025 1:40:13 PM

Lightricks发布LTX-Video-13B精炼模型！10秒生成高清AI视频，速度与质量双飞跃！

近日，以色列科技公司Lightricks发布了其开源AI视频生成模型的最新版本——LTX-Video-13B精炼模型（LTXV-13B v0.9.7-distilled）。这款模型以130亿参数为基础，通过多尺度渲染技术和高效量化优化，将视频生成速度提升至惊人的10秒以内，标志着AI视频生成技术的新里程碑。 AIbase深入解析这一突破性进展，带您了解其技术亮点与行业影响。

5/15/2025 12:00:54 PM AI在线

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

模型

超越OpenAI、拿下全球双料第一，“AI吴彦祖”背后大模型SOTA了！

Llamafile 0.9.3震撼支持Qwen3！单文件运行大模型，跨平台便携性炸裂，AI推理更简单！

Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

阿里开源全能视频模型！生成编辑都精通，1.3B版本消费级显卡可跑

个人开发者训400亿参数大模型：分布式算力，DeepSeek架构，3090单卡部署

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

DeepSeek-V3 发布新论文，揭示低成本大模型训练的奥秘

​Meta 推迟 Behemoth 发布引发内部担忧，股价一度下跌超3%

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

ICML 2025 | 大模型深度思考新范式：交替「推理-擦除」解决所有可计算问题

最新总结，不同抽取任务哪个模型最能打

Poe 报告：可灵大模型视频生成量约占30%份额 领先Runway

新版Claude曝光：“极限推理”成最大亮点

一个提示攻破所有模型，OpenAI谷歌无一幸免！

新晋顶流Agent颠覆设计师！Lovart一手实测来了：是该刷屏爆火

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

Lightricks发布LTX-Video-13B精炼模型！10秒生成高清AI视频，速度与质量双飞跃！

Meta 推迟 Behemoth 发布引发内部担忧，股价一度下跌超3%

Poe 报告：可灵大模型视频生成量约占30%份额领先Runway