资讯列表

分类

标签

Artificial Analysis：DeepSeek成为世界前二AGI实验室

Artificial Analysis：DeepSeek成为世界前二AGI实验室

模型与 API 独立分析公司 Artificial Analysis 发布了对 DeepSeek R1-0528的最新评估报告，结果显示，DeepSeek R1在技术性能上取得了显著突破，一举超越了 xAI、Meta 和 Anthropic，与谷歌平起平坐，成为全球第二大人工智能实验室。同时，DeepSeek 在开源权重领域也确立了其无可争议的领导地位。根据 Artificial Analysis 的智能指数，DeepSeek R10528版本在对所有顶尖模型进行的七项主流评估中得分从60分跃升至68分。

5/30/2025 9:05:04 AM AI在线

阿里巴巴开源自主搜索 AI 智能体 WebAgent 让研究更高效

阿里巴巴开源自主搜索 AI 智能体 WebAgent 让研究更高效

阿里巴巴在 GitHub 上发布了其创新的自主搜索 AI 智能体 ——WebAgent。这款 AI 智能体具备端到端的信息检索和多步推理能力，能够像人类一样在网络环境中主动搜索、分析和决策。它的推出将极大提升研究人员获取和整理信息的效率。

5/30/2025 9:05:04 AM AI在线

百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型

百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型

百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。这一重要更新于5月29日上线，旨在为企业和用户提供更强大的 AI 能力和支持。千帆模型开发平台不仅上架了这一全新大模型，还同步推出了一系列实用功能，包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。

5/30/2025 9:05:04 AM AI在线

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

复刻DeepSeek-R1的长思维链推理，大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为：大模型无需接触真实答案，仅通过优化自己的信心，就能学会复杂推理。具体来说，新方法完全不需要外部奖励信号或标注数据，只需使用模型自身的置信程度作为内在奖励信号。

5/30/2025 9:05:00 AM

SOTA大模型遇上加密数据评测：Qwen3未破10%，o1也栽了丨上海AI Lab等联合研究

SOTA大模型遇上加密数据评测：Qwen3未破10%，o1也栽了丨上海AI Lab等联合研究

大语言模型遇上加密数据，即使是最新Qwen3也直冒冷汗！尽管当前的推理模型在各类基准测试中展现出卓越的性能，但在密码学这一对逻辑严密性和细节精确度要求近乎苛刻的专业领域，模型的推理能力仍有待深入探索。密码学不仅需要模型具备高阶数学运算能力和严密的逻辑推理链条，更要求其能够精准识别复杂加密模式中的潜在规律；成功解密需要模型具有极强的综合推理能力。

5/30/2025 9:03:00 AM

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

本文介绍工作由中国人民大学高瓴人工智能学院宋睿华团队、李崇轩、许洪腾与值得买科技 AI 团队共同完成。第一作者王希华是人大高瓴博士生（导师：宋睿华），他的研究兴趣主要在多模态生成，之前提出利用音频布局（audio layout）为视频生成同步声音的TiVA模型，已发表在MM 2024。宋睿华的团队主要研究方向为多模态理解、生成与交互。

5/30/2025 9:00:00 AM

RSS 2025｜从说明书学习复杂机器人操作任务：NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

RSS 2025｜从说明书学习复杂机器人操作任务：NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

本文共同第一作者为新加坡国立大学博士生铁宸睿和多伦多大学研究助理/本科生孙圣翔。合作者为朱锦轩、刘益伟、郭京翔、胡越、陈浩楠、陈俊廷、吴睿海。通讯作者为新加坡国立大学计算机学院助理教授邵林，研究方向为机器人和人工智能。

5/30/2025 8:55:00 AM

LLM省钱大测评！48块GH200，首个百亿级参数量实证

LLM省钱大测评！48块GH200，首个百亿级参数量实证

近年来，大型语言模型（LLM）如GPT系列取得了革命性进展，在自然语言处理、内容创作、多语言翻译乃至科学研究等众多领域展现出惊人能力。然而，模型参数量（如DeepseekR1的671B参数）和上下文窗口的急剧膨胀，带来了巨大的计算力（GPT-3训练约需3640Petaflop/s-days）、能源消耗和资金投入（GPT-3训练成本估计超460万美元）。高昂的成本已成为制约LLM进一步发展和广泛应用的关键瓶颈。

5/30/2025 8:50:00 AM

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告，进一步披露了这个模型的细节。训练超大规模和极高稀疏性的 MoE 模型极具挑战，训练过程中的稳定性往往难以保障。

5/30/2025 8:45:00 AM

100亿H20没卖出，英伟达狂赚1000多亿破纪录！

100亿H20没卖出，英伟达狂赚1000多亿破纪录！

英伟达狂赚不止，再次交出了亮眼成绩单！今早，英伟达2026财年第一季度财报公布，再次破纪录：营收达441亿美元，较上一季度增长12%，较去年同期增长69%数据中心收入达391亿美元，较上一季度增长10%，较去年同期增长73%数据中心占据收入的大头，其次为游戏。受新出口许可要求影响，英伟达因H20库存积压及采购义务，在本季度计提了45亿美元费用。

5/30/2025 8:40:00 AM

关于 Claude 4 的一切，千万别错过这篇文章

关于 Claude 4 的一切，千万别错过这篇文章

想在 AI 领域保持领先？千万别错过这篇文章！介绍现在，AI 巨头们几乎天天都在争相推出更先进的模型。

5/30/2025 8:11:30 AM 前端小智

出门问问上线 Mobvoi MCP Server

出门问问上线 Mobvoi MCP Server

5月29日，人工智能公司出门问问正式上线Mobvoi MCP Server，并开源代码，通过一站式集成多项AI能力，真正帮助用户实现“AI能力自由”。 Mobvoi MCP Server集成了语音生成、声音克隆、图片驱动数字人、视频配音、视频翻译等多项能力，用户只需简单输入文本，即可灵活调用这些服务。目前，该平台已兼容Cursor、Cline、Claude Desktop、Windsurf、OpenAI Agents等MCP客户端，完美适配多场景及多端工作流，无论是代码小白、AI Coding爱好者，还是开发工程师，均可轻松上手。

5/30/2025 8:00:54 AM AI在线

腾讯元宝正式接入DeepSeek R1-0528 最新版

腾讯元宝正式接入DeepSeek R1-0528 最新版

腾讯元宝正式宣布接入DeepSeek R1-0528最新版，并在电脑版、网页版同步提供抢先体验，此次模型更新带来了三大显著变化，为用户带来更加优质、高效的AI使用体验。在推理能力上，新模型展现出了更强的实力。无论是处理复杂的代码问题，还是深入分析各类难题，都能够做到快速且准确，为用户提供可靠的解决方案。

5/30/2025 8:00:54 AM AI在线

DeepSeek免费超越GPT-4？

DeepSeek免费超越GPT-4？

DeepSeek 最新发布了 R1-0528 版本，这次更新的最大亮点是"深度思考"能力大幅提升。很简单：进入 DeepSeek 官网、APP 或小程序，在对话界面开启"深度思考"功能即可。图片API 接口也同步更新，调用方式保持不变。

5/30/2025 7:40:56 AM 程序员NEO

DeepSeek-R1小升级！体验后有被惊艳到

DeepSeek-R1小升级！体验后有被惊艳到

今年1月，DeepSeek-R1横空出世，凭借在性能和成本方面展现出的巨大优势，迅速成为全球人工智能(AI)领域瞩目的焦点。时隔四个月，这款大模型迎来了小升级。 5月28日，DeepSeek正式发布了R1的最新版本——DeepSeek-R1-0528。

5/30/2025 6:57:53 AM Yu

阿里巴巴开源自主搜索 AI 智能体 WebAgent

阿里巴巴开源自主搜索 AI 智能体 WebAgent

WebAgent 不仅能识别文献中的关键信息，还能通过多步推理将不同文献中的观点进行整合，最终为用户提供一份全面且精准的研究报告。

5/30/2025 6:40:47 AM 问舟

随着经济压力加大，零售商利用AI来优化成本

随着经济压力加大，零售商利用AI来优化成本

面对关税和消费者支出模式带来的压力，零售企业正依赖AI和其他技术来优化成本，以保持竞争力。随着许多零售商为今年剩余时间内的增长放缓做准备，因为市场波动仍在持续，Ralph Lauren Corporation、Revolve . Group和Williams-Sonoma正优先考虑对AI工具的投资，希望这些工具能减轻经济逆风的影响，并改善客户和员工的体验。

5/30/2025 6:00:00 AM Lindsey

【一文读懂AI核心要点】什么是大模型？你真的知道“大模型”和“大语言模型”的区别吗？

【一文读懂AI核心要点】什么是大模型？你真的知道“大模型”和“大语言模型”的区别吗？

在人工智能领域，“大模型”和“大语言模型”这两个词经常被提及，很多人甚至把它们当成了同义词。其实，这两者之间存在本质的区别。今天，我就带你深入剖析什么是大模型，什么是大语言模型（LLM），它们的区别在哪里，以及如何利用这些模型提升你的项目效率。

5/30/2025 5:00:00 AM 爱学习的蝌蚪

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Sora、可灵、即梦哪家强？AI视频软件深度测评！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉