资讯列表

分类

标签

连续思维机器来了！Transformer八子之一创企推出，让AI不再「一步到位」拍脑袋做决定

连续思维机器来了！Transformer八子之一创企推出，让AI不再「一步到位」拍脑袋做决定

科学界的一个共识是：即使是最复杂的现代人工智能，也难以媲美人类大脑的表现和效率。研究者经常从大自然中寻找灵感，了解如何在人工智能领域取得进步，例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。虽然人工神经网络近年来让人工智能取得了非凡的成就，但它们仍然是其生物对应物的简化表征。

5/13/2025 8:56:54 AM

OpenAI 发布并开源医疗测试基准 HealthBench，旨在更好地衡量 AI 系统在医疗健康领域能力

OpenAI 发布并开源医疗测试基准 HealthBench，旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是，HealthBench 的 5000 段核心测试对话，由来自 60 个国家 / 地区的 26 个专业 262 名医生打造，极大增强了该测试集的难度、真实性以及丰富度。

5/13/2025 8:41:48 AM 问舟

o3 vs o4 mini vs Gemini 2.5 pro：终极推理之战

o3 vs o4 mini vs Gemini 2.5 pro：终极推理之战

译者 | 李睿审校 | 重楼随着技术的发展和进步，人工智能模型越来越智能，但究竟哪一种人工智能模型能在压力下展现出真正的推理能力？本文对o3、o4-mini和Gemini 2.5 Pro这三种人工智能模型进行了一系列测试：物理谜题、数学问题、编码任务和现实世界的智商测试。而应对这些挑战并没有任何捷径，而只有对它们思维能力的考验。

5/13/2025 8:24:14 AM 李睿

CodeBuddy的七种武器

CodeBuddy的七种武器

中学时代非常喜欢看武侠小说，“飞雪连天射白鹿，笑书神侠倚碧鸳”自然不在话下，还看过梁羽生的《白发魔女传》与《七剑下天山》等书，当然还有古龙的《多情剑客无情剑》《绝代双骄》等，以及颇具特色的《七种武器》。近来使用CodeBuddy，于是借用“七种武器”的噱头，聊一下CodeBuddy的七个功能特性，过一把武侠瘾。 1.长生剑：Craft智能体在编程江湖的传说里，Craft智能体就像一柄藏在键盘中的"长生剑"——这柄剑没有锋刃却通晓编程，剑鸣轻响间便能将言语化作代码星河。

5/13/2025 8:20:58 AM 曹洪伟

无需邀请码！国产AI智能体Manus宣布向所有人开放注册

无需邀请码！国产AI智能体Manus宣布向所有人开放注册

近日，国产AI智能体平台Manus正式宣布开放用户注册，用户无需加入等待名单即可直接注册使用。 Manus在公告中明确表示，所有注册用户每日均可免费执行一项任务，并获得300积分的奖励，同时，新用户还将一次性获得1000积分的额外馈赠。回顾Manus的发展历程，该平台由来自中国的创业公司Monica于今年3月6日正式发布。

5/13/2025 8:00:42 AM AI在线

热潮过后 Manus 宣布全面开放注册，用户每天可免费执行一项任务

热潮过后 Manus 宣布全面开放注册，用户每天可免费执行一项任务

Manus在公告中表示，Manus向所有人开放，无需等待名单；所有用户每天可免费执行一项任务（300积分），所有用户一次性获得1,000积分奖励。

5/13/2025 7:21:25 AM 问舟

CIO如何将AI炒作转化为切实的业务成果

CIO如何将AI炒作转化为切实的业务成果

在企业中，AI的优先级并不总是被完全理解，技术投入与投资既可以相辅相成，也可能相互掣肘。在Foundry的《2025年AI优先级研究》中，企业透露他们正在为AI项目分配比以往更多的资金，近一半的企业现在都在为AI项目预留预算，这一比例从2023年的36%有所上升，此外，他们还将近25%的IT支出用于AI计划。虽然有些企业比其他企业采取更为审慎的态度，但南非科技领袖们的共识是，AI投资必须带来切实的成果，且AI预算必须在整个企业中战略性地分配。

5/13/2025 7:00:00 AM Joanne

推理模型越来越强，大模型微调还有必要吗？

推理模型越来越强，大模型微调还有必要吗？

最近笔者在将大模型服务应用于实际业务系统时，首先一般习惯性用一些闭源api服务，花上几块钱快速测试下流程，然后在去分析下大模型效果。如果通过几次调整Prompt或者超参数还是出现的bad cases比较多（比如输出结果的结构化有问题，输出结果不理想，在某些专业领域不同模型结果表现不一并且效果比较差），这个时候需要考虑下通过微调的方式来训练大模型。现在的大模型推理能力越来越厉害，人们开始怀疑：我们还需要花时间和资源去微调大模型吗？

5/13/2025 5:11:00 AM ChallengeHub

AI训练的反直觉发现：添加"有毒"数据反而能造就更好的语言模型？

AI训练的反直觉发现：添加"有毒"数据反而能造就更好的语言模型？

"当坏数据能够创造出好模型，AI训练领域又一个传统观念被颠覆"你有没有听说过这样一个说法：垃圾进，垃圾出？在AI大语言模型的训练中，这一直是个不言自明的准则。工程师们花费大量时间和资源过滤训练数据，移除那些含有有毒、有害或不适当内容的文本，以防止模型学习和生成这些内容。

5/13/2025 2:22:00 AM 无影寺

速通BOSS需求！零基础AI Agent高效工作流设计指南（二）

速通BOSS需求！零基础AI Agent高效工作流设计指南（二）

前言. 此次会连载一套 AI Agent 构建的系列，主要分为三部分，上篇是速通 AI Agent 构建的工作流基础，本篇则是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台，给大家提供一些思路与窍门，下篇则是借助 Agent 平台构建一个 AI Agent 案例，本系列意图主要是帮助大家贯通工作流的搭建形式，并尝试为自己搭建一些可用的 AI 助手，或是提供构建的方法指引。上期回顾：.

5/13/2025 2:16:53 AM 泡泡bing

国产大模型「五强争霸」，决战AGI！

国产大模型「五强争霸」，决战AGI！

DeepSeek的横空出世，已经彻底改变了全球的AI局势。从此，不仅中美大模型竞争格局改变，国产大模型的产业版图，也被一举打破！纵观中国基础大模型的市场，可以看到，如今的基础大模型版图已然改天换地，演变为全新的五强格局——字节、阿里、阶跃星辰、智谱，以及DeepSeek。

5/13/2025 2:00:22 AM 新智元

AI自我复制：技术突破下的风险挑战

AI自我复制：技术突破下的风险挑战

从诞生之初到现在，人工智能已经取得了长足的进步。早期的人工智能系统是人类创造的奇迹，但完全依赖于人类的持续指导，存在很大局限性。几十年来，伴随技术的发展，人工智能从基础的机器学习演变为更为复杂的神经网络。

5/13/2025 2:00:00 AM Yu

一文了解！MCP 技术生态全面解析：核心组件、工作流程、生命周期

一文了解！MCP 技术生态全面解析：核心组件、工作流程、生命周期

在 AI 领域，模型上下文协议（MCP）的出现，就像是一场及时雨，完美地解决了 AI 模型与外部工具和资源交互的难题，让它们之间的协作变得轻松又自然，彻底打破了数据孤岛的困境，让不同系统之间的互操作性不再是梦想。一、MCP 核心组件：架构精解MCP 架构：MCP 主要有三个核心组件，分别是 MCP 主机、MCP 客户端和 MCP 服务器，它们三个相互配合，让 AI 应用和外部工具、数据源之间能够无缝通信。 MCP 主机：就好比是一个大舞台，为执行 AI 任务提供了演出环境，并且在这个舞台上运行着 MCP 客户端，没有它，整个表演就没办法开始。

5/13/2025 1:45:00 AM 小智

HippoRAG：基于海马体记忆索引理论的知识密集型任务新突破

HippoRAG：基于海马体记忆索引理论的知识密集型任务新突破

在自然语言处理领域，大语言模型（LLMs）已经取得了令人瞩目的成就。然而，当面对知识密集型任务时，例如科学文献综述、法律案件简报或医疗诊断，这些模型往往显得力不从心。它们难以有效地整合新的或特定领域的知识，而现有的检索增强生成（RAG）方法也因无法满足复杂的跨段落或文档的知识整合需求而受到限制。

5/13/2025 1:00:00 AM Goldma

程序员学习下，使用Cursor+MCP 提高开发效率

程序员学习下，使用Cursor+MCP 提高开发效率

AI正在深刻改变着软件开发的方式。在传统的开发模式中，程序员需要记忆大量的语法规则、API文档和最佳实践，这不仅增加了学习成本，还限制了开发效率。 Cursor最引人注目的特色在于其内置的AI助手系统。

5/13/2025 12:05:00 AM Tom哥

AI Agent如何悄然改变前端开发

AI Agent如何悄然改变前端开发

AI Agent正悄然改变前端开发！从代码助手到自主系统，能扫描UI仓库、优化布局、重构组件。 Copilot编写代码，ChatGPT生成React组件，未来属于嵌入开发环境的持久Agent，驱动UX策略、设计和性能工程。

5/13/2025 12:00:25 AM 岱军

新研究用逆强化学习识别 Reddit 用户行为：部分网友“就是爱抬杠”

新研究用逆强化学习识别 Reddit 用户行为：部分网友“就是爱抬杠”

以往的方法多半着眼于用户说了什么或和谁互动，但这些方式本身也有盲点。新研究提出了一个更有效的视角：观察用户的行为模式，而不仅仅是他们说的话。

5/12/2025 10:36:09 PM 清源

腾讯混元 T1-Vision 上线元宝：可深度理解图片内容

腾讯混元 T1-Vision 上线元宝：可深度理解图片内容

腾讯混元T1-Vision上线元宝，融合多模态原生长思维链，可深度理解图片内容，反应时间更快，完答速度提升1.5倍。 #腾讯混元# #AI技术#

5/12/2025 8:35:19 PM 远洋

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 GGUF 是什么？一文看懂大模型里最火的模型格式 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Sora、可灵、即梦哪家强？AI视频软件深度测评！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉