资讯列表

分类

标签

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

当前最强大的大语言模型（LLM）虽然代码能力飞速发展，但在解决真实、复杂的机器学习工程（MLE）任务时，仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码，却无法模拟人类工程师那样，在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。为了打破这一瓶颈，来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo，一个专为训练和评测大模型智能体（LLM Agents）设计的“交互式武馆”。

7/28/2025 8:45:00 AM

超大模型推理加速2.18倍！SGLang联合美团技术团队开源投机采样训练框架

专门适用超大模型、带来2.18倍推理加速，最新投机采样训练框架开源！ SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。 SGLang，当前趋势下最受青睐的推理框架之一，为DeepSeek提供了专属优化，也深受英伟达、AMD、xAI等厂商喜爱。

7/28/2025 8:42:00 AM

研究人员发现奇怪现象：思考时间越长，大模型越笨

Michael Nuñez@MichaelFNunez译者 | 核子可乐审校 | 重楼Anthropic一项最新研究表明，AI模型耗费更长时间“思考”后表现未必更好，在某些情况下性能甚至会显著下降。这一发现，挑战了AI行业推理浪潮的理论根基。这项由Anthropic公司AI安全研究员Aryo Pradipta Gema及其他几位研究人员主导的项目，发现了所谓“测试时计算反比例”迹象，即延长大语言模型的推理长度实际上会降低其在多种任务中的表现。

7/28/2025 7:45:36 AM

核子可乐

智元机器人拟进军海外市场，全球化方面已有部署

AI在线 7 月 28 日消息，据《科创板日报》报道，智元机器人具身业务总裁姚卯青向记者透露，智元机器人目前在北美、欧洲、中东、日本及东南亚等国家及地区，与当地合作伙伴围绕海外市场的本地化、全球化方面已有部署。 AI在线注意到，智元机器人联合创始人兼 CTO 彭志辉（稚晖君）在 WAIC 主论坛上发布了业界首个具身智能操作系统参考框架“智元灵渠 OS”开源计划。该计划将于今年第四季度开始逐步开源，旨在共建具身智能操作系统生态，突破具身智能系统在智能化提升、群体协同、云边端融合等新技术上的挑战，对标 PC 时代的 Windows、移动互联网时代的鸿蒙。

7/28/2025 7:05:00 AM

浩渺

数据的五宗罪，道出了数据治理的真正内涵

"老板，我们的数据量已经达到了PB级别！ " "那我们的业务决策准确率提升了吗？ " "这个......" 这就是当下企业面临的真实困境：数据的"富营养化"。

7/28/2025 6:00:00 AM

大数据AI智能圈

与Claude协作开发Go项目：AI编程实战指南

在软件开发领域，大语言模型正在改变我们编写代码的方式。作为一名有着丰富实践经验的开发者，我发现与Claude这样的AI工具协作时，关键不在于让AI完全接管开发工作，而在于建立合适的约束和工作流程。本文将分享我在使用Claude进行Go语言开发时总结的最佳实践，包括项目结构设计、代码质量控制、智能体协作以及如何构建一个可靠的AI结对编程工作流。

7/28/2025 4:22:00 AM

源自开发者

8个月1亿美元ARR神话：Lovable是如何"干翻"OpenAI和Cursor的？

你有没有发现，最近程序员圈子里又开始"内卷"了？不过这次不是卷技术，而是在卷一个让人震惊的数字：8个月，1亿美元ARR。说这个数字的时候，我自己都觉得有点不太现实。

7/28/2025 4:10:00 AM

阿丸笔记

协同 RAG-Reasoning：让大模型边想边查的“深度研究”范式

大家好我是肆〇柒。在AI领域，大型语言模型（LLM）已经展现出卓越的语言生成能力，并在诸多任务中取得了显著成果。然而，LLM 存在两大局限：一是知识幻觉，因其知识存储静态且参数化，易生成错误内容；二是复杂推理能力不足，难以应对现实世界的复杂问题。

7/28/2025 3:00:00 AM

肆零柒

Dify新版1.7发布，这两个重要更新你必须知道！

Dify 又发布新版了，这次也是直接从 V1.6.0 升级到 V1.7.0 了，那这次升级的主要内容是啥呢？接下来我们一起来看。这次升级除了修复了一些列 BUG 和部分功能优化之外，最大的升级是提升了 Dify 的安全性和版本兼容性。

7/28/2025 2:00:00 AM

磊哥

FastAPI开发AI应用：模型新增图片理解

本文将深入讲解如何在 FastAPI AI 聊天应用中实现图片理解功能，让 AI 能够理解和分析用户上传的图片内容。通过本教程，你将学会如何构建完整的多模态交互系统，包括图片上传、预处理、多模态消息格式化以及流式响应处理等核心技术。本文概述想象一下，当你向 AI 发送一张图片时，AI 不仅能看懂图片内容，还能基于图片进行深度分析和对话——就像一个拥有视觉能力的智能助手。

7/28/2025 1:55:00 AM

wayn

万字盘点！2025上半年值得推荐的AI模型与产品清单

今年已经过去了一半，突然心血来潮，来更新一期「2025 年上半年，我最推荐的 AI 清单」了。综合我半年使用的个人看法，不覆盖所有的产品，凭自己印象，直接码出这篇文章。实在没记起来的好产品，也就不算“我的上半年推荐”了，还请包容。

7/28/2025 1:48:56 AM

一泽Eze

OpenAI 多智能体研究框架：构建高效协作的AI代理系统

在人工智能快速发展的今天，单一AI模型已难以满足复杂任务的需求，多智能体系统正成为解决复杂问题的重要方向。 OpenAI推出的多智能体研究框架（Multi-AI Agent Research Framework）通过协调多个各司其职的AI代理，实现了远超单一模型的研究能力和应用价值。本文将深入解析这一框架的核心原理、架构设计、实际应用及未来潜力，为开发者和企业提供全面的参考指南。

7/28/2025 1:33:00 AM

大模型之路

Claude Code官方揭秘！内部使用指南曝光：员工都是这样用CC的！把 AI 当老虎机，不改错直接重来！网友：你有钱你任性！

出品 | 51CTO技术栈（微信号：blog51cto）Claude团队，你是懂“写教程”的！昨天，Claude 官方发布了一篇实打实的案例报告，标题相当直白：《Anthropic 团队是怎么用 Claude Code 的？》标题越朴素，内容越干货。

7/28/2025 1:00:00 AM

伊风

方法论+实战案例！带你全面深入掌握 Coze 工作流

可能是全网最好的 Coze 教程（之一），带你一次性入门 Coze 工作流。即使是非技术出身的爱好者，也能上手跟学，一站式学会 AI Agent 从设计到落地的全流程方法论。写在开头.

7/28/2025 12:03:24 AM

一泽Eze

阿里国际AI进展：日均调用量已破10亿次，获 WAIC 2025「SAIL之星」

7月26日，2025世界人工智能大会卓越人工智能引领者SAIL奖公布，阿里国际跨境电商AI解决方案Marco斩获本届SAIL之星，成为该领域的首个获得者。 Marco由阿里国际AI Business团队研发，支持30余种语言，覆盖电商全链路60 场景，从生成式大模型到AI agent，为商家解决营销、合规、售后等一系列问题，且成本低于主流大模型。目前阿里国际旗下所有电商平台均已接入了AI解决方案。

7/27/2025 11:36:00 PM

陈彩娴

PPIO亮相WAIC 2025，重磅推出Agentic AI基础设施服务平台

7月26日至29日，中国领先的独立分布式云计算服务商PPIO亮相2025 世界人工智能大会暨人工智能全球治理高级别会议（WAIC）。 PPIO联合创始人兼CEO姚欣在WAIC活动上重磅发布了国内首个Agentic AI基础设施（Infra）服务平台，加速Agent应用的开发和规模化落地。针对Agent（智能体）特性的开发需求，PPIO推出了AI智能体平台产品，分为通用版和企业版。

7/27/2025 11:10:00 PM

陈彩娴

菲尔兹奖得主深度参与，WAIC全方位探讨「AI for Math」

2025 年 7 月 26 日，上海世博展览馆迎来一场聚焦 "人工智能的数学边界与基础重构" 的高端论坛。作为世界人工智能大会（WAIC）的重要组成部分，这场由上海市普陀区人民政府与菲数中国主办、上海市人工智能行业协会和上海东浩兰生威客引力信息科技有限公司联合承办的盛会，正成为全球关注的焦点。当 AI 技术与数学研究进入深度交织的新阶段，2025 WAIC 的召开恰如一场及时雨，为二者的协同发展搭建了关键对话平台。

7/27/2025 10:48:00 PM

ScienceAI

AI遇上华夏上古，复旦、上智院、上海创智学院联合发布早期中华文明多模态大模型

编辑 | 心悦最近几年，人工智能（AI）凭借处理海量数据的强大能力，洞察了科学数据背后的规律，正逐步变革科学研究范式，我们似乎已经看到 AI 驱动一个又一个未来科学发现。如果我们将目光置于历史长河，当 AI 遇上上古文明，依托这份洞察规律的强大能力，又会碰撞出怎样的火花？ 7 月 26 日，在 2025 世界人工智能大会（WAIC 2025）星河启智科学智能开放合作论坛上，全球首个聚焦早期中华文明议题的人工智能模型问世了。

7/27/2025 10:47:00 PM

ScienceAI

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） 2024年12月AI微信公众号排行榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science 腾讯 Agent Claude 芯片 Stable Diffusion 具身智能蛋白质 xAI 开发者人形机器人生成式神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度 GPU 生成字节跳动工具华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成亚马逊 DeepMind AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉