智能体
SCIENCEBOARD:构建智能体驱动的科学探索新「环境」
大家好,我是肆〇柒。 今天,我们来聊聊 SCIENCEBOARD,这是一个由香港大学、上海人工智能实验室、复旦大学、北京大学、南京大学、华东师范大学和耶鲁大学等,多所知名高校和研究机构共同打造的创新平台。 它致力于在多域科学工作流中评估多模态自主智能体,为推动 AI 驱动的科学发现提供了全新的方法和工具。
6/27/2025 7:00:00 AM
肆零柒
一文彻底搞懂智能体Agent基于ReAct的工具调用
前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
6/27/2025 6:00:00 AM
AI大模型应用开发
Gartner 预测:市场冷静后,2027 年底超 40% 智能体(代理)AI 项目将被取消
Gartner 认为,今年以来愈演愈烈的 AI 智能体概念热潮在很大程度上是炒作的结果,很多项目的“智能体化”仅仅是品牌名称重塑。
6/26/2025 2:47:23 PM
溯波(实习)
首个面向科学任务、真实交互、自动评估的多模态智能体评测环境,ScienceBoard来了
第一作者孙秋实是香港大学计算与数据科学学院博士生,硕士毕业于新加坡国立大学数据科学系。 主要研究方向为 Computer-using agents 和 Code intelligence,在 NLP 和 ML 顶会 ACL,EMNLP,ICLR,COLM 等发表多篇论文。 本文的 OS-Copilot 团队此前已发布了 OS-Atlas、OS-Genesis 和 SeeClick 等同系列电脑智能体研究成果,被广泛应用于学术界与产业实践中。
6/26/2025 9:01:14 AM
提示词工程、RAG之后,LangChain:上下文工程开始火了!
AI 时代,你可能听说过提示词工程、RAG、记忆等术语。 但是很少有人提及上下文工程(context engineering)。 其实,这一术语并不新鲜,近两年很多智能体构建者一直在关注这个事情。
6/26/2025 7:00:00 AM
机器之心
无训练智能体蒸馏:AgentDistill 低成本高能效的智能进化方案
大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)的蒸馏技术正以前所未有的速度发展,成为压缩模型规模、降低推理成本的关键手段。 然而,现有的 LLM 智能体蒸馏方法却面临着高计算成本、泛化能力不足等诸多挑战。
6/25/2025 1:00:00 AM
肆零柒
谷歌 Google Cloud 向 Linux 基金会捐赠 A2A 智能体交互协议
Google Cloud 在 A2A 领域的下一步是通过与外部合作,制定一套更广泛的开放标准,丰富 A2A 协议的功能集。
6/24/2025 10:41:37 AM
溯波(实习)
微软刚发布Mu模型:支持Windows智能体,小参数跑出10倍性能
今天凌晨,微软在官网发布了创新小参数模型Mu。 Mu仅有3.3亿参数,但其性能可以比肩微软之前发布的小参数模型Phi-3.5-mini,体量却比它小10倍左右,并且在离线NPU的笔记本设备上,可以跑出每秒超过100 tokens的响应,这在小参数模型领域非常罕见。 此外,Mu支持在Windows中设置智能体,可将自然语言指令实时转化为系统操作,例如,只需对着电脑说一句 “把鼠标指针调大一些,调整屏幕亮度”,智能体就能精准定位到相关设置项一键完成调整。
6/24/2025 9:08:31 AM
掌控 AI 智能体自主性:五级框架下的人机协作之道
大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
6/23/2025 10:05:40 AM
肆零柒
ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%
本文第一作者为张桂彬,新加坡国立大学25Fall计算机科学博士生;本文在南洋理工大学的王琨博士、上海人工智能实验室的白磊老师、和中国科学技术大学的王翔教授指导下完成。 LLM 智能体的时代,单个 Agent 的能力已到瓶颈,组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功。 但 “天团” 不是人越多越好,手动设计既费力又不讨好,现有的智能体自动化方法又只会 “一招鲜”,拿一套复杂阵容应对所有问题,导致 “杀鸡用牛刀”,成本高昂。
6/23/2025 8:57:00 AM
7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式
尽管人工智能(AI)在飞速发展,当前 AI 开发仍严重依赖人类专家大量的手动实验和反复的调参迭代,过程费时费力。 这种以人为中心的方式已成为制约创新速度和通向通用人工智能(AGI)的关键瓶颈。 为突破限制,AI-for-AI(AI4AI)应运而生。
6/23/2025 8:56:00 AM
世界模型版《模拟人生》:AI虚拟小人街头演讲拉票,GPT-4o选举获胜
当世界模型高度进化后,里面的「人」都在做些什么? 有人会进行街头演说,吸引到了不少听众,小孩会和机器狗玩:有人会当街作案,警察前去抓捕,又有人会在大庭广众之下求婚:本周五,来自马萨诸塞大学阿默斯特分校(UMass Amherst)、约翰霍普金斯大学、卡耐基梅隆大学的研究者们提出了一个神奇的研究:虚拟社区(Virtual Community)。 虚拟社区将真实世界的地理空间数据与生成模型相结合,为多种不同类型的智能体创建了一个具有社会根基的交互式、可扩展开放世界场景。
6/23/2025 7:05:00 AM
机器之心
自主式AI在企业市场值得关注的九个应用场景
各企业正在部署不断进步的技术,以协助软件编程、创建高级商业智能以及自动化客户支持和人力资源职能。 在过去一年中,智能体在GenAI带来的热潮逐渐退去、人们对不切实际的期望感到失望之后,或许成为了最受关注的技术。 智能体将GenAI更进一步,强调运营决策而非内容生成,这种对业务流程产生影响的潜力,使得Aflac、Atlantic Health System、Legendary Entertainment以及NASA的喷气推进实验室等企业已经开始采用智能体。
6/23/2025 7:00:00 AM
Grant Gross
「运维版Cursor」首发亮相!终结命令行地狱,Agent解放双手
AI智能体的风终于吹到运维了! AI Coding似乎已经成为程序员们的标配,不论是最早的Copilot,Cursor的百亿估值,还是最近Claude Code的话题度,程序员手里的AI智能体越来越多——Windsurf、Codex、Trae、Copilot等等。 而每天和服务器、数据库打交道的运维人员却一直没有被提及,程序员们有自己的Cursor,但是针对运维工程师的「Cursor」却迟迟没有出现。
6/20/2025 2:35:02 PM
天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课
400 多年前,宋应星著成《天工开物》。 这是一部写给匠人、也写给未来的书。 它让人相信:技术不是死物,而是人与世界持续互动的方式。
6/20/2025 10:31:27 AM
美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练
只需要动动嘴就可以驱动GUI代理? 由美团和浙江大学联合推出的GUIRoboTron-Speech——让用户解放双手,直接对计算机“发号施令”。 这是首个能够直接利用语音指令和设备屏幕截图进行端到端(End-to-End)决策的自主GUI智能体,旨在为用户提供更直接、高效且无障碍的交互体验。
6/20/2025 9:00:00 AM
智能体开发实战 | 基于Dify+MCP实现理财助手智能体
前言AI智能体通过感知环境、自主决策和执行任务,突破传统大模型仅限于语言交互的局限。 例如,当用户指令“订一张明天去北京的机票”时,智能体不仅理解语义,还能自动调用航班查询接口、完成支付并同步至日程系统。 这种能力使其在客服、医疗、智能制造等领域展现出颠覆性潜力。
6/19/2025 3:30:00 AM
AI大模型应用开发
Transformer八子初创:AI横扫NP难题竞赛,Top 2%选手竟是智能体!
物流路径选择、人员排班、工厂调度、电网平衡、旅行路线……这些贴近现实的优化任务,看似日常,实则难度极高。 难点在于:一旦问题规模扩大,传统算法几乎无法计算出最优解。 通常只能依赖启发式或近似算法来接近答案。
6/18/2025 9:00:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
开发者
具身智能
xAI
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测