资讯列表
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
大型语言模型(LLMs)目前仍然很难处理需要多步骤推理、特定领域知识或外部工具集成的复杂任务,有研究工作探索了使用预先构建的外部工具来增强LLMs处理复杂任务的能力,但这些方法需要对模型进行微调或额外训练以实现工具的集成,在不同任务之间难以灵活适应。 现有的方法要么依赖于静态的、预定义的工具集,要么缺乏高效的工具选择和规划机制,这种低效性会导致任务执行出错、计算成本增加,以及在应用于新领域时适应性受限。 传统增强LLMs的方法包括少量样本提示(few-shot prompting)、思维链(chain-of-thought reasoning)以及与外部工具接口的功能调用API;有的框架如LangChain和AutoGen允许LLMs够使用外部资源,但通常智能用于指定应用场景或需要大量的预配置,没有提供一种统一的多步骤规划和执行方法,因此在处理复杂推理问题时效果不佳。
3/12/2025 10:38:05 AM
新智元
DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?
继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路
OpenAI突然发布智能体API!支持网络和文件搜索以及computer use
「Agent/智能体」可说是当今 AI 领域最炙手可热的话题。 今天凌晨,OpenAI 发布了一系列可让开发者通过 API 构建智能体的新工具,其中最大的看点便是 Responses API,这是对之前的 Chat Completions API 的一轮大升级,使其获得了 Assistants API 般使用工具的能力,从而可以帮助开发者构建智能体。 目前,Responses API 已经内置了网络搜索、文件搜索和计算机使用(computer use)能力。
3/12/2025 10:35:00 AM
机器之心
OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手
Manus掀起的智能体风暴,再次逼急了OpenAI。 凌晨,OpenAI突然开启线上直播,正式放出开发者自主构建智能体的大礼包——一个全新API、三个内置工具,以及一个开源SDK。 具体包括:全新Responses API:将Chat Completions API简单性与Assistants API工具使用功能相结合,用于构建智能体内置三大工具:网络搜索、文件搜索和计算机使用全新Agents SDK:用于编排单智能体和多智能体工作流程集成可视化工具:用于追踪和检查智能体工作流程执行情况以往,开发者构建一款智能体应用,需要从不同来源拼凑各种底层API。
3/12/2025 10:32:23 AM
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架
在 ChatGPT 爆火两年多的时间里,大语言模型的上下文窗口长度基准线被拉升,以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。 随之而来的是,长文本推理速度被提出更高要求,而基于现有 Transformer 架构的模型受限于注意力机制的二次方复杂度,难以在较短时延内处理超长文本请求。 针对这一痛点,清华大学 NLP 实验室联手中南大学、北京邮电大学以及腾讯微信 AI 实验室取得了突破,共同提出了 APB 框架 —— 其核心是一个整合了稀疏注意力机制的序列并行推理框架,通过整合局部 KV 缓存压缩方式以及精简的跨 GPU 通信机制,解决了长上下文远距离语义依赖问题,在无性能损失的前提下大幅度提升超长文本预填充的效率。
3/12/2025 10:31:00 AM
机器之心
一行代码、无需训练突破视频生成时长「魔咒」,清华朱军团队开源全新解决方案RIFLEx
自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。 去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-ViT,发布了首个国产全自研视频大模型 Vidu,打破国外技术垄断,支持一键生成 16 秒高清视频,展现出中国科技企业的创新实力。 Vidu 自去年 7 月上线以来,已服务数千万用户,极大促进了视频内容的智能创作。
3/12/2025 10:25:00 AM
机器之心
X-CLR:通过新型对比损失函数提升图像识别能力
译者 | 刘汪洋审校 | 重楼AI 驱动的图像识别技术正在改变各行各业,从医疗健康和安保,到自动驾驶汽车和零售业。 这些系统能分析海量视觉数据,以惊人的准确度识别模式和物体。 然而,传统图像识别模型面临着不少挑战:它们需要消耗大量计算资源,缺乏良好的扩展性,而且通常难以高效处理大型数据集。
3/12/2025 10:10:21 AM
刘汪洋
快慢双系统!清华&博世最新Chameleon:无需训练即可解决复杂道路拓扑(ICRA'25)
在自动驾驶技术中,车道拓扑提取是实现无地图导航的核心任务之一。 它要求系统不仅能检测出车道和交通元素(如交通灯、标志),还要理解它们之间的复杂关系。 例如,判断车辆是否可以左转进入某条车道,就需要综合考虑交通规则、车道布局和信号灯状态等多种因素。
3/12/2025 10:07:06 AM
自动驾驶之心
OpenAI深夜发布全新Agent工具:两大杀器登场,感觉可以手搓Manus了
可以自己动手手搓Manus了? 刚刚OpenAI举行了一个19分钟的线上发布会,推出全新Agent工具,OpenAI直接祭出自研Agent SDK和Responses API两大杀器! 旨在彻底简化agent开发流程,让开发者和企业都能轻松构建实用又可靠的智能体!
3/12/2025 10:00:44 AM
AI寒武纪
Manus与阿里云通义千问达成合作,共推国产AI智能体产品
人工智能Agent产品新秀Manus与阿里云旗下大语言模型通义千问近日达成战略合作。 根据Manus在其视频号"Manus AI"发布的消息,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。 目前两家技术团队已开始紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。
3/12/2025 10:00:41 AM
AI在线
重生之我在小红书给AI当老板 元宝动不动崩溃,DeepSeek天天摸鱼
这年头,谁还没个AI打工仔?但你见过直接在群聊里遥控AI军团的赛博老板吗?最近,小红书上就火爆了这样一股清奇画风——网友们纷纷化身AI公司的“霸道总裁”,在群聊里对一众AI模型指点江山,发号施令,上演了一出啼笑皆非的AI职场大戏。 始作俑者是小红书网友Komorebi,她的一条也是当上AI的领导了的图文笔记,瞬间点燃了网友们的玩梗热情。 只见她煞有介事地建了一个工作群,自己当起了人类CEO,一本正经地指挥群里的AI员工们打卡签到。
3/12/2025 9:53:00 AM
AI在线
揭示显式CoT训练机制:思维链如何增强推理泛化能力
基于逐步生成解决方案的大语言模型(LLMs)训练范式在人工智能领域获得了广泛关注,并已发展成为行业内的主流方法之一。 例如,OpenAI 在其「12 Days of OpenAI」直播系列的第二日推出了针对 O1 模型的强化微调(Reinforcement Fine-Tuning,RFT),进一步推动了 AI 定制化的发展[1]。 RFT/ReFT[2] 的一个关键组成部分是使用思维链(Chain-of-Thought,CoT)注释[3] 进行监督微调(Supervised Fine-Tuning,SFT)。
3/12/2025 9:48:19 AM
机器之心
18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集
目前的视频编辑算法主要分为两种:一种是利用 DDIM-Inversion 完成视频编辑,另一种是利用训练好的编辑模型。 然而,前者在视频的一致性和文本对齐方面存在较大缺陷;后者由于缺乏高质量的视频编辑对,难以获得理想的编辑模型。 为了解决视频编辑模型缺乏训练数据的问题,本文作者(来自香港中文大学、香港理工大学、清华大学等高校和云天励飞)提出了一个名为 Señorita-2M 的数据集。
3/12/2025 9:40:28 AM
机器之心
告别平面!MIDI:可提取图片元素生成360度3D场景
还在对着二维照片里的美好场景望眼欲穿?梦想着能身临其境地漫步在那些迷人画面之中?现在,这个愿望有望成为现实!来自CVPR2025的重磅研究——MIDI(Multi-Instance Diffusion for Single Image to3D Scene Generation,多实例扩散单图到3D场景生成)横空出世,它就像一位技艺高超的魔法师,仅凭一张普通的2D图片,就能为你构建出一个栩栩如生的360度3D场景。 一图胜千言?现在还能“变”出整个世界!想象一下,你拍摄了一张阳光洒落的咖啡馆一角,照片里有精致的桌椅、香气四溢的咖啡杯,以及窗外婆娑的树影。 过去,这仅仅是一张静态的平面图像。
3/12/2025 9:35:00 AM
AI在线
谷歌持有Anthropic14%股份,投资已达30亿美元
根据《纽约时报》获取的法律文件显示,谷歌目前持有人工智能初创公司Anthropic14%的股份,接近其允许持有的15%上限。 值得注意的是,尽管投资规模庞大,谷歌在Anthropic并不享有投票权、董事会席位或董事会观察员权。 据报道,谷歌迄今已向Anthropic投入了总计30亿美元的资金,并计划在2025年9月再追加7.5亿美元的投资。
3/12/2025 9:30:00 AM
AI在线
全国第二例判决 AI 版权案:法院确认作者享有著作权
AI 生成内容的知识产权问题带来了不少争议,而江苏省苏州市常熟市人民法院于3月7日宣判了一起备受瞩目的著作权纠纷案。 这起案件被认为是江苏省的首例、全国第二例涉及 AI 生成内容的著作权案。 案件的起因是林某使用 Midjourney 软件生成的图片作品引发的版权争议。
3/12/2025 9:25:00 AM
AI在线
Meta测试内部AI训练芯片,寻求减少对英伟达依赖
据路透社报道,Meta正在测试一种专为人工智能训练设计的内部芯片,这是该公司战略的重要组成部分,旨在降低对英伟达等硬件制造商的依赖。 这些芯片是Meta与台湾半导体制造巨头台积电(TSMC)合作生产的,专门用于处理人工智能特定的工作负载。 目前,Meta正在进行"小规模部署"测试,如果测试结果符合预期,公司计划扩大生产规模。
3/12/2025 9:11:00 AM
AI在线
OpenAI推出新工具帮助开发者构建AI代理
OpenAI周二发布了新的响应API(Responses API),旨在帮助开发人员和企业使用该公司的模型和框架构建能独立完成任务的AI代理。 这一工具包将有效取代OpenAI的助手API,后者计划在2026年上半年停用。 响应API允许企业开发自定义AI代理,这些代理可以执行网络搜索、扫描公司文件和浏览网站,功能类似于OpenAI的Operator产品。
3/12/2025 9:09:00 AM
AI在线