AI在线 AI在线

AI

代码世界风云突变:Anthropic 报告揭秘 AI 正从“助手”变“主导”,初创公司抢占先机!

人工智能在软件开发领域的渗透,正以前所未有的速度和深度演进。 AI 巨头 Anthropic 最新发布的第二份经济指数报告,犹如一颗投入平静湖面的石子,激起了层层涟漪。 这份基于其 Claude AI 及专业编码工具 Claude Code 上高达50万次交互数据的深度研究,清晰地描绘出一幅惊人图景:人工智能正迅速脱离仅仅辅助编码的角色,朝着自动化编码大步迈进,尤其在 Claude Code 这类“专精”工具的加持下,这一趋势愈发明显。
4/29/2025 11:00:55 AM
AI在线

北京大学推出新基准评测PHYBench,挑战AI物理推理能力!

最近,北京大学物理学院联合多个院系,推出了一项名为 “PHYBench” 的全新评测基准,旨在检验大模型在物理推理上的真实能力。 该项目由朱华星老师和曹庆宏副院长主导,汇聚了来自物理学院和其他学科的200多名学生,其中不少人曾在全国中学生物理竞赛中获金牌。 PHYBench 设计了500道精心制作的高质量物理题,这些题目涵盖高中物理、大学物理及物理奥林匹克竞赛的各个层面。
4/29/2025 11:00:51 AM
AI在线

联合包裹与 Figure AI洽谈合作加速部署人形机器人

全球知名物流公司联合包裹(UPS)正在与初创企业 Figure AI 进行深入谈判,计划在其物流网络中引入人形机器人,以完成部分作业任务。 根据知情人士的透露,双方的合作讨论始于去年,并在最近几个月持续进行。 尽管合作细节尚未明确,但这一合作显示出物流行业对自动化技术的强烈兴趣。
4/29/2025 11:00:51 AM
AI在线

​高盛支持的初创公司Splice收购英国音响工作室,押注 AI 音乐创作

近日,知名音乐样本公司 Splice 宣布,将收购位于伦敦的音响工作室 Spitfire Audio。 这一交易标志着 Splice 在音乐创作领域的一次重要布局,尤其是在人工智能音乐制作日益兴起的背景下。 Spitfire Audio 以其丰富的管弦乐声音库而闻名,这次收购将为 Splice 提供更多样的音乐素材,进一步丰富其产品线。
4/29/2025 11:00:51 AM
AI在线

​以 AI 驱动的 Lightrun 成功融资7000万美元,助力代码生产中的调试与监控

近日,以色列初创公司 Lightrun 宣布完成7000万美元的 B 轮融资,这一资金的注入标志着在快速发展的 AI 编码领域中,市场对调试和监控工具的需求愈加迫切。 Lightrun 致力于为开发者提供一个可观察的平台,以帮助他们在生产环境中识别和修复代码问题,防止潜在的崩溃和其他故障。 图源备注:图片由AI生成,图片授权服务商Midjourney本轮融资由 Accel 领投,前投资者 Insight Partners 共同参与,其他参与方还包括 Citi、Glilot Capital、GTM Capital 及 Sorenson Capital。
4/29/2025 11:00:50 AM
AI在线

​Versa推出MCP服务器,助力AI助手快速安全查询系统

全球领先的通用安全访问服务边缘(SASE)解决方案提供商 Versa 宣布推出其最新的模型上下文协议(MCP)服务器。 这一强大的新工具旨在帮助客户将其智能 AI 工具与 VersaONE 通用 SASE 平台无缝集成,从而提升可视性、加速事件解决,并提高运营效率。 图源备注:图片由AI生成,图片授权服务商MidjourneyVersa MCP 服务器允许像 Claude、ChatGPT、Gemini、Microsoft Copilot 以及公司内部开发的助手等大型语言模型(LLM)驱动的助手,安全地通过访问 Versa 的 API 查询系统。
4/29/2025 11:00:50 AM
AI在线

Windsurf 推出全新品牌标志与功能,AI编码工具进一步优化

2025年4月28日,人工智能编码助手 Windsurf(前身为 Codeium)正式推出其全新的视觉形象(VI)和品牌标志,标志着公司在不断发展的道路上迈出了重要一步。 此次更新不仅包括品牌标志的刷新,还伴随着免费用户层功能的升级,迅速在开发者社区引发广泛讨论。 同时,围绕 OpenAI 可能以约30亿美元收购 Windsurf 的传言也在业界掀起波澜。
4/29/2025 11:00:21 AM
AI在线

多邻国将用人工智能取代合同工,迈向 “AI 优先” 模式

多邻国(Duolingo)近日宣布,将逐步停止使用能够被人工智能(AI)处理的合同工。 这一决定是在公司联合创始人兼首席执行官Luis von Ahn向全体员工发出的电子邮件中公布的,标志着该公司将转向 “AI 优先” 的战略。 Luis von Ahn 在邮件中提到,成为 “AI 优先” 的公司意味着需要重新思考工作方式,而简单地对现有系统进行微调是无法实现这一目标的。
4/29/2025 10:00:51 AM
AI在线

Simular AI登陆macOS,本地智能助手革新人机协作体验

Simular AI正式亮相macOS,成为首个运行于用户本地设备的AI浏览器智能体,强调人机协作与本地化处理。 据AIbase了解,Simular通过理解屏幕内容、自动化网页操作与无缝协同功能,支持用户高效完成购物、研究与行政任务。 社交平台上的热烈讨论凸显其创新性,相关细节已通过Simular官网(simular.ai)与Hugging Face公开。
4/29/2025 10:00:50 AM
AI在线

超越A2A和MCP?新协议LOKA将重塑AI智能体的身份与道德标准

近日,卡内基梅隆大学的研究人员提出了一项名为 “层次化知识智能体架构(Layered Orchestration for Knowledgeful Agents)”(LOKA)的新协议,可以加入其他拟议的标准,例如 Google 的 Agent2Agent (A2A) 和 Anthropic 的模型上下文协议 (MCP),旨在为自主 AI 智能体的身份、责任和伦理提供规范。 随着 AI 智能体的普及,对其互动进行标准化管理的需求愈加迫切。 LOKA 协议的提出背景是,当前的 AI 智能体通常在各自独立的系统中运行,缺乏统一的沟通协议以及伦理决策框架,这导致了互操作性差、伦理不一致和问责缺失等一系列问题。
4/29/2025 10:00:50 AM
AI在线

前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 表示,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其更讨好用户。
4/29/2025 9:38:49 AM
故渊

港大&Adobe联合提出图像生成模型PixelFlow,可直接在原始像素空间中运行,无需VAE即可进行端到端训练

香港大学和Adobe联合提出了一种直接在原始像素空间中运行的图像生成模型PixelFlow,这种方法简化了图像生成过程,无需预先训练的变分自编码器 (VAE),并使整个模型能够端到端训练。 通过高效的级联流建模,PixelFlow 在像素空间中实现了可承受的计算成本。 它在 256x256 ImageNet 类条件图像生成基准上实现了 1.98 的 FID。
4/29/2025 9:21:19 AM
AIGC Studio

告别“图文不符”!FG-CLIP实现细粒度跨模态对齐,360开源模型重塑AI视觉理解

CLIP的“近视”问题,被360搞定了。 360人工智能研究院最新图文跨模态模型FG-CLIP,宣布以“长文本深度理解”和“细粒度视觉比对”双突破,彻底解决了传统CLIP模型的“视觉近视”问题,能够精准识别局部细节。 具体怎么个说法?
4/29/2025 9:21:00 AM

52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解

谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。 近日,Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。 他深入分析了Gemini预训练的方法、挑战以及方向,如何在模型大小、算力、数据和推理成本间取得平衡。
4/29/2025 9:16:00 AM
新智元

颠覆传统RAG,创新大模型检索增强—Insight-RAG

RAG已经成为大模型的标题,但传统方法存在检索深度不足、难以整合多源信息等弊端,例如,传统 RAG 依赖表面相关性检索文档,容易忽略单个文档内深埋的信息。 在法律协议中,会忽略微妙的合同条款;在商业报告里,错过隐藏的数据趋势。 所以,Megagon实验室的研究人员提出了一种创新框架Insight-RAG,从而更好地捕捉任务特定的细微信息,整合的数据质量也更高。
4/29/2025 9:15:49 AM
AIGC开放社区

模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了

大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。 然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境中。 例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下拥有 4050 亿个参数,需要大约 810GB 的内存进行完整推理,超过了典型高端 GPU 服务器(例如,DGX A100/H100,配备 8 个 80GB GPU)的能力。
4/29/2025 9:14:00 AM
机器之心

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

本篇工作已被电子设计自动化领域顶级会议 DAC 2025 接收,由上海交大计算机学院蒋力教授与刘方鑫助理教授带领的 IMPACT 课题组完成,同时也获得了华为 2012 实验室和上海期智研究院的支持。 第一作者是博士生汪宗武与硕士生许鹏。 在通用人工智能的黎明时刻,大语言模型被越来越多地应用到复杂任务中,虽然展现出了巨大的潜力和价值,但对计算和存储资源也提出了前所未有的挑战。
4/29/2025 9:13:00 AM
机器之心

首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路

钱成目前是伊利诺伊大学香槟分校 (UIUC) 一年级博士生,导师为季姮教授。 本科就读于清华大学,导师为刘知远教授。 其工作集中在大语言模型工具使用与推理以及人工智能体方向。
4/29/2025 9:12:00 AM
机器之心