AI
代码世界风云突变:Anthropic 报告揭秘 AI 正从“助手”变“主导”,初创公司抢占先机!
人工智能在软件开发领域的渗透,正以前所未有的速度和深度演进。 AI 巨头 Anthropic 最新发布的第二份经济指数报告,犹如一颗投入平静湖面的石子,激起了层层涟漪。 这份基于其 Claude AI 及专业编码工具 Claude Code 上高达50万次交互数据的深度研究,清晰地描绘出一幅惊人图景:人工智能正迅速脱离仅仅辅助编码的角色,朝着自动化编码大步迈进,尤其在 Claude Code 这类“专精”工具的加持下,这一趋势愈发明显。
4/29/2025 11:00:55 AM
AI在线
北京大学推出新基准评测PHYBench,挑战AI物理推理能力!
最近,北京大学物理学院联合多个院系,推出了一项名为 “PHYBench” 的全新评测基准,旨在检验大模型在物理推理上的真实能力。 该项目由朱华星老师和曹庆宏副院长主导,汇聚了来自物理学院和其他学科的200多名学生,其中不少人曾在全国中学生物理竞赛中获金牌。 PHYBench 设计了500道精心制作的高质量物理题,这些题目涵盖高中物理、大学物理及物理奥林匹克竞赛的各个层面。
4/29/2025 11:00:51 AM
AI在线
联合包裹与 Figure AI洽谈合作加速部署人形机器人
全球知名物流公司联合包裹(UPS)正在与初创企业 Figure AI 进行深入谈判,计划在其物流网络中引入人形机器人,以完成部分作业任务。 根据知情人士的透露,双方的合作讨论始于去年,并在最近几个月持续进行。 尽管合作细节尚未明确,但这一合作显示出物流行业对自动化技术的强烈兴趣。
4/29/2025 11:00:51 AM
AI在线
高盛支持的初创公司Splice收购英国音响工作室,押注 AI 音乐创作
近日,知名音乐样本公司 Splice 宣布,将收购位于伦敦的音响工作室 Spitfire Audio。 这一交易标志着 Splice 在音乐创作领域的一次重要布局,尤其是在人工智能音乐制作日益兴起的背景下。 Spitfire Audio 以其丰富的管弦乐声音库而闻名,这次收购将为 Splice 提供更多样的音乐素材,进一步丰富其产品线。
4/29/2025 11:00:51 AM
AI在线
以 AI 驱动的 Lightrun 成功融资7000万美元,助力代码生产中的调试与监控
近日,以色列初创公司 Lightrun 宣布完成7000万美元的 B 轮融资,这一资金的注入标志着在快速发展的 AI 编码领域中,市场对调试和监控工具的需求愈加迫切。 Lightrun 致力于为开发者提供一个可观察的平台,以帮助他们在生产环境中识别和修复代码问题,防止潜在的崩溃和其他故障。 图源备注:图片由AI生成,图片授权服务商Midjourney本轮融资由 Accel 领投,前投资者 Insight Partners 共同参与,其他参与方还包括 Citi、Glilot Capital、GTM Capital 及 Sorenson Capital。
4/29/2025 11:00:50 AM
AI在线
Versa推出MCP服务器,助力AI助手快速安全查询系统
全球领先的通用安全访问服务边缘(SASE)解决方案提供商 Versa 宣布推出其最新的模型上下文协议(MCP)服务器。 这一强大的新工具旨在帮助客户将其智能 AI 工具与 VersaONE 通用 SASE 平台无缝集成,从而提升可视性、加速事件解决,并提高运营效率。 图源备注:图片由AI生成,图片授权服务商MidjourneyVersa MCP 服务器允许像 Claude、ChatGPT、Gemini、Microsoft Copilot 以及公司内部开发的助手等大型语言模型(LLM)驱动的助手,安全地通过访问 Versa 的 API 查询系统。
4/29/2025 11:00:50 AM
AI在线
Windsurf 推出全新品牌标志与功能,AI编码工具进一步优化
2025年4月28日,人工智能编码助手 Windsurf(前身为 Codeium)正式推出其全新的视觉形象(VI)和品牌标志,标志着公司在不断发展的道路上迈出了重要一步。 此次更新不仅包括品牌标志的刷新,还伴随着免费用户层功能的升级,迅速在开发者社区引发广泛讨论。 同时,围绕 OpenAI 可能以约30亿美元收购 Windsurf 的传言也在业界掀起波澜。
4/29/2025 11:00:21 AM
AI在线
多邻国将用人工智能取代合同工,迈向 “AI 优先” 模式
多邻国(Duolingo)近日宣布,将逐步停止使用能够被人工智能(AI)处理的合同工。 这一决定是在公司联合创始人兼首席执行官Luis von Ahn向全体员工发出的电子邮件中公布的,标志着该公司将转向 “AI 优先” 的战略。 Luis von Ahn 在邮件中提到,成为 “AI 优先” 的公司意味着需要重新思考工作方式,而简单地对现有系统进行微调是无法实现这一目标的。
4/29/2025 10:00:51 AM
AI在线
Simular AI登陆macOS,本地智能助手革新人机协作体验
Simular AI正式亮相macOS,成为首个运行于用户本地设备的AI浏览器智能体,强调人机协作与本地化处理。 据AIbase了解,Simular通过理解屏幕内容、自动化网页操作与无缝协同功能,支持用户高效完成购物、研究与行政任务。 社交平台上的热烈讨论凸显其创新性,相关细节已通过Simular官网(simular.ai)与Hugging Face公开。
4/29/2025 10:00:50 AM
AI在线
超越A2A和MCP?新协议LOKA将重塑AI智能体的身份与道德标准
近日,卡内基梅隆大学的研究人员提出了一项名为 “层次化知识智能体架构(Layered Orchestration for Knowledgeful Agents)”(LOKA)的新协议,可以加入其他拟议的标准,例如 Google 的 Agent2Agent (A2A) 和 Anthropic 的模型上下文协议 (MCP),旨在为自主 AI 智能体的身份、责任和伦理提供规范。 随着 AI 智能体的普及,对其互动进行标准化管理的需求愈加迫切。 LOKA 协议的提出背景是,当前的 AI 智能体通常在各自独立的系统中运行,缺乏统一的沟通协议以及伦理决策框架,这导致了互操作性差、伦理不一致和问责缺失等一系列问题。
4/29/2025 10:00:50 AM
AI在线
前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像
前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 表示,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其更讨好用户。
4/29/2025 9:38:49 AM
故渊
港大&Adobe联合提出图像生成模型PixelFlow,可直接在原始像素空间中运行,无需VAE即可进行端到端训练
香港大学和Adobe联合提出了一种直接在原始像素空间中运行的图像生成模型PixelFlow,这种方法简化了图像生成过程,无需预先训练的变分自编码器 (VAE),并使整个模型能够端到端训练。 通过高效的级联流建模,PixelFlow 在像素空间中实现了可承受的计算成本。 它在 256x256 ImageNet 类条件图像生成基准上实现了 1.98 的 FID。
4/29/2025 9:21:19 AM
AIGC Studio
告别“图文不符”!FG-CLIP实现细粒度跨模态对齐,360开源模型重塑AI视觉理解
CLIP的“近视”问题,被360搞定了。 360人工智能研究院最新图文跨模态模型FG-CLIP,宣布以“长文本深度理解”和“细粒度视觉比对”双突破,彻底解决了传统CLIP模型的“视觉近视”问题,能够精准识别局部细节。 具体怎么个说法?
4/29/2025 9:21:00 AM
52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解
谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。 近日,Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。 他深入分析了Gemini预训练的方法、挑战以及方向,如何在模型大小、算力、数据和推理成本间取得平衡。
4/29/2025 9:16:00 AM
新智元
颠覆传统RAG,创新大模型检索增强—Insight-RAG
RAG已经成为大模型的标题,但传统方法存在检索深度不足、难以整合多源信息等弊端,例如,传统 RAG 依赖表面相关性检索文档,容易忽略单个文档内深埋的信息。 在法律协议中,会忽略微妙的合同条款;在商业报告里,错过隐藏的数据趋势。 所以,Megagon实验室的研究人员提出了一种创新框架Insight-RAG,从而更好地捕捉任务特定的细微信息,整合的数据质量也更高。
4/29/2025 9:15:49 AM
AIGC开放社区
模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了
大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。 然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境中。 例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下拥有 4050 亿个参数,需要大约 810GB 的内存进行完整推理,超过了典型高端 GPU 服务器(例如,DGX A100/H100,配备 8 个 80GB GPU)的能力。
4/29/2025 9:14:00 AM
机器之心
上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025
本篇工作已被电子设计自动化领域顶级会议 DAC 2025 接收,由上海交大计算机学院蒋力教授与刘方鑫助理教授带领的 IMPACT 课题组完成,同时也获得了华为 2012 实验室和上海期智研究院的支持。 第一作者是博士生汪宗武与硕士生许鹏。 在通用人工智能的黎明时刻,大语言模型被越来越多地应用到复杂任务中,虽然展现出了巨大的潜力和价值,但对计算和存储资源也提出了前所未有的挑战。
4/29/2025 9:13:00 AM
机器之心
首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路
钱成目前是伊利诺伊大学香槟分校 (UIUC) 一年级博士生,导师为季姮教授。 本科就读于清华大学,导师为刘知远教授。 其工作集中在大语言模型工具使用与推理以及人工智能体方向。
4/29/2025 9:12:00 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉