AI在线 AI在线

理论

首篇AI自写论文通过ICLR 2025同行评审!6.25高分碾压人类,AI独挑科研大梁

首篇完全由AI生成的论文,竟通过了ICLR 2025同行评审! 刚刚,Sakana AI正式亮相AI Scientist-v2版本,直接踢破了AI顶会的大门。 从提出科学假设、设计实验、到编写代码、运行实验、分析数据、绘制图表,再到撰写完整论文,所有环节均由AI完成。
3/13/2025 9:16:25 AM
新智元

谷歌Gemma 3上线!单GPU最强多模态手机可跑,27B完胜o3-mini

谷歌Gemma 3全家桶来了! 刚刚,在巴黎开发者日上,开源Gemma系模型正式迭代到第三代,原生支持多模态,128k上下文。 此次,Gemma 3一共开源了四种参数,1B、4B、12B和27B。
3/13/2025 9:12:35 AM
新智元

大模型指标:RPM、TPM…这些“神秘代码”到底是什么?

一、RPM:每分钟能“说多少话”? 定义:RPM全称是Requests Per Minute(每分钟请求数),表示大模型每分钟能处理的请求次数。 比如,某模型设置RPM=300,就意味着每分钟最多响应300次用户提问。
3/13/2025 8:33:37 AM
若有无

DeepSeek-R1的方法迁移到多模态大模型-开源Vision-R1实现方法思路

刚开始琢磨使用DeepSeek-R1风格训练多模态R1模型,就看到这个工作,本文一起看看,供参考。 先提出问题,仅靠 RL 是否足以激励 MLLM 的推理能力? 结论:不能,因为如果 RL 能有效激励推理能力,Vision-R1-Zero 应该表现出生成复杂 CoT 的能力,并在基准测试中提升准确率。
3/13/2025 8:13:47 AM
余俊晖

不需要 AI 和数学知识背景,这篇文章带你学会大模型应用开发

作者 | ronaldo最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,不论是各种技术论坛还是开源项目,大多都围绕着大模型展开。 大模型的长期目标是实现AGI,这可能还有挺长的路要走,但是眼下它已经深刻地影响了“编程”领域。 各种copilot显著地提升了开发者的效率,但与此同时,开发者也变得非常地焦虑。
3/13/2025 8:00:00 AM
腾讯技术工程

企业可以采用六种方式实现网络安全自动化以应对由AI驱动的攻击

为什么AI对于网络安全至关重要?因为每天都有,事实上是每秒都有,恶意行为者利用AI来扩大他们的攻击手段的范围和速度。 一方面,正如CrowdStrike高级副总裁Adam Meyers在最近接受记者采访时所说,“敌人每年都快了10到14分钟。 随着他们的突破时间缩短,防御者必须反应更快——在威胁扩散之前检测、调查和阻止它们。
3/13/2025 7:00:00 AM
Louis Columbus

H20芯片困局:在DeepSeek崛起下的挑战与反思

在当今全球科技竞争的宏大棋局之中,美国针对中国半导体和人工智能芯片发起的制裁行动,恰似汹涌暗潮,正以悄无声息却又极具颠覆性的方式,重塑着中国人工智能产业的发展格局。 在这一复杂局势下,H20 芯片作为特殊的存在进入中国市场,看似是为国内企业送来的“及时雨”,实则暗藏玄机,背后隐藏着诸多亟待剖析的问题。 近年来,美国对我国人工智能发展的制裁手段可谓层层加码、环环相扣。
3/12/2025 5:59:31 PM
徐勇

字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露

就在今天,字节豆包大模型团队在 arxiv 上发布了一篇技术报告,完整公开了文生图模型技术细节,涵盖数据处理、预训练、RLHF 在内的后训练等全流程模型构建方法,也详细披露了此前大火的文字精准渲染能力如何炼成。 报告将豆包文生图模型称为 Seedream 2.0,并明确提到,该模型于去年 12 月初上线到豆包 APP 和即梦平台。 从模型能力看,Seedream 2.0 是原生的中英双语图像生成基础模型,拥有很强的美感和文本渲染效果,与目前即梦上的文生图主力模型特性匹配。
3/12/2025 2:40:53 PM
机器之心

自主式AI爆发前夜,企业如何押注黄金场景?

今年可能是自主式AI大放异彩的一年,许多企业都在寻找增值用例。 一个关键问题:哪些业务流程实际上适合采用自主式AI?商业咨询公司德勤预测,到2025年,在使用GenAI的公司中,有25%将推出自主式AI试点或概念验证,到2027年这一比例将增长到50%。 该公司表示,在某些行业、某些用例中,自主式AI应用可能会在今年被纳入现有工作流程。
3/12/2025 2:25:24 PM
Bob Violino

32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

Hugging Face的Open R1再度升级! Hugging Face的Open R1是一个社区驱动的项目,目标是创建一个完全开源的DeepSeek-R1版本。 目前,已有模型如OlympicCoder-32B和数据集如codeforces发布,显示了项目的进展。
3/12/2025 1:55:05 PM
新智元

OpenAI旨在通过扩展工具包开发智能体

随着企业对这项技术兴趣的提升,技术供应商纷纷急于推出工具以促进智能体的采用。 云巨头和软件巨头都已参与其中。 谷歌去年12月向企业客户介绍了其Agentspace服务,微软上周扩展了其AI代理产品组合,而AWS则于周一正式推出了AmazonBedrock上的多智能体协作功能。
3/12/2025 1:04:01 PM
Lindsey Wilkinson

使用 VLLM 部署 DeepSeek:基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南

最近,大语言模型(LLM)的部署已经成为 AI 开发者绕不开的核心技能。 而 VLLM 作为一款高性能、低延迟的推理引擎,在大模型推理领域迅速崛起。 今天,我就带大家从零开始,在 Ubuntu 22.04 RTX 4090 Docker 环境下,部署 DeepSeek模型,并让它跑起来!
3/12/2025 12:37:50 PM
写代码的中年人

AI现实动物森友会,NVIDIA携手国际组织助力野生动物保护

编辑丨toileter不久前,世界野生动植物之日方才过去。 在如今世界各地对于野生环境的保护日益重视的发展现状中,利用 AI 来协助人们进行自然环境保护的举措理所当然地成为了更具影响的手段。 在联合国估计超过 100 万个物种面临灭绝威胁之际,这是一项维持生态系统和支持生物多样性的关键工作。
3/12/2025 12:07:00 PM
ScienceAI

Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者

OpenAI又开源了,这次是一套智能体开发框架。 联网搜索、文件搜索、计算机使用(Computer Use),统统打包,GitHub 8小时上千星。 图片奥特曼认为其中的API是有史以来(并没有限定在OpenAI范围内)设计最完善、最实用的之一。
3/12/2025 11:34:35 AM

10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜

音乐创作,尤其是完整歌曲的生成,一直是人工智能领域的一大挑战。 Suno、Udio等商用音乐生成大模型展现出惊人的音乐生成能力。 但现有开源的音乐生成模型要么只能生成人声或伴奏,要么依赖复杂的多阶段架构,难以扩展到长音频生成。
3/12/2025 10:41:34 AM
新智元

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

大型语言模型(LLMs)目前仍然很难处理需要多步骤推理、特定领域知识或外部工具集成的复杂任务,有研究工作探索了使用预先构建的外部工具来增强LLMs处理复杂任务的能力,但这些方法需要对模型进行微调或额外训练以实现工具的集成,在不同任务之间难以灵活适应。 现有的方法要么依赖于静态的、预定义的工具集,要么缺乏高效的工具选择和规划机制,这种低效性会导致任务执行出错、计算成本增加,以及在应用于新领域时适应性受限。 传统增强LLMs的方法包括少量样本提示(few-shot prompting)、思维链(chain-of-thought reasoning)以及与外部工具接口的功能调用API;有的框架如LangChain和AutoGen允许LLMs够使用外部资源,但通常智能用于指定应用场景或需要大量的预配置,没有提供一种统一的多步骤规划和执行方法,因此在处理复杂推理问题时效果不佳。
3/12/2025 10:38:05 AM
新智元

DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?

继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手

Manus掀起的智能体风暴,再次逼急了OpenAI。 凌晨,OpenAI突然开启线上直播,正式放出开发者自主构建智能体的大礼包——一个全新API、三个内置工具,以及一个开源SDK。 具体包括:全新Responses API⁠:将Chat Completions API简单性与Assistants API工具使用功能相结合,用于构建智能体内置三大工具:网络搜索⁠、文件搜索⁠和计算机使用全新Agents SDK⁠:用于编排单智能体和多智能体工作流程集成可视化工具:用于追踪和检查智能体工作流程执行情况以往,开发者构建一款智能体应用,需要从不同来源拼凑各种底层API。
3/12/2025 10:32:23 AM