AI在线 AI在线

理论

轨迹预测新基准!清华开源Ultra-AV:统一自动驾驶纵向轨迹数据集

摘要自动驾驶车辆在交通运输领域展现出巨大潜力,而理解其纵向驾驶行为是实现安全高效自动驾驶的关键。 现有的开源AV轨迹数据集在数据精炼、可靠性和完整性方面存在不足,从而限制了有效的性能度量分析和模型开发。 本研究针对这些挑战,构建了一个(Ultra-AV),用于分析自动驾驶汽车的微观纵向驾驶行为。
2/7/2025 10:17:55 AM
Hang Zhou等

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。 《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。 此时距离他转投Anthropic,仅仅不到半年。
2/7/2025 10:13:16 AM
量子位

零样本 | MusicMagus:基于扩散模型的零样本文本驱动音乐编辑新方案

一眼概览MusicMagus 提出了一种基于扩散模型的零样本文本到音乐编辑方法,可在不额外训练的情况下,通过文本编辑修改音乐的风格、音色和乐器,同时保持其他属性不变。 实验表明,该方法在风格转换和音色转换方面优于现有零样本方法,并在某些任务上超越监督学习方法。 核心问题当前的文本到音乐生成模型已取得长足进展,但音乐创作往往需要反复修改,而如何在保持音乐整体结构的同时,精准编辑特定属性仍然是个挑战。
2/7/2025 10:10:05 AM
萍哥学AI

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

刚刚,OpenAI把o3-mini的推理思维链公开了。 从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。 图片评论区网友纷纷:让我们谢谢DeepSeek。
2/7/2025 9:05:36 AM

817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式

在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。 特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。 然而,来自上海交通大学的最新研究却给出了一个令人震惊的答案:仅需 817 条精心设计的样本,就能让模型在数学竞赛级别的题目上超越当前许多最先进模型。
2/7/2025 9:00:00 AM
机器之心

基于 Ray 的融合计算引擎在生命科学领域的应用

一、从 2024 年诺贝尔化学奖谈起2024 年诺贝尔化学奖得主都不是来自化学专业。 其中 David Baker 从事多年蛋白质设计研究,包括一些模型和传统生物信息工具,类似于现在的生成式场景。 另外两位得主来自谷歌旗下的 DeepMind 团队,该团队主要专注于蛋白质生成领域,其另一重要成就是之前在围棋比赛中战胜人类的 AlphaGo。
2/7/2025 8:50:47 AM
饶星

基于Langbase Memory Agents将任意LLM转为 可对话式AI文档助手

译者 | 刘涛审校 | 重楼在 2025 年当下,大语言模型(LLM)依旧无法获取用户的私有数据。 当用户向其询问某些与个人相关的问题时,大语言模型要么凭借推测进行回应,要么给出错误的解答。 这体现了大语言模型存在的固有局限性——它们仅基于公开信息进行训练,无法获取用户的私有上下文信息。
2/7/2025 8:44:46 AM
刘涛

从某个角度看,Deepseek之于AI与当年Oracle之于信息化的意义是相同的

春节前这段时间里最热的莫过于DEEPSEEK,我因为家中老人住院,春节前后都泡在医院里。 无聊的时候只能看看头条消磨时光。 最近这段时间,我的头条推送几乎被DS占据了。
2/7/2025 8:32:56 AM
白鳝

DeepSeek正在杀死程序员?不,它杀死的是一整个时代

——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。
2/7/2025 8:30:37 AM
斯巴达人

充分利用人工智能代理实现DevOps与云服务无缝集成

译者 | 李睿审校 | 重楼人工智能(AI)的快速发展为企业优化业务运营和提高创造力创造了新的机会。 这一领域的一个关键发展是智能代理,这些代理在重塑DevOps和云交付过程中变得至关重要。 它们专为达成特定任务与目标而设计,这改变了系统在当今动态技术生态中的工作方式。
2/7/2025 8:00:00 AM
李睿

对多模式AI应用程序进行压力测试是红队的新领域

人类的交流是多模态的。 我们用许多不同的方式接收信息,这使我们的大脑能够从不同的角度看世界,并将这些不同的信息“模式”转化为现实的综合图景。 如今,人工智能 (AI) 至少在一定程度上也能做到这一点。
2/7/2025 12:14:58 AM

不到140块!李飞飞团队超低成本复刻DeepSeek R1推理!16张H100只训练了26分钟,与R1训练方法不同!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)太魔鬼了! 上周李飞飞团队发了篇新论文,再次降低了复刻o1能力的成本。 低到什么程度呢?
2/6/2025 6:37:46 PM
伊风

百度智能云上架DeepSeek R1/V3,上线首日超1.5万家客户调用​

2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台,并宣布提供行业领先的超低推理价格。 模型上线首日,已有超1.5万家客户通过千帆平台进行模型调用。 为降低模型使用成本,百度智能云在推理引擎性能优化技术、推理服务工程架构创新以及推理服务全链路安全保障上的进行深度融合。
2/6/2025 5:00:40 PM

DeepSeek日活用户数突破2000万,增长势头远超ChatGPT

国内AI产品榜的最新统计数据显示,DeepSeek应用在上线仅20天后,其日活跃用户数(DAU)迅速突破2000万大关,具体数字高达2215万。 这一成绩不仅彰显了DeepSeek强大的用户吸引力,也进一步证明了AI技术在当今社会的广泛应用和巨大潜力。 用户增长迅猛,全球影响力显著提升日活用户数:截至2025年2月4日,DeepSeek的日活跃用户数已突破2000万,达到2215万。
2/6/2025 4:20:41 PM
极客AI

红队必看:生成式AI安全的八大实战教训

随着ChatGPT和DeepSeek应用的野火燎原,生成式AI(GenAI)安全威胁已从理论风险迅速演变为迫在眉睫的全球性威胁。 微软AI红队(AIRT)近日分享了其过去六年中对100余个生成式AI产品进行的深度红队测试,覆盖文本、图像、视频多模态模型及Copilot等集成系统。 这些实战经验揭示了AI系统在安全与伦理上的共性漏洞,也颠覆了传统攻防思维。
2/6/2025 3:16:19 PM
GoUpSec

OpenAI推出新人工智能代理Deep Research

上个月,DeepSeek改写了人工智能的剧本,这促使整个行业坐下来关注。 一些科技巨头被迫重新思考他们的游戏,因为旧的战术可能会在这个快速变化的环境中削弱自己。 OpenAI是人工智能领域的关键参与者,对DeepSeek的挑战做出了回应,承诺“提供更好的模型”并加快产品发布。
2/6/2025 3:07:27 PM
AI情报室

2025年CIO应将AI投资押注于何处

回望2024年,我们或许会发现,这是大型语言模型(LLM)成为主流的一年,每个企业级SaaS都增加了协作助手或虚拟助手功能,许多企业也首次尝到了代理式AI的滋味。 CIO们获得了可观的预算,用于利用GenAI提高生产力、节约成本并增强竞争优势。 据沃顿商学院的AI报告显示,2024年企业对GenAI的投资相比2023年增长了2.3倍,但预测未来两到五年的增幅将有所降低。
2/6/2025 2:55:45 PM
Isaac Sacolick

企业如何平衡GenAI采用的成本与机遇

GenAI正在重塑企业的运营方式,为提高效率、简化运营、革新客户服务和增强决策能力提供了前所未有的机遇,然而,伴随着其带来的巨大回报承诺的,还有巨大的成本,以及往往并不明确的投资回报率。 对于负责管理IT预算同时推动技术创新的CIO而言,平衡GenAI的成本与收益至关重要。 本文将探讨采用GenAI所面临的与成本相关的障碍,包括高昂的实施费用、低效的成本管理以及基础设施需求。
2/6/2025 2:52:41 PM
Mona Liddell