AI在线 AI在线

理论

Anthropic CEO:全体失业好过50%失业!AI将接管所有代码,但可以一键「躺平」

「再过一年,所有的代码可能都是AI生成的。 」「它们会随机抢走世界上50%的工作。 」「应该设计一个按钮,让AI可以一键『躺平』。
3/14/2025 10:29:43 AM
新智元

CVPR2025最新!探索3D场景推理问答新高度:双视觉感知网络

0.背景信息在人工智能的前沿领域,3D场景问答(3D QA)正在成为视觉与语言理解的关键挑战。 相比于传统的2D视觉问答(VQA),3D QA需要模型不仅能够感知复杂的三维空间结构,还要理解语言描述与场景之间的关系。 然而,目前的3D QA方法大多依赖于3D点云数据,而忽视了多视角图像提供的丰富局部纹理信息,这使得模型在面对小型、扁平物体时表现受限。
3/14/2025 10:26:58 AM
Jingzhou Luo等

首创GRPO方案!AlphaDrive:VLM+RL破解自动驾驶长尾难题

写在前面 & 笔者的个人理解OpenAI o1 和 DeepSeek R1 在数学和科学等复杂领域达到了或甚至超越了人类专家的水平,强化学习(RL)和推理在其中发挥了关键作用。 在自动驾驶领域,最近的端到端模型极大地提高了规划性能,但由于常识和推理能力有限,仍然难以应对长尾问题。 一些研究将视觉-语言模型(VLMs)集成到自动驾驶中,但它们通常依赖于预训练模型,并在驾驶数据上进行简单的监督微调(SFT),没有进一步探索专门为规划设计的训练策略或优化方法。
3/14/2025 10:22:03 AM
Bo Jiang等

人工智能治理是时候行动了

关于人工智能治理的讨论往往含糊不清,令人沮丧。 组织谈论人工智能伦理和监管合规性,但在实际实施方面,许多组织都因不确定性而瘫痪。 就目前而言,治理往往是一项高层公司指令,而不是一项具体可行的计划。
3/14/2025 10:18:50 AM
佚名

南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成

(1Prompt1Story)是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权(SVR)和身份保持交叉注意力(IPCA)技术,解决了生成图像中身份不一致的问题,同时保持了文本描述的精准对齐。 相关链接论文:::,通过单个连接提示实现一致的文本到图像生成。 我们的方法可以应用于所有基于文本嵌入的文本到图像模型。
3/14/2025 10:02:38 AM
AIGC Studio

AI 会取代渗透测试工程师吗?

多年来,我们一直在听到同样的说法:AI将会取代你的工作。 事实上,2017年麦肯锡发布了一份报告《消失与新增的岗位:自动化时代下的劳动力转型》,预测到2030年,将有3.75亿工人需要寻找新工作,否则可能会被AI和自动化取代。 这无疑引发了人们的焦虑。
3/14/2025 10:00:00 AM
AI小蜜蜂

AI助力绘制生物多样性图改善药物发现

当涉及到对过去40亿年来地球上进化的所有蛋白质和酶进行编目时,人类知识几乎没有触及表面。 这就是为什么一家名为Basecamp Research的公司正在将图形和人工智能技术结合起来,以扩大人类知识的范围并加速药物发现。 Basecamp Research由Glen Gowers和Oliver Vince于2019年创立,旨在加速药物研究中数据驱动的突破。
3/14/2025 9:59:54 AM
佚名

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人? 强化学习大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番:我带过的学生里,也就 12 个吧。 这些公司的名气都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都听说过。
3/14/2025 9:24:29 AM
机器之心

无缝切换,实现多厂家大模型高效对接

1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路

用好云服务,托起GenAI:从数据准备到部署的全流程梳理

译者 | 核子可乐审校 | 重楼事实证明,云已经成为大规模AI部署的主要阵地,其提供的快速原型设计、弹性计算及存储等AI原生API,正是攻克扩展问题的利器。 本文将助你快速梳理如何在云端构建并扩展生成式AI应用程序。 云在生成式AI中的重要作用云在当代生成式AI应用中的核心作用,在于其能够容纳AI模型所需要的巨大处理能力、数据存储与分布式流程需求。
3/14/2025 8:29:49 AM
核子可乐

一文读懂迁移学习和ASPP如何使自动驾驶汽车的目标检测更加智能

译者 | 张哲刚审校 | 重楼自动驾驶汽车是不能犯错误的,忽视一个红绿灯或一个行人都可能意味着灾难。 但城市环境是动态的,在这样的环境中目标检测是一个大难题。 我使用空洞空间卷积池化金字塔(ASPP)和迁移学习来优化自动驾驶汽车的目标检测,结果如何呢?
3/14/2025 8:00:00 AM
张哲刚

AI营销革命:平衡算法效率与人性温度,突破客户忠诚度的天花板

在营销领域,品牌正竞相采用AI以获取竞争优势,然而,这些品牌逐渐发现,AI虽然强大,但人类洞察才是将自动化转化为持久客户忠诚度的关键所在。 要点:• 预测能力提升参与度。 顶级品牌利用AI进行营销,以预测需求、防止客户流失并个性化客户互动。
3/14/2025 7:10:00 AM
Greg Kihlstrom

前谷歌顶尖工程师揭秘AI创业公司的融资陷阱、技术风险与突围法则

Glean公司的创始人兼CEO、前谷歌杰出工程师Arvind Jain做客CXOTalk,讨论了当下AI初创企业所面临的机遇与现实。 Glean是一家估值近50亿美元的企业AI公司,早在GenAI成为主流之前,就率先在企业环境中实施了Transformer技术。 针对初创企业创始人:• AI热潮如何使融资变得更复杂• 为什么在基础模型上进行构建会带来新型的技术和商业风险• 在拥有无数AI初创企业的市场中脱颖而出的策略• 当AI能力每周都在进化时,维持创新的挑战针对企业采购方和CXO:• 在一个拥挤的市场中如何评估AI初创企业供应商• 了解初创企业在第三方AI模型上进行构建时存在的风险• 为什么一些资金充足的AI初创企业尽管技术强大但仍可能无法生存• 评估哪些AI能力应该自建与购买的框架Arvind Jain凭借他在谷歌担任高管的独特视角和作为当前AI初创企业创始人的身份,为我们提供了对2025年构建和购买AI技术真正差异的实用见解。
3/14/2025 7:00:00 AM
Michael Krigsman

科学家构建多模态LLM框架,进行3D脑CT放射学报告生成

编辑 | 烂菜叶多模态大型语言模型 (MLLM) 已经改变了现代医疗保健的格局,其中自动放射学报告生成 (RRG) 正在成为一种尖端应用。 虽然基于 2D MLLM 的 RRG 已经得到充分认可,但其在 3D 医学图像中的实用性仍未得到充分开发。 在这方面,台北荣民总医院(Taipei Veterans General Hospital)、台湾阳明交通大学(National Yang Ming Chiao Tung University)以及美国加州大学的研究人员整理了 3D-BrainCT 数据集(18,885 个文本扫描对)并开发了 BrainGPT,这是一种专为 3D CT RRG 设计的临床视觉指令调整 (CVIT) 模型。
3/13/2025 2:23:00 PM
ScienceAI

深度调研全球科研人员AI使用现状,威立发布权威报告中文版!

编辑 | ScienceAIAI 浪潮席卷全球,科研领域将迎来怎样的变革与先机? 2025 年 2 月,全球领先的研究与教育出版机构威立发布了基于对近 5000 名科研人员进行调研的研究报告 ExplanAItions。 该报告深入分析了人工智能在科研工作中的应用现状,颇具影响力的应用领域、各群体的使用意愿,以及出版机构如何协助科研人员更好地应用这一快速发展的技术等内容。
3/13/2025 2:21:00 PM
ScienceAI

DeepSeek 3FS 架构分析和思考(上篇)

2025 年 2 月28 日,DeepSeek 在其开源周最后一天压轴发布了自研的并行文件系统 Fire-Flyer File System,简称 3FS。 该系统支撑了 DeepSeek V3&R1 模型训练、推理的全流程,在数据预处理、数据集加载、CheckPoint、KVCache 等场景发挥了重要作用。 项目一经发布,就获得了存储领域的广泛关注。
3/13/2025 1:51:46 PM
火山引擎存储团队

AI安全的头等大事:建立AI资产清单

随着人工智能(AI)技术的迅猛发展,企业首席信息安全官(CISOs)正面临前所未有的挑战,既要满足企业业务快速迈向智能化的需求,同时又要防御爆炸式增长的AI安全威胁。 风靡全球的DeepSeek只是AI工具潮的一朵浪花,未来还将有更多类似工具快速涌现。 这些未经授权的(消费级)AI应用如同一颗颗定时炸弹,潜伏在企业内部,威胁着数据安全与合规性。
3/13/2025 1:38:28 PM
佚名

耗时一年半!谷歌新定义具身通用最强SOTA,轰动硅谷!物理世界的原生推理能力、灵活性让人惊掉下巴!网友:亿些震撼!

出品 | 51CTO技术栈(微信号:blog51cto)想知道世界SOTA级别的模型用在物理世界中有多震撼吗? Google DeepMind做了一件破天荒的事情。 大模型自爆火以来,已经过去两年多,但在物理世界中真正能转化为机器人行为,还是一个世界级难题。
3/13/2025 1:37:14 PM
云昭