AI在线 AI在线

理论

谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零

谷歌推出Gemini原生图像生成,测试版瞬间引爆网络。 如果你迟到了,但没有好的借口,甚至还没有出家门——只需要一张自拍,然后让AI把你P到地铁故障现场。 图片也可以凭空生成一个人物形象,把它放到原神游戏画面中(不用上传游戏截图),让角色往前走两步,再把视角往左移,走近一个建筑,开始爬墙。
3/14/2025 12:14:38 PM

ChatGPT再进化:o1支持调用Python分析数据,网友:已经成为Copilot了

今天一大早,ChatGPT突然更新——基于Python的数据分析功能,在o1和o3-mini当中也可以使用了。 OpenAI介绍,现在可以通过两款模型调用Python,完成数据分析、可视化、基于场景的模拟等任务。 量子位实测发现,虽然界面并无明显变化,但是Python的确已经在o1当中悄悄“上岗”了。
3/14/2025 12:14:24 PM
量子位

MM-Eureka:极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。 例如,R1-V 仅在简单计数任务上表现出进步,未能实现回答长度的增长和顿悟时刻;R1-Multimodal-Journey 则在训练过程中回答长度反而降低;LMM-R1 虽然有所进步,但尚未在大规模图文数据训练中得到验证。 而 Kimi 1.5 尽管表现突出,但并未开源其模型或数据。
3/14/2025 11:59:29 AM
机器之心

DeepSeek爆火后的新Scaling Law究竟是什么?

出品 | 51CTO技术栈(微信号:blog51cto)嘉宾 | 周博洋、魏新宇采访 | 薛彦泽撰稿 | 李美涵DeepSeek R1的发布在全球人工智能领域引发了巨大反响。 这款由中国初创企业DeepSeek推出的低成本、高性能AI模型,打破了人们对AI研发“高投入、长周期”的固有认知,被西方媒体誉为“人工智能的斯普特尼克时刻”。 DeepSeek的“奇迹”有目共睹。
3/14/2025 11:18:19 AM
伊风

OpenAI紧急上书,矛头直指DeepSeek!15页提案欲锁死中国AI

就在刚刚,OpenAI不装了,彻底摊牌:呼吁美国提案,禁止DeepSeek! 这一次,OpenAI给DeepSeek-r1安上了不少罪名:极度不安全,侵犯知识产权等等。 图片今天,OpenAI放出了一份长达15页的政策建议报告,沉痛呼吁——如今美国正在审议的数百项AI法案,可能会削弱美国技术进步,尤其是美国面临来自中国新一轮竞争的重要关头!
3/14/2025 11:15:21 AM
新智元

OpenAI翻脸,提议禁止中国模型

编辑 | 伊风、言征OpenAI真的装不下去了! 根据CNBC爆料,OpenAI刚刚向美国政府提交了一份长达15页的建议书,呼吁放开监管,字里行间透露着对中国AI技术竞争的担忧——如果不行动,中国AI将在2030年之前全面超越美国。 这份建议书反映出OpenAI试图直接影响即将出台的“AI行动计划”。
3/14/2025 11:09:41 AM
伊风

炸裂官宣!大佬亲自站台,AWS 全力支持 DeepSeek!

月11日凌晨,AWS宣布在AWS Bedrock推出全托管的DeepSeek-R1模型,成为首个提供DeepSeek-R1全托管的海外云厂商。 与此同时,DeepSeek也成为是首个登陆Amazon Bedrock的国产大模型。 Amazon CEO Andy .
3/14/2025 10:43:27 AM
架构师之路

Anthropic CEO:全体失业好过50%失业!AI将接管所有代码,但可以一键「躺平」

「再过一年,所有的代码可能都是AI生成的。 」「它们会随机抢走世界上50%的工作。 」「应该设计一个按钮,让AI可以一键『躺平』。
3/14/2025 10:29:43 AM
新智元

CVPR2025最新!探索3D场景推理问答新高度:双视觉感知网络

0.背景信息在人工智能的前沿领域,3D场景问答(3D QA)正在成为视觉与语言理解的关键挑战。 相比于传统的2D视觉问答(VQA),3D QA需要模型不仅能够感知复杂的三维空间结构,还要理解语言描述与场景之间的关系。 然而,目前的3D QA方法大多依赖于3D点云数据,而忽视了多视角图像提供的丰富局部纹理信息,这使得模型在面对小型、扁平物体时表现受限。
3/14/2025 10:26:58 AM
Jingzhou Luo等

首创GRPO方案!AlphaDrive:VLM+RL破解自动驾驶长尾难题

写在前面 & 笔者的个人理解OpenAI o1 和 DeepSeek R1 在数学和科学等复杂领域达到了或甚至超越了人类专家的水平,强化学习(RL)和推理在其中发挥了关键作用。 在自动驾驶领域,最近的端到端模型极大地提高了规划性能,但由于常识和推理能力有限,仍然难以应对长尾问题。 一些研究将视觉-语言模型(VLMs)集成到自动驾驶中,但它们通常依赖于预训练模型,并在驾驶数据上进行简单的监督微调(SFT),没有进一步探索专门为规划设计的训练策略或优化方法。
3/14/2025 10:22:03 AM
Bo Jiang等

人工智能治理是时候行动了

关于人工智能治理的讨论往往含糊不清,令人沮丧。 组织谈论人工智能伦理和监管合规性,但在实际实施方面,许多组织都因不确定性而瘫痪。 就目前而言,治理往往是一项高层公司指令,而不是一项具体可行的计划。
3/14/2025 10:18:50 AM
佚名

南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成

(1Prompt1Story)是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权(SVR)和身份保持交叉注意力(IPCA)技术,解决了生成图像中身份不一致的问题,同时保持了文本描述的精准对齐。 相关链接论文:::,通过单个连接提示实现一致的文本到图像生成。 我们的方法可以应用于所有基于文本嵌入的文本到图像模型。
3/14/2025 10:02:38 AM
AIGC Studio

AI 会取代渗透测试工程师吗?

多年来,我们一直在听到同样的说法:AI将会取代你的工作。 事实上,2017年麦肯锡发布了一份报告《消失与新增的岗位:自动化时代下的劳动力转型》,预测到2030年,将有3.75亿工人需要寻找新工作,否则可能会被AI和自动化取代。 这无疑引发了人们的焦虑。
3/14/2025 10:00:00 AM
AI小蜜蜂

AI助力绘制生物多样性图改善药物发现

当涉及到对过去40亿年来地球上进化的所有蛋白质和酶进行编目时,人类知识几乎没有触及表面。 这就是为什么一家名为Basecamp Research的公司正在将图形和人工智能技术结合起来,以扩大人类知识的范围并加速药物发现。 Basecamp Research由Glen Gowers和Oliver Vince于2019年创立,旨在加速药物研究中数据驱动的突破。
3/14/2025 9:59:54 AM
佚名

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人? 强化学习大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番:我带过的学生里,也就 12 个吧。 这些公司的名气都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都听说过。
3/14/2025 9:24:29 AM
机器之心

无缝切换,实现多厂家大模型高效对接

1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路

用好云服务,托起GenAI:从数据准备到部署的全流程梳理

译者 | 核子可乐审校 | 重楼事实证明,云已经成为大规模AI部署的主要阵地,其提供的快速原型设计、弹性计算及存储等AI原生API,正是攻克扩展问题的利器。 本文将助你快速梳理如何在云端构建并扩展生成式AI应用程序。 云在生成式AI中的重要作用云在当代生成式AI应用中的核心作用,在于其能够容纳AI模型所需要的巨大处理能力、数据存储与分布式流程需求。
3/14/2025 8:29:49 AM
核子可乐

一文读懂迁移学习和ASPP如何使自动驾驶汽车的目标检测更加智能

译者 | 张哲刚审校 | 重楼自动驾驶汽车是不能犯错误的,忽视一个红绿灯或一个行人都可能意味着灾难。 但城市环境是动态的,在这样的环境中目标检测是一个大难题。 我使用空洞空间卷积池化金字塔(ASPP)和迁移学习来优化自动驾驶汽车的目标检测,结果如何呢?
3/14/2025 8:00:00 AM
张哲刚