理论
谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零
谷歌推出Gemini原生图像生成,测试版瞬间引爆网络。 如果你迟到了,但没有好的借口,甚至还没有出家门——只需要一张自拍,然后让AI把你P到地铁故障现场。 图片也可以凭空生成一个人物形象,把它放到原神游戏画面中(不用上传游戏截图),让角色往前走两步,再把视角往左移,走近一个建筑,开始爬墙。
3/14/2025 12:14:38 PM
ChatGPT再进化:o1支持调用Python分析数据,网友:已经成为Copilot了
今天一大早,ChatGPT突然更新——基于Python的数据分析功能,在o1和o3-mini当中也可以使用了。 OpenAI介绍,现在可以通过两款模型调用Python,完成数据分析、可视化、基于场景的模拟等任务。 量子位实测发现,虽然界面并无明显变化,但是Python的确已经在o1当中悄悄“上岗”了。
3/14/2025 12:14:24 PM
量子位
MM-Eureka:极少数据实现多模态推理的R1-Zero时刻
尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。 例如,R1-V 仅在简单计数任务上表现出进步,未能实现回答长度的增长和顿悟时刻;R1-Multimodal-Journey 则在训练过程中回答长度反而降低;LMM-R1 虽然有所进步,但尚未在大规模图文数据训练中得到验证。 而 Kimi 1.5 尽管表现突出,但并未开源其模型或数据。
3/14/2025 11:59:29 AM
机器之心
DeepSeek爆火后的新Scaling Law究竟是什么?
出品 | 51CTO技术栈(微信号:blog51cto)嘉宾 | 周博洋、魏新宇采访 | 薛彦泽撰稿 | 李美涵DeepSeek R1的发布在全球人工智能领域引发了巨大反响。 这款由中国初创企业DeepSeek推出的低成本、高性能AI模型,打破了人们对AI研发“高投入、长周期”的固有认知,被西方媒体誉为“人工智能的斯普特尼克时刻”。 DeepSeek的“奇迹”有目共睹。
3/14/2025 11:18:19 AM
伊风
OpenAI紧急上书,矛头直指DeepSeek!15页提案欲锁死中国AI
就在刚刚,OpenAI不装了,彻底摊牌:呼吁美国提案,禁止DeepSeek! 这一次,OpenAI给DeepSeek-r1安上了不少罪名:极度不安全,侵犯知识产权等等。 图片今天,OpenAI放出了一份长达15页的政策建议报告,沉痛呼吁——如今美国正在审议的数百项AI法案,可能会削弱美国技术进步,尤其是美国面临来自中国新一轮竞争的重要关头!
3/14/2025 11:15:21 AM
新智元
OpenAI翻脸,提议禁止中国模型
编辑 | 伊风、言征OpenAI真的装不下去了! 根据CNBC爆料,OpenAI刚刚向美国政府提交了一份长达15页的建议书,呼吁放开监管,字里行间透露着对中国AI技术竞争的担忧——如果不行动,中国AI将在2030年之前全面超越美国。 这份建议书反映出OpenAI试图直接影响即将出台的“AI行动计划”。
3/14/2025 11:09:41 AM
伊风
炸裂官宣!大佬亲自站台,AWS 全力支持 DeepSeek!
月11日凌晨,AWS宣布在AWS Bedrock推出全托管的DeepSeek-R1模型,成为首个提供DeepSeek-R1全托管的海外云厂商。 与此同时,DeepSeek也成为是首个登陆Amazon Bedrock的国产大模型。 Amazon CEO Andy .
3/14/2025 10:43:27 AM
架构师之路
Anthropic CEO:全体失业好过50%失业!AI将接管所有代码,但可以一键「躺平」
「再过一年,所有的代码可能都是AI生成的。 」「它们会随机抢走世界上50%的工作。 」「应该设计一个按钮,让AI可以一键『躺平』。
3/14/2025 10:29:43 AM
新智元
CVPR2025最新!探索3D场景推理问答新高度:双视觉感知网络
0.背景信息在人工智能的前沿领域,3D场景问答(3D QA)正在成为视觉与语言理解的关键挑战。 相比于传统的2D视觉问答(VQA),3D QA需要模型不仅能够感知复杂的三维空间结构,还要理解语言描述与场景之间的关系。 然而,目前的3D QA方法大多依赖于3D点云数据,而忽视了多视角图像提供的丰富局部纹理信息,这使得模型在面对小型、扁平物体时表现受限。
3/14/2025 10:26:58 AM
Jingzhou Luo等
首创GRPO方案!AlphaDrive:VLM+RL破解自动驾驶长尾难题
写在前面 & 笔者的个人理解OpenAI o1 和 DeepSeek R1 在数学和科学等复杂领域达到了或甚至超越了人类专家的水平,强化学习(RL)和推理在其中发挥了关键作用。 在自动驾驶领域,最近的端到端模型极大地提高了规划性能,但由于常识和推理能力有限,仍然难以应对长尾问题。 一些研究将视觉-语言模型(VLMs)集成到自动驾驶中,但它们通常依赖于预训练模型,并在驾驶数据上进行简单的监督微调(SFT),没有进一步探索专门为规划设计的训练策略或优化方法。
3/14/2025 10:22:03 AM
Bo Jiang等
人工智能治理是时候行动了
关于人工智能治理的讨论往往含糊不清,令人沮丧。 组织谈论人工智能伦理和监管合规性,但在实际实施方面,许多组织都因不确定性而瘫痪。 就目前而言,治理往往是一项高层公司指令,而不是一项具体可行的计划。
3/14/2025 10:18:50 AM
佚名
南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成
(1Prompt1Story)是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权(SVR)和身份保持交叉注意力(IPCA)技术,解决了生成图像中身份不一致的问题,同时保持了文本描述的精准对齐。 相关链接论文:::,通过单个连接提示实现一致的文本到图像生成。 我们的方法可以应用于所有基于文本嵌入的文本到图像模型。
3/14/2025 10:02:38 AM
AIGC Studio
AI 会取代渗透测试工程师吗?
多年来,我们一直在听到同样的说法:AI将会取代你的工作。 事实上,2017年麦肯锡发布了一份报告《消失与新增的岗位:自动化时代下的劳动力转型》,预测到2030年,将有3.75亿工人需要寻找新工作,否则可能会被AI和自动化取代。 这无疑引发了人们的焦虑。
3/14/2025 10:00:00 AM
AI小蜜蜂
AI助力绘制生物多样性图改善药物发现
当涉及到对过去40亿年来地球上进化的所有蛋白质和酶进行编目时,人类知识几乎没有触及表面。 这就是为什么一家名为Basecamp Research的公司正在将图形和人工智能技术结合起来,以扩大人类知识的范围并加速药物发现。 Basecamp Research由Glen Gowers和Oliver Vince于2019年创立,旨在加速药物研究中数据驱动的突破。
3/14/2025 9:59:54 AM
佚名
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人? 强化学习大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番:我带过的学生里,也就 12 个吧。 这些公司的名气都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都听说过。
3/14/2025 9:24:29 AM
机器之心
无缝切换,实现多厂家大模型高效对接
1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路
用好云服务,托起GenAI:从数据准备到部署的全流程梳理
译者 | 核子可乐审校 | 重楼事实证明,云已经成为大规模AI部署的主要阵地,其提供的快速原型设计、弹性计算及存储等AI原生API,正是攻克扩展问题的利器。 本文将助你快速梳理如何在云端构建并扩展生成式AI应用程序。 云在生成式AI中的重要作用云在当代生成式AI应用中的核心作用,在于其能够容纳AI模型所需要的巨大处理能力、数据存储与分布式流程需求。
3/14/2025 8:29:49 AM
核子可乐
一文读懂迁移学习和ASPP如何使自动驾驶汽车的目标检测更加智能
译者 | 张哲刚审校 | 重楼自动驾驶汽车是不能犯错误的,忽视一个红绿灯或一个行人都可能意味着灾难。 但城市环境是动态的,在这样的环境中目标检测是一个大难题。 我使用空洞空间卷积池化金字塔(ASPP)和迁移学习来优化自动驾驶汽车的目标检测,结果如何呢?
3/14/2025 8:00:00 AM
张哲刚
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型