理论
MM-Eureka:极少数据实现多模态推理的R1-Zero时刻
尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。 例如,R1-V 仅在简单计数任务上表现出进步,未能实现回答长度的增长和顿悟时刻;R1-Multimodal-Journey 则在训练过程中回答长度反而降低;LMM-R1 虽然有所进步,但尚未在大规模图文数据训练中得到验证。 而 Kimi 1.5 尽管表现突出,但并未开源其模型或数据。
DeepSeek爆火后的新Scaling Law究竟是什么?
出品 | 51CTO技术栈(微信号:blog51cto)嘉宾 | 周博洋、魏新宇采访 | 薛彦泽撰稿 | 李美涵DeepSeek R1的发布在全球人工智能领域引发了巨大反响。 这款由中国初创企业DeepSeek推出的低成本、高性能AI模型,打破了人们对AI研发“高投入、长周期”的固有认知,被西方媒体誉为“人工智能的斯普特尼克时刻”。 DeepSeek的“奇迹”有目共睹。
OpenAI紧急上书,矛头直指DeepSeek!15页提案欲锁死中国AI
就在刚刚,OpenAI不装了,彻底摊牌:呼吁美国提案,禁止DeepSeek! 这一次,OpenAI给DeepSeek-r1安上了不少罪名:极度不安全,侵犯知识产权等等。 图片今天,OpenAI放出了一份长达15页的政策建议报告,沉痛呼吁——如今美国正在审议的数百项AI法案,可能会削弱美国技术进步,尤其是美国面临来自中国新一轮竞争的重要关头!
OpenAI翻脸,提议禁止中国模型
编辑 | 伊风、言征OpenAI真的装不下去了! 根据CNBC爆料,OpenAI刚刚向美国政府提交了一份长达15页的建议书,呼吁放开监管,字里行间透露着对中国AI技术竞争的担忧——如果不行动,中国AI将在2030年之前全面超越美国。 这份建议书反映出OpenAI试图直接影响即将出台的“AI行动计划”。
炸裂官宣!大佬亲自站台,AWS 全力支持 DeepSeek!
月11日凌晨,AWS宣布在AWS Bedrock推出全托管的DeepSeek-R1模型,成为首个提供DeepSeek-R1全托管的海外云厂商。 与此同时,DeepSeek也成为是首个登陆Amazon Bedrock的国产大模型。 Amazon CEO Andy .
Anthropic CEO:全体失业好过50%失业!AI将接管所有代码,但可以一键「躺平」
「再过一年,所有的代码可能都是AI生成的。 」「它们会随机抢走世界上50%的工作。 」「应该设计一个按钮,让AI可以一键『躺平』。
CVPR2025最新!探索3D场景推理问答新高度:双视觉感知网络
0.背景信息在人工智能的前沿领域,3D场景问答(3D QA)正在成为视觉与语言理解的关键挑战。 相比于传统的2D视觉问答(VQA),3D QA需要模型不仅能够感知复杂的三维空间结构,还要理解语言描述与场景之间的关系。 然而,目前的3D QA方法大多依赖于3D点云数据,而忽视了多视角图像提供的丰富局部纹理信息,这使得模型在面对小型、扁平物体时表现受限。
首创GRPO方案!AlphaDrive:VLM+RL破解自动驾驶长尾难题
写在前面 & 笔者的个人理解OpenAI o1 和 DeepSeek R1 在数学和科学等复杂领域达到了或甚至超越了人类专家的水平,强化学习(RL)和推理在其中发挥了关键作用。 在自动驾驶领域,最近的端到端模型极大地提高了规划性能,但由于常识和推理能力有限,仍然难以应对长尾问题。 一些研究将视觉-语言模型(VLMs)集成到自动驾驶中,但它们通常依赖于预训练模型,并在驾驶数据上进行简单的监督微调(SFT),没有进一步探索专门为规划设计的训练策略或优化方法。
人工智能治理是时候行动了
关于人工智能治理的讨论往往含糊不清,令人沮丧。 组织谈论人工智能伦理和监管合规性,但在实际实施方面,许多组织都因不确定性而瘫痪。 就目前而言,治理往往是一项高层公司指令,而不是一项具体可行的计划。
南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成
(1Prompt1Story)是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权(SVR)和身份保持交叉注意力(IPCA)技术,解决了生成图像中身份不一致的问题,同时保持了文本描述的精准对齐。 相关链接论文:::,通过单个连接提示实现一致的文本到图像生成。 我们的方法可以应用于所有基于文本嵌入的文本到图像模型。
AI 会取代渗透测试工程师吗?
多年来,我们一直在听到同样的说法:AI将会取代你的工作。 事实上,2017年麦肯锡发布了一份报告《消失与新增的岗位:自动化时代下的劳动力转型》,预测到2030年,将有3.75亿工人需要寻找新工作,否则可能会被AI和自动化取代。 这无疑引发了人们的焦虑。
AI助力绘制生物多样性图改善药物发现
当涉及到对过去40亿年来地球上进化的所有蛋白质和酶进行编目时,人类知识几乎没有触及表面。 这就是为什么一家名为Basecamp Research的公司正在将图形和人工智能技术结合起来,以扩大人类知识的范围并加速药物发现。 Basecamp Research由Glen Gowers和Oliver Vince于2019年创立,旨在加速药物研究中数据驱动的突破。
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人? 强化学习大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番:我带过的学生里,也就 12 个吧。 这些公司的名气都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都听说过。
无缝切换,实现多厂家大模型高效对接
1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
用好云服务,托起GenAI:从数据准备到部署的全流程梳理
译者 | 核子可乐审校 | 重楼事实证明,云已经成为大规模AI部署的主要阵地,其提供的快速原型设计、弹性计算及存储等AI原生API,正是攻克扩展问题的利器。 本文将助你快速梳理如何在云端构建并扩展生成式AI应用程序。 云在生成式AI中的重要作用云在当代生成式AI应用中的核心作用,在于其能够容纳AI模型所需要的巨大处理能力、数据存储与分布式流程需求。
一文读懂迁移学习和ASPP如何使自动驾驶汽车的目标检测更加智能
译者 | 张哲刚审校 | 重楼自动驾驶汽车是不能犯错误的,忽视一个红绿灯或一个行人都可能意味着灾难。 但城市环境是动态的,在这样的环境中目标检测是一个大难题。 我使用空洞空间卷积池化金字塔(ASPP)和迁移学习来优化自动驾驶汽车的目标检测,结果如何呢?
AI营销革命:平衡算法效率与人性温度,突破客户忠诚度的天花板
在营销领域,品牌正竞相采用AI以获取竞争优势,然而,这些品牌逐渐发现,AI虽然强大,但人类洞察才是将自动化转化为持久客户忠诚度的关键所在。 要点:• 预测能力提升参与度。 顶级品牌利用AI进行营销,以预测需求、防止客户流失并个性化客户互动。
前谷歌顶尖工程师揭秘AI创业公司的融资陷阱、技术风险与突围法则
Glean公司的创始人兼CEO、前谷歌杰出工程师Arvind Jain做客CXOTalk,讨论了当下AI初创企业所面临的机遇与现实。 Glean是一家估值近50亿美元的企业AI公司,早在GenAI成为主流之前,就率先在企业环境中实施了Transformer技术。 针对初创企业创始人:• AI热潮如何使融资变得更复杂• 为什么在基础模型上进行构建会带来新型的技术和商业风险• 在拥有无数AI初创企业的市场中脱颖而出的策略• 当AI能力每周都在进化时,维持创新的挑战针对企业采购方和CXO:• 在一个拥挤的市场中如何评估AI初创企业供应商• 了解初创企业在第三方AI模型上进行构建时存在的风险• 为什么一些资金充足的AI初创企业尽管技术强大但仍可能无法生存• 评估哪些AI能力应该自建与购买的框架Arvind Jain凭借他在谷歌担任高管的独特视角和作为当前AI初创企业创始人的身份,为我们提供了对2025年构建和购买AI技术真正差异的实用见解。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉