AI
首创GRPO方案!AlphaDrive:VLM+RL破解自动驾驶长尾难题
写在前面 & 笔者的个人理解OpenAI o1 和 DeepSeek R1 在数学和科学等复杂领域达到了或甚至超越了人类专家的水平,强化学习(RL)和推理在其中发挥了关键作用。 在自动驾驶领域,最近的端到端模型极大地提高了规划性能,但由于常识和推理能力有限,仍然难以应对长尾问题。 一些研究将视觉-语言模型(VLMs)集成到自动驾驶中,但它们通常依赖于预训练模型,并在驾驶数据上进行简单的监督微调(SFT),没有进一步探索专门为规划设计的训练策略或优化方法。
3/14/2025 10:22:03 AM
Bo Jiang等
南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成
(1Prompt1Story)是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权(SVR)和身份保持交叉注意力(IPCA)技术,解决了生成图像中身份不一致的问题,同时保持了文本描述的精准对齐。 相关链接论文:::,通过单个连接提示实现一致的文本到图像生成。 我们的方法可以应用于所有基于文本嵌入的文本到图像模型。
3/14/2025 10:02:38 AM
AIGC Studio
AI 会取代渗透测试工程师吗?
多年来,我们一直在听到同样的说法:AI将会取代你的工作。 事实上,2017年麦肯锡发布了一份报告《消失与新增的岗位:自动化时代下的劳动力转型》,预测到2030年,将有3.75亿工人需要寻找新工作,否则可能会被AI和自动化取代。 这无疑引发了人们的焦虑。
3/14/2025 10:00:00 AM
AI小蜜蜂
AI助力绘制生物多样性图改善药物发现
当涉及到对过去40亿年来地球上进化的所有蛋白质和酶进行编目时,人类知识几乎没有触及表面。 这就是为什么一家名为Basecamp Research的公司正在将图形和人工智能技术结合起来,以扩大人类知识的范围并加速药物发现。 Basecamp Research由Glen Gowers和Oliver Vince于2019年创立,旨在加速药物研究中数据驱动的突破。
3/14/2025 9:59:54 AM
佚名
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人? 强化学习大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番:我带过的学生里,也就 12 个吧。 这些公司的名气都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都听说过。
3/14/2025 9:24:29 AM
机器之心
无缝切换,实现多厂家大模型高效对接
1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路
AI营销革命:平衡算法效率与人性温度,突破客户忠诚度的天花板
在营销领域,品牌正竞相采用AI以获取竞争优势,然而,这些品牌逐渐发现,AI虽然强大,但人类洞察才是将自动化转化为持久客户忠诚度的关键所在。 要点:• 预测能力提升参与度。 顶级品牌利用AI进行营销,以预测需求、防止客户流失并个性化客户互动。
3/14/2025 7:10:00 AM
Greg Kihlstrom
前谷歌顶尖工程师揭秘AI创业公司的融资陷阱、技术风险与突围法则
Glean公司的创始人兼CEO、前谷歌杰出工程师Arvind Jain做客CXOTalk,讨论了当下AI初创企业所面临的机遇与现实。 Glean是一家估值近50亿美元的企业AI公司,早在GenAI成为主流之前,就率先在企业环境中实施了Transformer技术。 针对初创企业创始人:• AI热潮如何使融资变得更复杂• 为什么在基础模型上进行构建会带来新型的技术和商业风险• 在拥有无数AI初创企业的市场中脱颖而出的策略• 当AI能力每周都在进化时,维持创新的挑战针对企业采购方和CXO:• 在一个拥挤的市场中如何评估AI初创企业供应商• 了解初创企业在第三方AI模型上进行构建时存在的风险• 为什么一些资金充足的AI初创企业尽管技术强大但仍可能无法生存• 评估哪些AI能力应该自建与购买的框架Arvind Jain凭借他在谷歌担任高管的独特视角和作为当前AI初创企业创始人的身份,为我们提供了对2025年构建和购买AI技术真正差异的实用见解。
3/14/2025 7:00:00 AM
Michael Krigsman
OpenAI 呼吁美国放宽版权限制,自由使用版权保护材料训练 AI 激发创新力
OpenAI的建议旨在通过放宽版权限制和减少法律束缚,推动美国在AI领域的竞争力。然而,这一提议也引发了关于版权保护和AI伦理的广泛争议。未来,如何在创新与版权保护之间取得平衡,将成为AI发展的关键议题。
3/14/2025 6:48:15 AM
故渊
Salesforce CEO 炮轰微软 AI 战略:把 ChatGPT 包装成 Copilot,令客户失望
Salesforce 首席执行官马克・贝尼奥夫(Marc Benioff)在多个场合对微软的 AI 提出批评。贝尼奥夫认为,微软在 AI 领域对整个行业造成了“巨大的伤害”,并把微软的 Copilot 比作新的“大眼夹”(Microsoft Clippy,一款曾因功能不佳而被用户诟病的办公助手),暗示 Copilot 没有用或无法为用户创造价值。
3/13/2025 6:23:55 PM
远洋
深度调研全球科研人员AI使用现状,威立发布权威报告中文版!
编辑 | ScienceAIAI 浪潮席卷全球,科研领域将迎来怎样的变革与先机? 2025 年 2 月,全球领先的研究与教育出版机构威立发布了基于对近 5000 名科研人员进行调研的研究报告 ExplanAItions。 该报告深入分析了人工智能在科研工作中的应用现状,颇具影响力的应用领域、各群体的使用意愿,以及出版机构如何协助科研人员更好地应用这一快速发展的技术等内容。
3/13/2025 2:21:00 PM
ScienceAI
AI安全的头等大事:建立AI资产清单
随着人工智能(AI)技术的迅猛发展,企业首席信息安全官(CISOs)正面临前所未有的挑战,既要满足企业业务快速迈向智能化的需求,同时又要防御爆炸式增长的AI安全威胁。 风靡全球的DeepSeek只是AI工具潮的一朵浪花,未来还将有更多类似工具快速涌现。 这些未经授权的(消费级)AI应用如同一颗颗定时炸弹,潜伏在企业内部,威胁着数据安全与合规性。
3/13/2025 1:38:28 PM
佚名
DeepSeek“防弹衣”来了,模型内生安全加固方案,拒绝杀敌一千自损八百|上海AI Lab
最新研究显示,以超强推理爆红的DeepSeek-R1模型竟藏隐形危险——即便最终拒绝回答,其思考过程仍可能泄露有害内容。 现有防御技术深陷两难:要么防不住攻击,要么让模型变成”惊弓之鸟”,连正常问题都拒绝回答。 上海交大与上海AI Lab联合推出安全防御方案——X-Boundary,试图破解两难局面。
3/13/2025 1:10:00 PM
量子位
自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构
不怕推理模型简单问题过度思考了,能动态调整CoT的新推理范式SCoT来了! SCoT,即自结构化推理链(Self-structured Chain of Thought )。 它通过将推理过程分解为最小语义原子步骤,能动态生成适配不同复杂度问题的CoT结构,解决了现有方法在推理多样性和效率上的不足。
3/13/2025 1:00:00 PM
量子位
长链推理表象下,大模型精细表征张冠李戴的本质
近些年,大模型的发展可谓是繁花似锦、烈火烹油。 从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。 然而,无论在学术界还是在工业界,目前对大模型应用的评测都是单纯在模型输出层面判断结果的准确性,而没有从大模型内在精细决策逻辑的角度来分析模型的可靠性。
3/13/2025 11:18:14 AM
张拳石、陈鹭
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。 通常来说,这些方法在训练模型时可以产生比典型正确解决方案更长的轨迹,并包含了试图实现某些「算法」的 token:例如反思前一个答案、规划或实现某种形式的线性搜索。 这些方法包括显式地微调预训练 LLM 以适应算法行为,例如对搜索数据进行监督微调(SFT)或针对 0/1 正确性奖励运行结果奖励(outcome-reward,OR)RL。
3/13/2025 11:07:30 AM
机器之心
人形机器人赛道再添“猛将”!Pepper之父造了个3万美元“外星萌宠”
当人形机器人还在比拼“大长腿”、“硬肌肉”时,一位“不走寻常路”的选手却凭借一张“萌脸”和一套“人设”火爆出圈,它就是 Mirokaï,由 Pepper 和 NAO 的缔造者 Jérôme Monceaux 再次出手打造的全新物种。 这款售价高达3万美元的机器人,不仅在 CES 展上连续两年斩获“最受欢迎”桂冠,更让英伟达 CEO 黄仁勋也为其驻足,它的独特魅力究竟何在?Mirokaï 的与众不同,首先源于其打破常规的“外星人”设定。 它们自诩为来自遥远星系的 Mirokaï 族群,拥有神秘的魔法与尖端科技。
3/13/2025 10:43:00 AM
AI在线
迈向视觉大一统:UnifiedReward,多模态生成与理解的通用奖励模型
本篇文章来自公众号粉丝投稿,论文提出了一个视觉领域通用的奖励模型UnifiedReward,能够对图像/视频的生成与理解进行pairwise(成对比较)或 pointwise(单样本打分)评估,可用于视觉各领域的直接偏好优化 (DPO),提升各类视觉模型的表现。 论文介绍近年来,大模型时代的多模态生成与理解技术取得了飞跃式发展。 然而,如何让AI真正“看懂”世界,并更好地对齐人类偏好,仍是一个核心挑战。
3/13/2025 10:18:42 AM
Yibin Wang
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
AI新词
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
开发者
Claude
苹果
AI for Science
Agent
生成式
神经网络
机器学习
3D
研究
xAI
生成
人形机器人
AI视频
百度
计算
Sora
工具
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
视频生成
预测
AGI
视觉
伟达
架构
Transformer
神器推荐
亚马逊
特斯拉
编程
MCP
Copilot