模型
DeepSeek R-1 能否解答这五道“刁钻”AI 问题?
每当有新的语言模型公开发布时,我总会忍不住拿它来做一些看似简单、实则暗藏难点的小测试。 我把这当作给模型做“压力测试”,用来检验它们在逻辑推理上到底行不行。 DeepSeek R-1 刚发布不久,就因为它是开源、且推理能力强大而备受关注。
谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling
由于深度学习的「黑箱」本性,从业者自我调侃道:如果说深度神经网络是现代版的「炼金术」,我们在古代就是「炼金术士」。 2018年5月3日, Science发表新闻,标题直指「炼金术」,强调加强AI的科学基础但这次的谷歌的团队,却有不一样的看法:在许多方面,深度学习仍然带有一定的「炼金术」色彩,但理解和优化模型性能并不一定如此——即使是在大规模环境下! 近日,谷歌DeepMind科学家Jacob Austint在X上, 发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。
「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元
放眼全球,最大的投资风口非AI莫属了。 昨日,美国明星初创Together AI宣布,已完成3.05亿美元B轮融资,总估值达到33亿美元。 Together AI表示,这项投资将加速他们在构建基于开源模型的现代AI应用,以及利用他们即将大规模部署的英伟达Blackwell GPU训练定制模型方面的领先地位,也能巩固他们作为首选AI云供应商的地位。
大模型扩展新维度:Scaling Down、Scaling Out
本文由悉尼大学计算机学院王云柯,李言蹊和徐畅副教授完成。 王云柯是悉尼大学博士后,李言蹊是悉尼大学三年级博士生,徐畅副教授是澳洲ARC Future Fellow,其团队长期从事机器学习算法、生成模型等方向的研究。 近年来, Scaling Up 指导下的 AI 基础模型取得了多项突破。
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。 在强化学习领域中,世界模型通常被建模为一个神经网络,通过历史状态和动作,预测未来可能出现的状态。 其中,Dreamer 算法在多种模拟环境的成功表现让我们看到了世界模型优秀的表征和泛化能力。
阿里重回伟大!吴泳铭财报讲话全文曝光:开发者会天然选择阿里云,发布旗舰推理模型!未来三年,阿里对基础设施投资将超过去十年总和!
出品 | 51CTO技术栈(微信号:blog51cto)编辑 | 伊风昨晚,阿里2025财年Q3财报新鲜出炉,同比增长8%,可以说成绩相当亮眼! 淘天增收继续加快,阿里云增速重回加速状态,多项核心业务增速达到年内最佳。 财报显示:阿里第三季度营收增速创逾一年以来最快,资本开支大增,核心业务加速增长,淘天收入增长加快,阿里云收入重回双位数增长(13%),增幅创约两年以来最大,AI相关产品收入连续六季度保持三位数增长。
出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了
DeepSeek-R1 非常热门,而在其公布的训练配方中,GRPO(Group Relative Policy Optimization)非常关键,是 DeepSeek-R1 核心的强化学习算法。 PPO 与 GRPO 的对比,来自论文《DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models》相较于 PPO,GRPO 去掉了价值模型,而是通过分组分数来估计基线,从而可极大减少训练资源。 DeepSeek-R1 技术报告中写到:「具体来说,我们使用 DeepSeek-V3-Base 作为基础模型,并采用 GRPO 作为强化学习框架来提高模型的推理性能。
前OpenAI CTO 成立思维机器实验室
前OpenAI首席技术官Mira Murati宣布成立新的思维机器实验室(Thinking Machines Lab)。 主要有三个方向:帮助人们调整AI系统以满足他们的具体需求;开发坚实的基础以构建更强大的AI系统;培养开放科学的文化,帮助整个领域理解和改进这些系统。 以下是Thinking Machines Lab的官网介绍:思维机器实验室(Thinking Machines Lab)是一家人工智能研究与产品公司。
两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。 最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。 北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前 o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式)的续作。
谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用
去年 12 月,谷歌推出了 PaliGemma 2 ,这是Gemma系列中的升级版视觉语言模型。 该版本包含不同大小(3B、10B 和 28B 参数)的预训练检查点,可轻松针对各种视觉语言任务和领域进行微调,例如图像分割、短视频字幕、科学问答和文本相关任务,并实现高性能。 2月19日,谷歌宣布推出 PaliGemma 2 mix 检查点。
再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
一直以来,研究者普遍认为,去噪扩散模型要想成功运行,噪声条件是必不可少的。 而大神何恺明的一项最新研究,对这个观点提出了「质疑」。 「受图像盲去噪研究的启发,我们研究了各种基于去噪的生成模型在没有噪声调节的情况下的表现。
谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了
CEO皮猜亲自站台,谷歌的最新研究狠狠火了——为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。 划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。 据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。
微软Muse秒生游戏登Nature,10亿级画面练出最强AI!千亿游戏市场重洗牌
同一天,微软放出两个核弹,首个拓扑量子芯片,还有首个世界与人类行动模型。 AI离数秒生成游戏视频的未来,又近了一步。 今天,微软团队首次引入了「世界与人类行动模型」(WHAM),并冠以希腊艺术女神「缪斯」(Muse)之名。
2025年度国际挑战赛正式启动,期待你的加入!
•新挑战○全新具身智能及自动驾驶赛道,全方位覆盖相关领域最新、最热话题,共同探讨具身智能核心问题。 •高奖金○总奖池高达 10 万美元,单赛道最高奖金(创新奖 冠军)可达 1.5 万美元。 2025年度国际挑战赛旨在通过全球合作促进具身智能与自动驾驶领域的发展。
DeepSeek R1范式复现笔记
作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题
世界首个20万块GPU(另有说法是10万)训出的Grok-3,官宣人人可用了! DeepSearch、Think两大模式,同时上线。 唯独遗憾的是,Big Brain还在雪藏。
Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?
DeepSeek的风,也是飘到了科研领域——最新消息,同济大学通过百度智能云千帆大模型平台接入并调用DeepSeek-R1/V3系列模型;包括浙大、北大清华等知名高校也是纷纷出动,要么接入模型推出智能体,又或者出品干货课程、使用手册《从入门到精通》等等,几度都登上热搜。 Nature更是几度发文,因为DeepSeek开源低成本易部署等优势,科学家们纷纷涌向DeepSeek,这种模型已经是科研AI工具中的全能者。 感知到的是,大模型在科研探索中发挥的价值远比以往任何时候都深入。
物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力
在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。 即便眼见着自回归 LLM 的能力越来越强大,能解决的任务也越来越多,他也依然坚持自己的看法:自回归 LLM 没有光明的未来。 在近期的一次演讲中,他将自己的观点总结成了「四个放弃」:放弃生成式模型、放弃概率模型、放弃对比方法、放弃强化学习。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
特斯拉
AI模型
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉