模型
谷歌大脑之父首次坦白!茶水间闲聊引爆万亿帝国,AI自我突破触及门槛
刚刚,「现代互联网架构之父」Jeff Dean的最新对谈流出。 这位AI领域的传奇,是Google Brain的奠基者,也是推动神经网络走向规模化的关键人物。 从让神经网络「看懂猫」的重大突破,到TensorFlow与TPU的诞生,他的故事几乎是一部AI发展史。
8/25/2025 9:12:00 AM
刚刚,苹果AI华人总监跳槽Meta!核心团队再-1,库克被迫求助谷歌
就在刚刚,苹果AI工程总监Frank Chu被曝加入Meta。 他将在MSL Infra的新团队工作,负责AI基础设施相关事务。 这是自苹果模型团队的创建者庞若鸣,被Meta以一份价值2亿美元的薪酬包挖走之后,苹果AI项目面临的最重大的损失之一。
8/25/2025 8:56:00 AM
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
就在刚刚,马斯克一手开源动作,引发了大伙儿的高度关注——xAI现在正式开源Grok 2.5,Grok 3将在半年后开源。 其实早在本月初的时候,马斯克就公开表示过:是时候开源Grok了,将会在下周。 虽然开源的时间已经超过了他说的节点,但也正如网友所说:迟到总比没有的好。
8/25/2025 8:54:00 AM
比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!
如何让模型在思考时更聪明、更高效,还能对答案有把握? 最近,Meta AI与加州大学圣地亚哥分校的研究团队给出了一个令人振奋的答案——Deep Think with Confidence(DeepConf),让模型自信的深度思考。 论文地址::「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上拿下了高达99.9%的正确率。
8/25/2025 8:53:00 AM
诺贝尔物理学成果48年后终获数学证明!中科大少年班尹骏又出现了
诺奖得主都没找到的证明方法,现在被两位华人学者突破了。 凝聚态物理奠基人菲利普·安德森(Philip Warren Anderson)提出的Anderson模型,因解释了半导体材料中电子为何突然不再流动而闻名。 这一成果也助力他获得诺奖。
8/25/2025 8:51:00 AM
首个故事可视化综合评估框架来了!80个故事单元53种类别,20种技术方案全面对比
随着AIGC技术的进步,连环画与故事绘本生成(故事可视化)逐渐引发学界与业界的广泛关注,成为电影生成叙事性的基础。 故事可视化旨在用一段文字或照片生成一组连续的图片。 但生成的质量如何呢?
8/22/2025 3:12:23 PM
又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏
世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
8/22/2025 9:41:59 AM
一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025
一张图就能创建上半身动作视频,方法还入选了ICCV 2025! 来自清华大学、IDEA(粤港澳大湾区数字经济研究院)的研究人员提出新框架GUAVA,不需要多视角视频、不需要针对不同个体单人训练,仅需0.1秒就能从单图创建一个上半身3D化身。 通常来说,创建逼真且富有表现力的上半身人体化身(如包含细致面部表情和丰富手势),在电影、游戏和虚拟会议等领域具有重要价值。
8/21/2025 11:06:55 AM
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录
字节跳动突发开源大模型,一出手就是360亿参数的Seed-OSS-36B。 图片这个Seed-OSS的命名方式,明显是在呼应OpenAI此前发布的GPT-OSS系列。 与OpenAI的开源策略也是一样,并没有直接开源核心商业模型豆包(Doubao),而是基于内部技术打造了一个专门面向开源社区的版本。
8/21/2025 10:59:42 AM
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。 针对这一难题,MIT和新加坡国立大学联合提出了MEM1框架。
8/21/2025 9:10:00 AM
OpenAI史上最大失误:放走这位MIT学霸!美国AI「三朝元老」,现实韦小宝
AI算力竞赛,比阿波罗更庞大,比曼哈顿更疯狂! Anthropic联合创始人Tom Brown直言,AI基础设施的规模超越阿波罗与曼哈顿计划。 AGI算力投入正疯狂膨胀,每年增速高达3倍。
8/21/2025 9:07:00 AM
奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」!接入大脑读心,估值或飙破5000亿
GPT-5还没捂热,奥特曼又来捧GPT-6了。 这几天,奥特曼在旧金山的采访中表示,「人们想要记忆功能,希望未来ChatGPT能让用户自定义语气和个性」。 虽未公布下一代AI模型的具体时间,但从奥特曼口中,可以感受出GPT-6确实不一样。
8/21/2025 9:05:00 AM
Meta AI大洗牌!超级智能一拆四,小扎押注硅谷华人,LeCun或已出局
扎克伯格,这次是铁了心了,他要All in AI,不留一点后路。 8月20号,Meta又扔下一颗炸弹! 超级智能团队,再一次大重组,短短6个月这已经是第四次重组AI团队了。
8/20/2025 12:41:10 PM
dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
本文第一作者王文,浙江大学博士生,研究方向是多模态理解与生成等。 本文通讯作者沈春华,浙江大学求是讲席教授,主要研究课题包括具身智能、大模型推理增强、强化学习、通用感知模型等。 近年来,扩散大语言模型(Diffusion Large Language Models, dLLMs)正迅速崭露头角,成为文本生成领域的一股新势力。
8/20/2025 12:38:26 PM
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
几天前,OpenAI发布会上,奥特曼宣布GPT-5登顶了,号称代码能力全球第一。 但发布会上搞了一个大乌龙,52.8>69.1=30.8? 于是,OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界(左边)。
8/20/2025 12:24:23 PM
突发!DeepSeek刚刚开源V3.1-Base
今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM
DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。 模型地址:,该模型是 DeepSeek-V3 系列最新的基础模型。 至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。
8/20/2025 9:08:00 AM
美国专家来中国转了一圈:AI比赛已经结束了
现状来看,美国后继乏力,比赛可能已经结束了。 这就是一个美国专家,近期来中国转了一圈,然后回国后被万千美国网友议论的最新结论。 而且这个结论,不少美国人由衷认同,因为论据核心主要涉及——电力。
8/20/2025 9:04:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测