模型
仅需0.7秒单图像实时3D重建,开源扩散模型
单图像3D重建,即从单一视角的二维图像中恢复出三维物体的形状和结构,是计算机视觉领域的一项基础且极具挑战的难题。 学术界和工业界主要探索了两种不同的技术路线:基于回归的建模方法和生成式建模方法。 基于回归的方法能够高效地推断出可见表面,但在处理遮挡区域时却力不从心,常常导致表面和纹理估计不准确。
7/21/2025 9:26:00 AM
代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀
OpenAI果然藏了一手。 昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。 网友们疯狂测试后,得出一致结论,这个模型强得离谱。
7/21/2025 9:19:00 AM
谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?
AlphaFold因获得诺奖而声名大噪。 在大多数情况下,AlphaFold 2的预测精度几乎可与X射线晶体学相媲美,令人震撼。 生物化学界持续了半个世纪的难题,终于被攻克。
7/21/2025 9:16:00 AM
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
英伟达GPU,被白帽黑客发现了严重漏洞。 通过一种名为GPUHammer的攻击方式,可以让GPU上跑的大模型,准确率从80%直接掉到0.02%,可以说是渣都不剩。 多伦多大学的研究人员形容,这种攻击就像在模型中引发灾难性的脑损伤。
7/21/2025 9:05:00 AM
一盘大棋!OpenAI「截胡」IMO金牌,奥特曼为GPT-5献上「核弹级」预热
谁曾想,OpenAI又抢尽了谷歌的风头! 爆料称,谷歌DeepMind的AI模型早在本周五,也就是两天前,便拿下了IMO金牌。 但由于内部审核慢,需等下周一市场部批准后,DeepMind才能官宣具体情况。
7/21/2025 9:04:00 AM
陶哲轩回应OpenAI新模型IMO夺金!GPT-5测试版也曝光了
OpenAI最新模型曝光了,在2025年国际数学奥林匹克竞赛(IMO)上达到了金牌水平! IMO被公认为全球最顶尖的数学竞赛,每年只有不到8%的参赛者能够获得金牌。 而现在,一个AI模型做到了。
7/21/2025 9:00:00 AM
AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab
给AI一场压力测试,结果性能暴跌近30%。 来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。 该框架在一个prompt里同时抛给模型多个问题,模拟真实世界中复杂的、多任务并行的推理场景。
7/21/2025 8:47:00 AM
大神Karpathy都投的AI实时视频生成模型:直播都能立即转,无限时长几乎零延迟
大神Karpathy都忍不住投资的AI初创,带来首个实时扩散视频生成! 用扫帚当麦克风,用盒子当混音台,无需昂贵设备就能开一场沉浸式直播。 喜欢游戏类型但不喜欢游戏的画面?
7/21/2025 8:46:00 AM
无需NeRF/高斯点后处理,视频秒变游戏模型成现实!新方法平均每帧仅需60秒 | ICCV 2025
只需一段视频,就可以直接生成可用的4D网格动画? 来自KAUST的研究团队提出全新方法V2M4,能够实现从单目视频直接生成高质量、显式的4D网格动画资源。 这意味着无需NeRF/高斯点后处理,可直接导入游戏/图形引擎。
7/21/2025 8:45:00 AM
2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到
如果你以为,如今的LLM已经无所不能,那刚刚出炉的2025大模型数学竞赛结果,恐怕要让你大跌眼镜了。 现在,各模型的分数已经在MathArena上发布。 怎么说呢,所有大模型都翻车了。
7/18/2025 1:41:39 PM
OpenAI深夜发布ChatGPT Agent:能主动思考、自选工具,智能体赛道大变天
今天凌晨1点,OpenAI进行了技术直播发布了重磅产品ChatGPT Agent。 ChatGPT Agent具备自主思考和行动的能力,能够主动从其技能库中选择合适的工具,包括Operator、 Deep Research和ChatGPT来完成各种超复杂任务。 例如,用户可以要求 ChatGPT Agent分析三个竞争对手并制作幻灯片演示文稿等请求。
7/18/2025 10:46:11 AM
全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek
全球最强的开源「定理证明器」诞生了! 来自普林斯顿、清华、英伟达、斯坦福等八大顶尖机构联手,祭出了第二版Goedel-Prover-V2模型。 项目地址: 2025顶会录用,曾在miniF2F Pass@32刷新SOTA,位列PutnamBench榜首。
7/18/2025 10:12:00 AM
思维链之父跳槽Meta,不只因为1亿美元!离开OpenAI前泄天机
硅谷人才争夺战,火热升级! 过去,是OpenAI从谷歌等公司吸引人才;现在,Meta直接砸钱抢人。 顶尖AI人才的薪酬包可谓天价,1亿美元还是扎克伯格给的起步价!
7/18/2025 10:04:44 AM
Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍
最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。 他们接连发布了好些个开源模型,覆盖不同的领域,包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。 这样似乎也很难让这位欧洲 AI「新贵」感到满意,他们还想在应用层面好好地卷一卷 OpenAI。
7/18/2025 9:39:57 AM
o1核心贡献者离职后首发声:AI是史上最强杠杆,超越人力、资本和代码
又一位离职OpenAI的核心研究员发声! 刚刚被曝加入Meta的Hyung Won Chung,分享了他对AI未来的深刻思考:人工智能正在成为有史以来最强大的杠杆机制。 Hyung Won Chung和一同离开OpenAI的Jason Wei是长期搭档,他们的合作可以追溯到谷歌大脑时期,两人曾共同作为第一作者发表了关于模型微调的重要论文《Scaling Instruction-Finetuned Language Models》。
7/18/2025 9:33:26 AM
Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验
最近,我看了很多遍 Cursor 首席设计师 Ryo Lu 的访谈。 Ryo 曾是 Notion 的首席设计师,今年跳槽到了 Cursor。 Ryo 不是那种传统意义上只关注界面设计的设计师,尤其是加入 Cursor 之后,他已经开始通过 Vibe Coding 写代码,参与产品原型的开发。
7/18/2025 9:20:31 AM
500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式
你可能听说过OpenAI的Sora,用数百万视频、千万美元训练出的AI视频模型。 但你能想象,有团队只用3860段视频、不到500美元成本,也能在关键任务上做到SOTA? 比如这个图生视频:攀岩者在小行星攀岩,人体运动与太空光影完美仿真。
7/17/2025 2:23:03 PM
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频
近年来随着视频生成基础模型的涌现,音频驱动的说话人视频生成领域也取得了显著进展。 但现有方法主要聚焦于单角色场景,现有可生成两个角色对话视频的方法仅能单独地生成两个分离的说话人视频。 针对这一挑战,研究人员提出了首个专注同场景多角色说话视频生成的框架Bind-Your-Avatar该模型基于扩散Transformer(MM-DiT),通过细粒度的嵌入路由机制将「谁在说」与「说什么」绑定在一起,从而实现对音频–角色对应关系的精确控制。
7/17/2025 1:14:05 PM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用