模型

刚刚！UCLA杨林团队证明：仅凭提示词，Gemini 2.5 Pro就可以拿到IMO2025金牌

刚刚！UCLA杨林团队证明：仅凭提示词，Gemini 2.5 Pro就可以拿到IMO2025金牌

最近大家应该都被OpenAI和谷歌的内部模型获得IMO2025金牌的消息刷屏了，但是正式参赛的公开的模型03high，Gemini 2.5 pro等表现很差，连铜牌都没拿到，不过现在又有了一个新情况刚刚发布在arXiv上的研究论文《Gemini 2.5 Pro Capable of Winning Gold at IMO 2025*》证明Gemini 2.5 Pro本体通过适当提示就可以获得IMO 2025金牌论文地址：（UCLA 电子与计算机工程系副教授）和黄溢辰撰写，详细阐述了他们如何利用谷歌最新的Gemini 2.5 Pro模型，成功解决了6道2025年国际数学奥林匹克（IMO）竞赛题目中的5道，达到了IMO金牌得主水平核心方法该研究的真正创新之处，在于设计了一套由两个核心角色解题者和验证者构成的自我验证流水线。这两个角色均由Gemini 2.5 Pro扮演，但通过截然不同且高度特化的提示词（Prompt）来引导，使其各司其职，形成了高效的协作与迭代机制流水线流程如下图所示：初始解题 : 模型首先尝试对问题进行解答。

7/24/2025 10:36:51 AM

浙大校友打造AI代码测试神器，零代码零bug，30分钟创建网站

浙大校友打造AI代码测试神器，零代码零bug，30分钟创建网站

零代码、零bug，30分钟即可创建新网站。更惊人的是，它能让AI写代码准确率从42%跃升至93%。这是浙大校友专为AI编程设计打造的智能测试平台——TestSprite 2.0，据介绍是行业首个。

7/24/2025 10:25:46 AM

首个统一「图像/视频」自适应语义分割框架来了！QuadMix刷榜多项基准

首个统一「图像/视频」自适应语义分割框架来了！QuadMix刷榜多项基准

在语义分割领域，无监督领域自适应（Unsupervised Domain Adaptive Semantic Segmentation，UDA-SS）旨在将有标签的源域知识迁移到无标签的目标域。随着数据规模和多样性的迅速提升，该任务日益重要。目前主流研究集中于图像UDA-SS，视频UDA-SS近年来逐渐开始受到关注。

7/24/2025 9:17:00 AM

突发！特朗普刚刚发布《美国AI计划》，OpenAI、微软、亚马逊成大赢家

突发！特朗普刚刚发布《美国AI计划》，OpenAI、微软、亚马逊成大赢家

今天凌晨，美国白宫官网消息，特朗普公布了《美国AI行动计划》，以保证美国毫无争议地成为全球AI霸主。该计划主要有三大支柱，加速AI创新、构建AI基础设施以及主导国际外交与安全，涵盖90多项具体行政命令。其中，废除限制AI创新监管条例，加速发电场、水资源、半导体芯片等基础设施建设，这对于像OpenAI、微软、亚马逊、谷歌、Meta等AI巨头来说非常有利。

7/24/2025 9:15:06 AM

四年2亿，苹果天才离职内幕首曝光！庞若鸣发离职信告别，苹果AI大溃败

四年2亿，苹果天才离职内幕首曝光！庞若鸣发离职信告别，苹果AI大溃败

天才出走，4年两亿美元！苹果的AI宏图，彻底翻车了。一家在七巨头中占有举足轻重地位的大厂，究竟是如何走到这一步的？

7/24/2025 9:12:00 AM

ICCV高分论文｜可灵ReCamMaster在海外爆火，带你从全新角度看好莱坞大片

ICCV高分论文｜可灵ReCamMaster在海外爆火，带你从全新角度看好莱坞大片

作为视频拍摄爱好者，你是否曾因为设备限制无法完成想要实现的运镜效果？例如想要将镜头上移拍摄风景的全貌，但没有入手拍摄无人机；又或是对拍摄素材很满意，但拍摄时手抖影响了成片质量。作为 AI 视频创作者，是否对于生成视频的内容很满意，然而运镜却不尽人意？

7/24/2025 8:30:00 AM

Meta开源创新大模型架构AU-Nets

Meta开源创新大模型架构AU-Nets

在大模型领域，如何将文本数据分解成合适的单元一直是重点研究对象。传统的分词方法，如Byte Pair Encoding等，会预先将文本分割成固定粒度的单元，然后构建一个静态的词汇表供模型使用。但这种方法存在诸多局限性，一旦分词完成，模型在后续处理中就只能局限于这些预设的单元，无法灵活地调整对数据的处理方式和预测范围；另一方面，对于一些低资源语言或者具有特殊字符结构的文本，这种固定分词方式往往难以有效处理，限制了模型的泛化能力和应用范围。

7/23/2025 9:10:00 AM

机器人高层指挥低层做，“坐标系转移接口”一次演示实现泛化学习 | ICML2025

机器人高层指挥低层做，“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样，仅凭少量演示，就能稳健适应复杂多变的真实场景？美国东北大学和波士顿动力RAI提出了HEP（Hierarchical Equivariant Policy via Frame Transfer）框架，首创“坐标系转移接口”，让机器人学习更高效、泛化更灵活。总的来说，HEP框架具有以下亮点：极简高效的分层结构高层负责全局目标设定，低层自主在本地坐标下优化动作，显著提升操作的灵活性与效率；空间对称性自然泛化模型自动适应目标平移、旋转等变化，极大降低泛化对数据量的依赖；创新型体素编码器三维视觉信息高效表达，兼顾细节还原与计算速度。

7/22/2025 12:42:53 PM

南洋理工、北大、上海AI实验室开源长记忆世界模型

南洋理工、北大、上海AI实验室开源长记忆世界模型

目前，世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。许多模拟环境在视角移动或时间推移后会出现内容变化，导致 3D 空间不一致，严重影响了用户体验和模拟效果的可靠性。为了解决这一难题，南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。

7/22/2025 10:45:55 AM

碾压DeepSeek V3！阿里开源新版Qwen-3，屠榜级断层第一

碾压DeepSeek V3！阿里开源新版Qwen-3，屠榜级断层第一

今天凌晨1点，阿里巴巴开源了Qwen3系列新版本Qwen3-235B-A22B-2507。比较意外的是，阿里已经停用了混合思考模型，新版Qwen3是一个非思维推理，又回到了指令微调模型，但性能非常强劲。根据阿里公布的数据显示，新版Qwen3在知识、推理、代码、对齐、智能体、多语言测试6大类几十种测试基准中，全部大幅度超过了DeepSeek开源的新版V3-0324模型。

7/22/2025 10:43:25 AM

超越Claude 3.5和o1！8B模型靠「分层投票+测试时训练」逆袭

超越Claude 3.5和o1！8B模型靠「分层投票+测试时训练」逆袭

测试时训练（test-time training）是一种通用的训练方法。该方法将单个未标记的测试实例转化为自监督学习问题，在对测试样本进行预测之前更新模型参数。而对于大模型训练，通常会使用一种称为情境学习的技术来提高其模型在新任务上的性能。

7/22/2025 10:22:02 AM

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

人群疏散模拟对于提高公共安全至关重要，也是构建逼真虚拟动态环境所需要的技术，其发展面临着复杂人类行为建模难的挑战。现有的疏散模拟方法常以2D点表示人群，关注人群位置和轨迹，但忽略了复杂人类行为，如碰撞、交互、摔倒等，以及三维环境、个体行为能力的影响，导致模拟结果不真实。而现有的三维运动生成方法和角色控制方法也无法同时保证实时性、合理性、个性化、动态感知、以及适用于任意场景和地形，如表1所示。

7/21/2025 11:51:58 AM

斯坦福开源复杂推理AI Agent，融合超十种工具

斯坦福开源复杂推理AI Agent，融合超十种工具

传统的AI助手通常依赖于单一模型或有限的工具集，难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。例如，解决视觉谜题，需要精细图像理解和基于文本的混合推理。为了解决这一难题，斯坦福开源了OctoTools，这是一个融合了11种不同工具专用于复杂推理的AI Agent。

7/21/2025 11:51:12 AM

仅需0.7秒单图像实时3D重建，开源扩散模型

仅需0.7秒单图像实时3D重建，开源扩散模型

单图像3D重建，即从单一视角的二维图像中恢复出三维物体的形状和结构，是计算机视觉领域的一项基础且极具挑战的难题。学术界和工业界主要探索了两种不同的技术路线：基于回归的建模方法和生成式建模方法。基于回归的方法能够高效地推断出可见表面，但在处理遮挡区域时却力不从心，常常导致表面和纹理估计不准确。

7/21/2025 9:26:00 AM

代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀

代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀

OpenAI果然藏了一手。昨天夜里，一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。网友们疯狂测试后，得出一致结论，这个模型强得离谱。

7/21/2025 9:19:00 AM

谷歌AlphaFold得了诺奖，但DeepMind根本没引用前人论文？

谷歌AlphaFold得了诺奖，但DeepMind根本没引用前人论文？

AlphaFold因获得诺奖而声名大噪。在大多数情况下，AlphaFold 2的预测精度几乎可与X射线晶体学相媲美，令人震撼。生物化学界持续了半个世纪的难题，终于被攻克。

7/21/2025 9:16:00 AM

英伟达GPU被曝严重漏洞，致模型准确率暴跌99.9%

英伟达GPU被曝严重漏洞，致模型准确率暴跌99.9%

英伟达GPU，被白帽黑客发现了严重漏洞。通过一种名为GPUHammer的攻击方式，可以让GPU上跑的大模型，准确率从80%直接掉到0.02%，可以说是渣都不剩。多伦多大学的研究人员形容，这种攻击就像在模型中引发灾难性的脑损伤。

7/21/2025 9:05:00 AM

一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热

一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热

谁曾想，OpenAI又抢尽了谷歌的风头！爆料称，谷歌DeepMind的AI模型早在本周五，也就是两天前，便拿下了IMO金牌。但由于内部审核慢，需等下周一市场部批准后，DeepMind才能官宣具体情况。

7/21/2025 9:04:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画 AI新词大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果腾讯算法 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算 AI设计生成式AI 大型语言模型搜索视频生成亚马逊特斯拉 AI模型 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉