资讯列表
刚刚!UCLA杨林团队证明:仅凭提示词,Gemini 2.5 Pro就可以拿到IMO2025金牌
最近大家应该都被OpenAI和谷歌的内部模型获得IMO2025金牌的消息刷屏了,但是正式参赛的公开的模型03high,Gemini 2.5 pro等表现很差,连铜牌都没拿到,不过现在又有了一个新情况刚刚发布在arXiv上的研究论文《Gemini 2.5 Pro Capable of Winning Gold at IMO 2025*》证明Gemini 2.5 Pro本体通过适当提示就可以获得IMO 2025金牌论文地址:(UCLA 电子与计算机工程系副教授)和黄溢辰撰写,详细阐述了他们如何利用谷歌最新的Gemini 2.5 Pro模型,成功解决了6道2025年国际数学奥林匹克(IMO)竞赛题目中的5道,达到了IMO金牌得主水平核心方法该研究的真正创新之处,在于设计了一套由两个核心角色解题者和验证者构成的自我验证流水线。 这两个角色均由Gemini 2.5 Pro扮演,但通过截然不同且高度特化的提示词(Prompt)来引导,使其各司其职,形成了高效的协作与迭代机制流水线流程如下图所示:初始解题 : 模型首先尝试对问题进行解答。
7/24/2025 10:36:51 AM
浙大校友打造AI代码测试神器,零代码零bug,30分钟创建网站
零代码、零bug,30分钟即可创建新网站。 更惊人的是,它能让AI写代码准确率从42%跃升至93%。 这是浙大校友专为AI编程设计打造的智能测试平台——TestSprite 2.0,据介绍是行业首个。
7/24/2025 10:25:46 AM
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
AI在线 7 月 24 日消息,科技媒体 bleepingcomputer 昨日(7 月 23 日)发布博文,报道称 OpenAI 为网页版 ChatGPT,测试名为“学习和掌握”(Study and Learn)功能,提供作业帮助,通过步骤式指导用户学习。 根据截图显示,网页版 ChatGPT 正测试“学习和掌握”功能,预估正式上线后将被命名为“一起学习”(Study Together)。 该功能并非新的 AI 模型,而是通过提示工程和格式化艺术,提供了分步骤的学习指导,用深入浅出地描述,帮助用户分解复杂问题。
7/24/2025 10:03:47 AM
故渊
Qwen3-Coder上线阿里云百炼 价格比Claude 4便宜3倍
7月23日,阿里云正式推出了最新的 AI 编程大模型 ——Qwen3-Coder API。 目前,Qwen3-Coder API已在阿里云百炼上线。 这一全新的编程助手不仅功能强大,而且在价格上也极具竞争力,令人瞩目。
7/24/2025 9:56:04 AM
AI在线
特朗普发布《美国 AI 计划》,力争 AI 领域全球霸主地位
美国白宫官网发布了特朗普总统的《美国 AI 行动计划》。 该计划旨在确保美国在人工智能(AI)领域的全球领导地位,涵盖了90多项具体措施,重点聚焦于加速 AI 创新、构建 AI 基础设施和主导国际外交与安全。 图源备注:图片由AI生成,图片授权服务商Midjourney在加速 AI 创新方面,计划提出要拆除现有的监管壁垒。
7/24/2025 9:52:54 AM
AI在线
周鸿祎:AI大模型时代,网络攻击门槛降低
在2025中国互联网大会上,360集团创始人周鸿祎针对大模型在实际应用中的潜在风险进行了深刻分析。 他指出,随着人工智能的迅猛发展,网络安全面临着全新的挑战,传统的 IT 系统漏洞和数据隐私泄露问题已经不再是唯一的威胁。 周鸿祎首先提到 “大模型的‘幻觉’问题”,这被认为是最大的安全风险之一。
7/24/2025 9:52:50 AM
AI在线
谷歌Gemini重磅更新:直接选用Imagen生成图像
近日,谷歌对其 AI 服务 Gemini 进行了重要升级,用户现在可以直接在 Gemini 界面中选择 Imagen 模型来生成高质量的图像。 这一更新不仅提升了用户体验,还为开发者提供了更多的灵活性和便捷性。 在此次更新中,谷歌还启用了 llms.txt 文件,旨在为 AI Agent 提供最新的 API 和 SDK 使用方法。
7/24/2025 9:52:46 AM
AI在线
OpenAI与Oracle携手扩展Stargate项目,已创造数千个工作岗位
近日,OpenAI 与 Oracle 达成新协议,将 Stargate 项目在美国的数据中心容量扩大4.5吉瓦,整体容量将超过5吉瓦。 这一重要进展标志着 OpenAI 在2029年前实现10吉瓦容量目标的道路上迈出了重要一步。 Stargate 项目旨在将美国建设成为全球人工智能发展的主导力量。
7/24/2025 9:52:45 AM
AI在线
谷歌 CEO 称 “人工智能正积极推动业务的每个部分”
在谷歌的最新财报中,CEO 桑达尔・皮查伊(Sundar Pichai)表示,人工智能(AI)正积极影响公司的每个业务领域。 他指出,像 AI 概述和 AI 模式等新功能表现良好,推动了公司的业绩增长。 根据Alphabet第二季度的财报,谷歌的收入达到了964亿美元,同比增长14%。
7/24/2025 9:52:39 AM
AI在线
预定最强视频生成 AI 模型,OpenAI Sora 2 现踪迹
AI在线 7 月 24 日消息,科技媒体 bleepingcomputer 昨日(7 月 23 日)发布博文,报道称 OpenAI 为增强与谷歌 Veo 3 的竞争,正酝酿推出 Sora 2 模型,有望成为最强视频生成 AI 模型。 消息源 @btibor91 于 7 月 21 日在 X 平台发布推文,在挖掘 OpenAI 服务器时,在代码中发现了 Sora 2 的相关引用,表明 OpenAI 已开发新的视频生成模型。 OpenAI 于 2024 年 12 月 9 日发布 Sora 模型,距离上次更新已经过去了六个月。
7/24/2025 9:50:40 AM
故渊
奥特曼首次透露GPT-5上手体验:在擅长领域感到无力,往后一靠感到眩晕
OpenAI掌门人奥特曼,可能是GPT-5发布前的最后一次深度访谈。 这一次,奥特曼透露了上手GPT-5后的“天啊时刻”:我往后靠在椅子上,感到一阵眩晕,在自己擅长的领域感到了无力。 图片最近一段时间,不论奥特曼、OpenAI官方账号还是OpenAI员工都在反复提醒大家:GPT-5很快就要发布。
7/24/2025 9:47:33 AM
阿里Qwen3-Coder 4800亿参数代码模型免费开源!是时候告别Cursor和Claude了?
480B参数,35B活跃,完全免费。 这不是科幻小说,而是阿里巴巴刚刚开源的Qwen3-Coder给程序员群体的真实礼物。 当GitHub Copilot每月收费20美元,Claude Code让钱包瑟瑟发抖时,阿里直接端出了一道"免费的满汉全席"。
7/24/2025 9:19:54 AM
阿丸笔记
首个统一「图像/视频」自适应语义分割框架来了!QuadMix刷榜多项基准
在语义分割领域,无监督领域自适应(Unsupervised Domain Adaptive Semantic Segmentation,UDA-SS)旨在将有标签的源域知识迁移到无标签的目标域。 随着数据规模和多样性的迅速提升,该任务日益重要。 目前主流研究集中于图像UDA-SS,视频UDA-SS近年来逐渐开始受到关注。
7/24/2025 9:17:00 AM
突发!特朗普刚刚发布《美国AI计划》,OpenAI、微软、亚马逊成大赢家
今天凌晨,美国白宫官网消息,特朗普公布了《美国AI行动计划》,以保证美国毫无争议地成为全球AI霸主。 该计划主要有三大支柱,加速AI创新、构建AI基础设施以及主导国际外交与安全,涵盖90多项具体行政命令。 其中,废除限制AI创新监管条例,加速发电场、水资源、半导体芯片等基础设施建设,这对于像OpenAI、微软、亚马逊、谷歌、Meta等AI巨头来说非常有利。
7/24/2025 9:15:06 AM
四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷
扩散语言模型(Diffusion-based LLMs,简称 dLLMs)以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性,成为一个重要的发展方向。 相较传统的自回归语言模型,dLLMs 既可以一次性生成多个位置的词,也能更自然地完成文本插入、改写、补全等任务,被广泛应用于交互式问答、代码生成、甚至多模态场景。 但在这股看似技术跃迁的浪潮背后,一场潜藏的安全危机正在酝酿:能否继续沿用自回归模型的对齐与防护机制,保障dLLM的输出安全?
7/24/2025 9:15:00 AM
四年2亿,苹果天才离职内幕首曝光!庞若鸣发离职信告别,苹果AI大溃败
天才出走,4年两亿美元! 苹果的AI宏图,彻底翻车了。 一家在七巨头中占有举足轻重地位的大厂,究竟是如何走到这一步的?
7/24/2025 9:12:00 AM
使用Django和LangGraph构建一个对话式AI应用程序
译者 | 布加迪审校 | 重楼每个人都见过聊天机器人的实际应用,有些令人印象深刻,有些令人厌烦。 然而,如果你可以创建一个真正智能、组织良好且易于与你自己的应用程序集成的聊天机器人,会怎样呢? 我们在本文中将使用两个强大的工具从零开始构建一个聊天机器人:除了LLM外,LangGraph 可以帮助管理井然有序的多步骤工作流程。
7/24/2025 9:08:31 AM
布加迪
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
ChatGPT Agent的技术内幕,被官方披露了。 就在OpenAI官方推出其最强智能体后,外界褒与贬的热议都没停过……但不论如何,都被视为智能体方向上标志性的一步,是OpenAI一个全新的开端。 关于更进一步的Agent Mode的工作原理,OpenAI开发团队在和投资方红杉资本的圆桌谈话中做了详细解析,还回答了几个值得关注的问题。
7/24/2025 9:05:00 AM