AI

ASTRO：赋予语言模型搜索式推理能力的创新框架

大家好，我是肆〇柒。当下大型语言模型（LLM）已深度融入诸多领域，从智能写作到语言翻译，从智能客服到数据分析，其影响力无处不在。然而，在处理复杂问题时，推理能力的强弱直接决定了模型的实用性。

7/10/2025 9:14:11 AM 肆零柒

比尔・盖茨：即使 100 年后，AI 也无法完全取代人类进行编程工作

AI在线 7 月 9 日消息，在人工智能（AI）迅速重塑各行各业的今天，哪些工作能真正抵御自动化的浪潮？微软联合创始人、科技界重量级人物比尔・盖茨近日分享了一个大胆的观点：即使在 100 年后，编程仍将是一项“100% 由人类主导”的职业。在接受法国广播电台 France Inter 采访时，比尔・盖茨坦言：“我也会感到害怕。

7/9/2025 8:16:45 PM 远洋

两部门联合印发行动方案，聚焦人工智能等领域计量问题

AI在线 7 月 9 日消息，市场监管总局、工业和信息化部印发《计量支撑产业新质生产力发展行动方案（2025—2030 年）》。其中提到，面向集群智能感知、人工智能传感、人工智能大模型、智能制造等新型技术，开展人工智能算法计量测试关键技术研究及体系建立、自主无人系统关键性能与系统计量等研究，建设跨领域的人工智能计量测试平台，提升人工智能算法性能评估、模型与平台安全性测试评估、新型智能装备测试评价等方面的计量能力水平，推动建立人工智能风险等级测试评估体系，完善人工智能产业计量测试基础保障体系。《方案》聚焦新一代信息技术、人工智能、航空航天、新能源、新材料、高端装备、生物医药、量子科技、集成电路、仪器仪表等 10 个重点产业领域，系统梳理了各产业领域急需解决的关键共性计量技术、主要攻关方向和建设目标，着力解决从前沿技术研发到产业应用的全链条计量问题，为产业高质量发展筑牢计量根基。

7/9/2025 3:11:53 PM 远洋

苹果酝酿升级 Apple 支持应用：引入 AI 助手，提升客户服务体验

AI在线 7 月 9 日消息，科技媒体 MacRumors 昨日（7 月 8 日）发布博文，报道称基于最新挖掘的代码，苹果公司正计划升级“Apple 支持”应用，开发基于 AI 的“支持助手”（Support Assistant）。根据代码字符串中描述，通过“支持助手”，用户能够通过聊天的方式互动。 AI在线注：“Apple 支持”应用目前已内置基于 Messages 的聊天功能，不过主要用于联系苹果的支持团队。

7/9/2025 6:30:20 AM 故渊

日本 2024 财年生成式 AI 使用率仅 26.7%，远落后于中美

AI在线 7 月 8 日消息，据日本总务省周二发布的 2025 年白皮书显示，日本在生成式人工智能（AI）的使用率上明显落后于全球领先国家。白皮书指出，2024 财年仅有 26.7% 的日本民众表示使用过此类工具，尽管这一数字较 2023 财年增长了约三倍，但仍远低于美国和中国等 AI 领先国家。其中，美国的使用率高达 68.8%，而中国的使用率更是达到了 81.2%。

7/8/2025 10:49:51 PM 远洋

大模型刷数学题竟有害？CMU评估20+模型指出训练陷阱

henry 发自凹非寺. 量子位 | 公众号 QbitAI学好数理化，走遍天下都不怕！这一点这在大语言模型身上也不例外。

7/8/2025 5:08:45 PM henry

AI 编程工具 Cursor 定价调整引用户不满，CEO 公开致歉并承诺退款

AI在线 7 月 8 日消息，近日，由 Anysphere 公司开发的热门人工智能辅助编程环境 Cursor 因定价调整引发用户不满，公司首席执行官 Michael Truell 在博客中公开致歉，并承诺将对受影响用户进行退款。 6 月 16 日，Cursor 对其每月 20 美元的 Pro 计划进行了调整。此前，Pro 用户每月可获得 OpenAI、Anthropic 和 Google 的高级 AI 模型的 500 次快速回复，之后则以较慢的速度获得无限回复。

7/8/2025 3:15:48 PM 远洋

AI药物发现再进化：分子之心、斯坦福开发SurfFlow系统，破解治疗性肽设计表面互补难题

编辑 | 萝卜皮近年来深度生成模型的进步，使得科学家可以相对精准地设计靶向难成药位点的治疗性肽，但是却低估了蛋白质相互作用（PPI）中分子表面的关键影响——就像找到了锁芯却忽略了开门的正确角度，这极大阻碍了治疗性肽的设计与发现。为了弥补这一差距，分子之心许锦波团队与斯坦福大学团队合作提出了一种全设计肽生成范例，称为 SurfFlow，这是一种基于表面的新型生成算法，可以对肽的序列、结构和表面进行全面的共同设计。 SurfFlow 采用多模态条件流匹配 (CFM) 架构来学习表面几何形状和生化特性的分布，从而提高肽结合的准确性。

7/8/2025 2:44:00 PM ScienceAI

新型“透视眼”技术问世：AI 结合 Wi-Fi 信号无需开包即可检查物品

AI在线 7 月 8 日消息，科技媒体 techradar 今天（7 月 8 日）发布博文，报道称麻省理工学院研究人员开发 mmNorm 新技术，利用毫米波信号（millimeter-wave，与 Wi-Fi 相同频率范围）重构隐藏的 3D 物体，其准确度超过了现有雷达技术 18%。这项技术能够在视线受阻的环境中，如箱子内部、墙壁后或物体下方，帮助人工智能（AI）更好地识别物体。传统雷达技术主要依赖背投影（back projection）方法扫描，所产生的图像分辨率低，且在扫描小型或被遮挡的物体上效果不佳。

7/8/2025 9:51:36 AM 故渊

AI 赋能传统显微镜，美研团队研发低成本土壤真菌检测系统

AI在线 7 月 7 日消息，美国得克萨斯大学圣安东尼奥分校（UTSA）的研究人员正在开发一种基于人工智能的显微镜系统，有望使土壤健康检测变得更加快速、廉价且易于获取。这一创新技术将为全球农民和土地管理者提供更高效的土壤检测工具。据AI在线了解，该研究团队成功将低成本的光学显微镜与机器学习相结合，用于测量土壤样本中真菌的存在和数量。

7/7/2025 5:45:47 PM 远洋

部分学者被曝在论文中植入隐藏提示词，试图诱导 AI 给出正面评价

感谢AI在线网友咩咩洋的线索投递！ AI在线 7 月 7 日消息，据《日经亚洲》报道，部分学者可能正在采用一种新策略来影响其研究论文的同行评审结果 —— 在论文中添加隐藏的提示词（prompt），以诱导人工智能工具给出正面评价。《日经亚洲》在对学术预印本网站 arXiv 上的英文论文进行调查时发现，共有 17 篇论文中包含了某种形式的隐藏人工智能提示词。

7/7/2025 4:40:12 PM 远洋

AI重塑合辑｜从技术热潮到产业范式转移，WAIC共探企业新质生产力

WAIC 2025. 世界人工智能大会. 论坛：2025年7月26日-28日上海世博中心.

7/7/2025 4:07:04 PM 量子位的朋友们

曾经靠 AI 省钱的企业，如今砸重金雇人纠错

AI在线 7 月 6 日消息，随着人工智能技术的广泛应用，许多企业曾急于用 AI 取代人力劳动，以降低成本并提高效率。然而，近期却出现了令人意想不到的局面：这些企业如今不得不花费大量资金聘请人工来修复 AI 所犯的错误。据英国广播公司（BBC）报道，目前，一个专门修复 AI 错误的新兴行业正在悄然兴起，那些擅长此道的作家和程序员们正借此机会赚得盆满钵满。

7/6/2025 7:36:14 PM 远洋

Meta 高薪挖角 AI 人才之际，OpenAI 以低成本从底层构建人才梯队

AI在线 7 月 6 日消息，在硅谷激烈的人工智能（AI）竞争中，各公司纷纷以令人咋舌的薪酬待遇来吸引顶尖人才。然而，OpenAI 却另辟蹊径，通过其独特的“研究员驻留计划”（residency program）来吸引和留住优秀人才。据 Fortune 报道，该计划为期六个月，是一份全职带薪项目，主要面向来自物理学、神经科学等与 AI 相邻领域的研究人员，而非那些已经在 AI 研究领域深耕多年的专业人士。

7/6/2025 5:52:00 PM 远洋

Character.AI 突破性技术：实时 AI 角色视频互动

AI 聊天机器人平台 Character.AI 发布研究论文和视频演示，展示了名为 TalkingMachines 的自回归扩散模型，让 AI 角色互动更加逼真。

7/5/2025 12:58:57 PM 故渊

苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型：基于 Qwen2.5-7B，可不按顺序生成代码

苹果公司悄然在 Hugging Face 上发布了一款名为 DiffuCode-7B-cpGRPO 的开源 AI 模型，该模型在生成代码方面具有创新特性，能够不按顺序生成代码，且性能媲美顶级开源编码模型。

7/5/2025 8:55:58 AM 故渊

首个GUI多模态大模型智能体可信评测框架+基准：MLA-Trust

MLA-Trust 是首个针对图形用户界面（GUI）环境下多模态大模型智能体（MLAs）的可信度评测框架。该研究构建了涵盖真实性、可控性、安全性与隐私性四个核心维度的评估体系，精心设计了 34 项高风险交互任务，横跨网页端与移动端双重测试平台，对 13 个当前最先进的商用及开源多模态大语言模型智能体进行深度评估，系统性揭示了 MLAs 从静态推理向动态交互转换过程中所产生的可信度风险。此外，MLA-Trust 提供了高度模块化且可扩展的评估工具箱，旨在为多样化交互环境中 MLAs 的持续性可信度评估提供技术支撑。

7/4/2025 4:50:07 PM

10分钟搞定Excel世锦赛难题！首个超越人类Excel Agent，网友：想给它磕一个

前段时间，我们报道了 5 款大模型参加了今年山东高考的事儿，为了弄清楚各大模型在 9 个科目中的具体表现，我们对着测评明细表挨个儿分析，搞得狼狈又崩溃。要是哪个 AI 能一键分析表格，我当场就能给它磕一个。现在，终于有 AI 来整顿 Excel 表格了！

7/4/2025 4:47:35 PM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉