AI在线 AI在线

资讯列表

惊天丑闻!OpenAI档案曝光,奥特曼捏造YC董事长身份,虚伪真面目被揭穿

今天,OpenAI发生了不少大事。 比如就在深夜,他们放出了官方博客第一集,奥特曼亲自出镜,透露了GPT-5发布时间——今年夏天。 果然,五花八门的大模型命名,不仅让用户们极为困扰,连OpenAI团队自己都十分纠结。
6/20/2025 9:12:00 AM

AI写爆款博客火出圈,主笔竟是Claude!

最近,Anthropic给自家AI开了个博客。 这个叫「Claude Explain」的博客页面,内容主要由AI模型Claude生成。 博客包括《用Claude简化复杂代码库》这种硬核主题,旨在秀一把AI的写作能力。
6/20/2025 9:06:00 AM

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。 如今,这股 RL 的浪潮也涌向了图像生成领域。 当我们将自回归图像生成也视为一种序列化的 CoT 推理过程时,一个核心问题浮出水面:DPO 和 GRPO 在这个新战场上表现如何?
6/20/2025 9:06:00 AM

Agent全自动搭建代码运行环境,实时更新解决评测过拟合/数据污染问题|微软

长期以来主流的代码修复评测基准SWE-bench面临数据过时、覆盖面窄、手动维护成本高等问题,严重制约了AI模型真实能力的展现。 微软发布全新代码修复评测基准SWE-bench-Live,不仅引入了来自GitHub最新的Issue,显著提升了对模型评估的实时性与准确性,还实现代码运行环境的全自动化构建与自动更新,打破了传统静态评测基准的局限。 △图1: SWE-bench-Live leaderboard.全自动化环境搭建传统的代码修复评测基准需要人工构建代码运行环境,不仅成本高昂,且更新缓慢,难以跟上软件开发环境的快速变化。
6/20/2025 9:03:00 AM

推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本

人人都绕不开的推荐系统,如今正被注入新的 AI 动能。 随着 AI 领域掀起一场由大型语言模型(LLM)引领的生成式革命,它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力,开始重塑各领域的传统技术栈。 作为互联网流量的核心引擎,推荐系统面临着级联架构导致的算力碎片化、优化目标割裂等问题,并逐渐制约其创新发展。
6/20/2025 9:03:00 AM

灰测!​ChatGPT 深度整合谷歌 Gmail 与日历功能

OpenAI 的 ChatGPT 在灰度测试阶段推出了一项令人期待的新功能,深度整合了谷歌的 Gmail 和日历功能。 这一更新使得 ChatGPT 不仅能够与用户的电子邮件进行互动,还能根据邮件内容自动生成回复,甚至整理成大纲和待办事项清单,为用户的日常工作提供了极大的便利。 根据消息来源 Tibor 的透露,ChatGPT 目前已经接入了 Gmail,但在当前的测试阶段,用户需要通过深度研究模式才能使用这一功能。
6/20/2025 9:01:10 AM
AI在线

ChatGPT 新功能上线!让你的 Gmail 和日历变得更智能

近日,有消息透露,ChatGPT 正在进行一项灰度测试,深度整合谷歌的 Gmail 和日历功能。 这意味着,用户不仅可以通过自然语言与 ChatGPT 进行互动,还能让它为你分析邮件内容,自动生成回复,甚至整理出待办事项和日程安排。 据知情人士 Tibor 透露,ChatGPT 已经在部分用户中接入了 Gmail 功能,但目前该功能仅在深度研究阶段可用。
6/20/2025 9:01:10 AM
AI在线

视频成本更低!MiniMax Hailuo 02用户基准测试中超越Google Veo 3

近日,MiniMax 推出了其视频人工智能模型 Hailuo02的第二代版本,带来了性能和价格上的重大升级。 这款新模型采用了一种名为噪声感知计算重分配(NCR)的架构,MiniMax 声称这一技术在训练和推理效率方面提高了2.5倍。 NCR 架构在处理长视频序列时,根据训练阶段的不同采用了不同的方法。
6/20/2025 9:01:10 AM
AI在线

​谷歌Gemini客户端推出AI视频分析功能,用户可轻松上传视频进行分析

近日,谷歌宣布为其 Gemini AI 客户端新增了一项备受期待的视频上传分析功能。 该功能适用于 iOS 和安卓平台,用户只需将应用更新至最新版本即可使用。 对于 iOS 用户,需将应用更新至1.2025.2362302版本,而安卓用户则需更新 Google 应用至16.24正式版。
6/20/2025 9:01:10 AM
AI在线

海螺AI会员费高达万元引争议 官方称性价比依然处于行业底价

近日,旗下的海螺 AI 因其高达10788元的年费会员定价引发热议。 作为最高档的至臻版会员,这一价格相当于每月需支付近900元,这让不少用户感到不满并在社交媒体上表达抗议。 许多人认为,这一费用远超其所提供服务的实际价值。
6/20/2025 9:01:10 AM
AI在线

美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练

只需要动动嘴就可以驱动GUI代理? 由美团和浙江大学联合推出的GUIRoboTron-Speech——让用户解放双手,直接对计算机“发号施令”。 这是首个能够直接利用语音指令和设备屏幕截图进行端到端(End-to-End)决策的自主GUI智能体,旨在为用户提供更直接、高效且无障碍的交互体验。
6/20/2025 9:00:00 AM

单应计算加速数十倍、计算量减少95%!基于几何的SKS和ACA矩阵分解被提出

本文由东华大学蔡棽副教授、上海交通大学严骏驰教授和中国科学院自动化所申抒含研究员共同指导并撰写,四名学生作者为东华大学视觉与几何感知实验室的吴展豪、郭凌希、王佳纯、张斯禹。 一、论文简介东华大学、上海交通大学、中科院自动化所的研究团队最新提出:两种基于几何的单应矩阵分解,极大地减少了四点求解单应的计算量(相比目前通用的求解稀疏线性方程组方法减少 95% 以上),可在二维码扫描等典型视觉应用中显著减少计算消耗,并有望应用于其他射影几何、计算机视觉和图形学问题中。 论文已被 IEEE T-PAMI 期刊接收。
6/20/2025 8:55:00 AM

AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT

这不是段子,而是正在发生的现象。 大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。 推理过程经不起推敲,逻辑完全崩溃。
6/20/2025 8:54:00 AM

田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索

AI也有量子叠加态了? 连续思维链的并行搜索类似于量子叠加,比离散型思维链更具优势。 这是AI大牛田渊栋团队的最新研究成果。
6/20/2025 8:47:00 AM

ChatGPT 灰度测试深度整合谷歌 Gmail / 日历功能,允许分析用户邮件内容生成日程

OpenAI的ChatGPT将深度整合谷歌Gmail/日历功能,可分析邮件内容、自动生成回复并创建日程。这一更新或与ChatGPT搜索功能相关,标志着其向信息中枢和日常工作助手转型。#ChatGPT# #AI助手#
6/20/2025 8:10:15 AM
漾仔

零基础AI编程实战复盘!如何仅用7天做出2个网站?

5 月底临时需要在团队内做一场设计师 x AI Coding 的主题分享,因时间紧急(完全利用工作外时间),我决定放弃传统 PPT 的形式,从零开始利用 AI 工具链构建分享网站。 本文是这次 AI 协同实验的复盘,同时分享我对当前 Agent Coding 工具能力边界、Agent 交互、协作模式变化的新思考。 往期AI编程干货:.
6/20/2025 8:09:34 AM
Bay的设计奥德赛

员工正在明知道不该用的地方使用AI

尽管人们对AI在工作场所生产力方面的积极影响抱有广泛期待,但据GoTo称,大多数员工认为他们被过度承诺了AI的潜力。 事实上,62%的员工认为AI已被过度炒作。 然而,这很可能是因为员工没有充分利用这些工具所能提供的功能,86%的员工承认他们没有充分发挥AI工具的潜力,82%的员工表示他们对如何在日常工作中实际应用AI并不十分熟悉。
6/20/2025 7:13:00 AM

谷歌 Gemini 客户端新增 AI 视频上传分析功能,支持 iOS / 安卓平台

谷歌现已为其 Gemini AI 客户端新增视频上传分析功能,用户将自己的应用更新至最新版本(iOS 用户需更新至 1.2025.2362302 版本,安卓用户需更新 Google 应用至 16.24 正式版)即可看到相应视频上传选项,无需订阅 Gemini 会员即可使用。
6/20/2025 6:46:03 AM
漾仔