AI在线 AI在线

AI

YouTube 试水AI生成亮点视频,用户体验能否提升?

谷歌近日宣布将其 AI 概述功能扩展至 YouTube,推出算法生成的视频亮点和搜索建议。 这项实验性工具目前只向美国的少量 YouTube Premium 用户开放,旨在帮助用户快速找到与购物和旅游相关的视频内容,而无需观看整段视频。 在视频内容越来越丰富的今天,如何高效地发现所需信息变得尤为重要。
4/28/2025 3:00:50 PM
AI在线

Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品

多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。
4/28/2025 2:04:03 PM
量子位

MyPillow 创始人律师使用 AI 生成的法律文件引发丑闻

MyPillow 创始人迈克・林德尔(Mike Lindell)因其对特朗普选举谎言的坚定支持而面临多起法律纠纷。 其中,在丹佛的一个案件中,林德尔正被前美国选举供应商 Dominion Voting Systems 的员工埃里克・库默(Eric Coomer)控告诽谤。 库默指控林德尔因其对2020年总统选举的偏执言论而损害了他的名誉。
4/28/2025 2:00:40 PM
AI在线

轮到“OpenAI帮”上场了!15家由前员工创办的明星创业公司

编辑 | 云昭曾经硅谷有“PayPal帮”,现在轮到“OpenAI帮”登场了。 作为ChatGPT背后的公司,OpenAI无疑是当前AI领域最炙手可热的玩家。 过去两年,OpenIAI的发展可以用“独占鳌头”来形容,估值迅速飙升至3000亿美元,当然公司的迅速发展往往伴随着剧烈的人员动荡。
4/28/2025 11:57:12 AM
云昭

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。 帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接()以及相关配图。 网友难免会联想猜测:也许DeepSeek R2 即将上线发布。
4/28/2025 11:40:14 AM

ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live

自 GPT-4 发布至今已有两年,但对大语言模型的研究并没有放缓,我们仍处在一个技术进步涌现的时代。 Anthropic 于 2024 年11月发布 MCP,成为接通 AI 生态的桥梁,自主的 Agent 工作流距我们更进一步。 GPT-4o、GPT-4.1时隔仅一个月先后发布,实现上下文处理能力八倍提升。
4/28/2025 11:19:00 AM
郑佳美||梁丙鉴

一文了解人工智能代理的开源堆栈

我记得一个周末,我坐下来,确信自己终于可以构建一个像样的研究助理代理原型了。 没什么特别的——只是能读取 PDF 文件、提取关键信息,或许还能回答一些后续问题而已。 应该很简单,对吧?
4/28/2025 9:53:40 AM
晓晓

AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实

团队由 IEEE 会士,纽约大学教授 Claudio Silva 和纽约大学研究助理教授钱靖共同指导。  论文由Chenyi Li和Guande Wu共同第一作者。 在无数科幻电影中,增强现实(AR)通过在人们的眼前叠加动画、文字、图形等可视化信息,让人获得适时的、超越自身感知能力的信息。
4/28/2025 9:42:00 AM
机器之心

特朗普新行政命令,要求全美国学校教AI

美国白宫官网消息,特朗普发布了新的行政命令——《推动美国青少年的AI教育》特朗普要求全美国的K12(从幼儿园到高中)学校的老师、学生深度学习、使用AI,为下一世代的工作方式、创造力培养人才奠定竞争基础。 以下是美国白宫的原文内容。 根据美利坚合众国宪法和法律赋予我作为总统的权力,现命令如下:为什么颁发此命令AI(人工智能)正在迅速改变现代世界,推动各行业的创新,提高生产力,并重塑我们的生活和工作方式。
4/28/2025 9:20:53 AM

微软发布2025工作趋势:每位员工将是Agent老板

微软在官网发布了2025年工作趋势指数报告,主要分析了来自中国、美国、澳大利亚、巴西、加拿大等全球31个国家/地区的31,000家企业。 同时结合了Linked劳动力市场趋势,数万亿个Microsoft365生产力信号,以及原生初创企业、学者、经济学家、科学家和思想领袖的意见。 结果显示,由Agent智能体 人类的“人机协作”模式正在重塑企业架构,一种全新形态的“前沿公司”诞生。
4/28/2025 9:17:47 AM
AIGC开放社区

7x24小时非人类科学家入场:当AI开始自主探索科学未知领域 | 多伦多大学

自主通才科学家(AGS)正成为现实! 来自多伦多大学、IIT、清华大学、浙江大学、罗格斯大学、哈佛大学、佐治亚理工学院和伦敦大学学院的跨学科团队的最新研究指出,融合人工智能与机器人技术的“自主通才科学家(AGS)”不仅能独立完成从文献综述到实验验证的全流程,更可能以指数级速度推动科学发现,突破人类能力的物理与认知边界。 除此之外,其团队还构建了将AI大脑与机器人躯体深度融合的通用科研系统概念框架,展示了机器人与AI科学家在自然科学、形式科学、应用科学、人文科学,以及跨学科科学等全科学领域的原创性发现的潜力。
4/28/2025 9:16:00 AM
量子位

1亿图文对!格灵深瞳开源RealSyn数据集,CLIP多任务性能刷新SOTA

新的亿级大规模图文对数据集来了,CLIP达成新SOTA! 格灵深瞳最新发布的高质量数据集RealSyn,不仅规模大——包含1亿组图文对,而且每张图片都同时关联多个真实和合成文本。 所有的图像和句子都基于冗余进行了严格过滤,在确保数据质量的同时,引入基于簇的语义平衡采样策略,构建了可满足多样工作需求的三种规模大小的数据集:15M、30M、100M。
4/28/2025 9:14:00 AM
量子位

OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

GPT-4o生成的第一视角机器人打字图这次,来自Meta等机构的研究者,发现在多模态大语言模型(MLLMs)中,视觉词表存在维度冗余:视觉编码器输出的低维视觉特征,被直接映射到高维语言词表空间。 研究者提出了一种简单而新颖的Transformer图像token压缩方法:Token-Shuffle。 他们设计了两项关键操作:token混洗(token-shuffle):沿通道维度合并空间局部token,用来减少输入token数;token解混(token-unshuffle):在Transformer块后解构推断token,用来恢复输出空间结构。
4/28/2025 9:10:00 AM
新智元

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

OpenAI的o3发布以来,这个功能让不少网友觉得毛骨悚然——它能准确破解你的地理位置! 就在刚刚,Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客,详尽推敲了o3究竟是如何猜测照片拍摄地点的。 他将整个过程评价为:既超现实,又反乌托邦,仿佛几十年前的科幻小说突然变成现实!
4/28/2025 9:08:00 AM
新智元

一行代码不用写,AI看论文自己「生」出代码库!科研神器再+1

这几年,AI领域的科研人员遇到一个问题。 那就是机器学习的论文实在是多到看不过来,更别说还要用代码实现论文中逻辑。 HuggingFace上的「每日论文」板块每天都有十几篇新出的研究论文这导致一个问题,研究者往往「重视结果」而没有精力来用用代码验证,并且复现很多先前的工作有点「重复造轮子」,浪费研究者的精力。
4/28/2025 9:06:00 AM
新智元

理解 RAG 第五部分:管理上下文长度

传统的大型语言模型 (LLM)存在上下文长度限制,这限制了单次用户与模型交互中处理的信息量,这是其主要局限性之一。 解决这一限制一直是 LLM 开发社区的主要工作方向之一,提高了人们对增加上下文长度在生成更连贯、更准确响应方面优势的认识。 例如,2020 年发布的 GPT-3 上下文长度为 2048 个 token,而其更年轻但功能更强大的兄弟 GPT-4 Turbo(诞生于 2023 年)允许在单个提示中处理高达 128K 个 token。
4/28/2025 9:02:14 AM

科大讯飞:重回双位数增长,AI 大模型竞赛展现强劲实力

近日,科大讯飞发布了其2024年财报,令人振奋的是,该公司营收达到了233.43亿元,同比增长18.79%。 这标志着科大讯飞时隔两年后重新回到了双位数的增长轨道。 同时,归母净利润也达到了5.6亿元,显示出其盈利能力的稳步回升。
4/28/2025 9:00:41 AM
AI在线

ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

论文有两位共同一作。 郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。
4/28/2025 9:00:00 AM
机器之心