AI在线 AI在线

AI

Google 高管证实:数据 “偏袒” 自家 AI,拒绝竞品获取搜索数据

在一场备受关注的法庭听证会上,Google 搜索业务负责人利兹・里德(Liz Reed)向外界揭示了公司对待人工智能(AI)模型数据请求的态度。 她明确表示,尽管 Google 去年已开始向部分 AI 公司开放利用其搜索结果的渠道,但关键的搜索数据仍然优先供给自家的 AI 服务 Gemini,这一证词为反垄断监管机构的调查提供了重要支持。 近年来,美国司法部对 Google 的反垄断调查持续升温,要求该公司共享用于构建搜索结果的大量数据。
5/7/2025 2:00:54 PM
AI在线

NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色

NBC 近日宣布,将在即将到来的 NBA 赛事中使用已故体育解说员 Jim Fagan 的 AI 生成声音。 Fagan 于2017年去世,他的声音曾在1990至2002年期间为 NBC 的 NBA 报道增添了不少风采。 NBC 计划在10月份重新播出 NBA 比赛时,将 Fagan 的 AI 声音运用于选定的片头序列、节目开场及宣传片中。
5/7/2025 2:00:54 PM
AI在线

ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍

Mixture-of-Experts(MoE)在推理时仅激活每个 token 所需的一小部分专家,凭借其稀疏激活的特点,已成为当前 LLM 中的主流架构。 然而,MoE 虽然显著降低了推理时的计算量,但整体参数规模依然大于同等性能的 Dense 模型,因此在显存资源极为受限的端侧部署场景中,仍然面临较大挑战。 现有的主流解决方案是专家卸载(Expert Offloading),即将专家模块存储在下层存储设备(如 CPU 内存甚至磁盘)中,在推理时按需加载激活的专家到显存进行计算。
5/7/2025 1:49:19 PM
机器之心

OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!

王鸿儒目前就读于香港中文大学博士四年级 (预计今年7月毕业),导师为黄锦辉教授,研究方向主要包括对话系统,工具学习以及大语言模型智能体等,英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者,在国际顶级会议如NeurIPS, ACL, EMNLP等发表30余篇相关论文,其中包括10多篇一作或共一论文,代表工作有Cue-CoT, SAFARI, AppBench, Self-DC, OTC等,谷歌学术引用超600次,NeurIPS Area Chair以及多个国际顶级会议审稿人,NICE社区初创成员,曾获得国际博士生论坛最佳论文奖,ACL 2024@SIGHAN 最佳论文奖,WWW2024 Online Safety Prize Challenge冠军等多项荣誉。 Agent 即一系列自动化帮助人类完成具体任务的智能体或者智能助手,可以自主进行推理,与环境进行交互并获取环境以及人类反馈,从而最终完成给定的任务,比如最近爆火的 Manus 以及 OpenAI 的 o3 等一系列模型和框架。 强化学习(Reinforcement Learning)被认为是当下最具想象力、最适合用于 Agent 自主学习的算法。
5/7/2025 1:47:43 PM
机器之心

搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核

本周三,知名 AI 创业公司,曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习,用于编写 CUDA 内核的大模型 Kevin-32B。 Kevin-32B 基于 QwQ-32B 在 KernelBench 数据集上使用 GRPO 进行了多轮强化学习训练,实现了超越 o3 和 o4-mini 的顶级推理表现。 对此,机器学习社区表现出了极大的兴趣。
5/7/2025 1:46:34 PM

英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。
5/7/2025 1:46:23 PM
故渊

谷歌推 I/O 版 Gemini 2.5 Pro 模型,AI 助力前端开发与复杂编程

Gemini 2.5 Pro 能处理文本、音频、图像、视频和代码等多种数据类型,开发者可通过 Gemini API 访问此模型。这次更新不仅提升了性能,还降低了功能调用错误率。
5/7/2025 1:34:25 PM
故渊

Lightricks推出视频新模型LTXV-13B,AI视频生成速度提升30倍、消费级硬件就能跑

Lightricks 公司宣布推出其最新的 AI 视频生成模型 ——LTXV-13B。 这款拥有130亿参数的模型在生成高质量 AI 视频方面速度提升了30倍,并且能够在普通消费级硬件上运行,而无需昂贵的企业级 GPU。   LTXV-13B 的核心技术是 “多尺度渲染”,这一创新方法显著提高了视频生成的效率。
5/7/2025 12:01:06 PM
AI在线

联想发布“天禧超级智能体”:开启混合式AI新纪元

在今日举行的2025联想创新科技大会(Tech World)上,联想集团董事长兼CEO杨元庆携手“联想AI挚友”大张伟,共同探讨AI时代的发展。 他表示,AI正变得越来越强大,但不会取代人类,未来人类拼的是创造力,“要让AI负重前行,人类天马行空”。 大会上,联想正式发布面向个人和企业的“超级智能体”——天禧个人超级智能体。
5/7/2025 12:01:06 PM
AI在线

ComfyUI品牌焕新升级,推出原生API节点

ComfyUI于2025年5月6日宣布完成品牌升级,同步推出原生API节点功能。 这一更新不仅为ComfyUI带来了全新的视觉标识,还通过集成11个主流在线视觉AI模型、65个新节点,显著提升了其图像和视频生成能力。 据官方介绍,用户无需自行申请API密钥,仅需在ComfyUI平台登录即可无缝调用包括Flux.1、Veo2、GPT-Image-1等在内的先进模型。
5/7/2025 12:01:06 PM
AI在线

Asembia AXS25:人工智能将如何重塑处方药配送

在近期举办的 Asembia AXS25峰会上,行业专家们探讨了人工智能(AI)在药房运营中的潜力,尤其是在处方药履行的各个环节。 Harry Travis,The Travis Group 的总裁,在接受《药房时报》采访时,分享了他关于 “AI 对医疗和药房的影响” 的演讲。 他强调,要充分发挥 AI 的优势,药房行业必须解决监管和医保支付方面的挑战。
5/7/2025 12:01:06 PM
AI在线

减肥人士的AI搭子来了!支付宝AI健康管家推出“减重专区”

减重人士有了专属的“AI搭子”!5月7日,支付宝AI健康管家正式上线“减重专区”,推出系列智能体指导用户科学饮食、健康锻炼,此外,还有7位三甲医院多科室减重医生在专区内开设了AI分身,助力全民体重管理。 目前,用户上支付宝搜“AI健康管家”,点击“服务”即可体验。 支付宝AI健康管家-减重专区在专区内,用户可以通过“饮食健康小助手“拍下日常饮食照片,交由AI识别热量并记录,智能体还能根据用户个人情况生成可坚持的、不饿肚子的科学饮食方案。
5/7/2025 12:01:05 PM
AI在线

从BP到复盘全程接管,虎牙AI智能体“虎小Ai”亮相电竞直播

虎牙全新AI智能体“虎小Ai”上线,首次亮相即登陆虎牙最高等级的《英雄联盟》自制赛事“传奇杯”S3,进行全程实时AI解说,标志着直播行业首次将AIGC(生成式人工智能)技术深度融入电竞赛事直播流。 据介绍,“虎小Ai”不仅参与了比赛的实时解说,还覆盖了赛前选人、教练BP(Ban/Pick)分析、战术拆解、赛中解读以及赛后复盘等多个环节,全面实现了赛事直播全链路的AI赋能。 与传统解说相比,“虎小Ai”可提供更加系统化的数据分析与战术洞察,同时兼顾趣味性内容输出,提升观众观看体验。
5/7/2025 12:01:03 PM
AI在线

马斯克 xAI 超算 Colossus 项目被指污染空气:预估 NOx 年排放 1200 至 2000 吨,当地居民强烈抗议

埃隆・马斯克(Elon Musk)旗下 xAI 公司在美国田纳西州孟菲斯市搭建 Colossus 巨型人工智能超级计算机,却引发了当地社区的强烈反对。
5/7/2025 11:17:13 AM
故渊

Cursor宣布免费向学生开放一年Pro会员,助力AI编程教育

AI编程助手Cursor于2025年5月6日宣布了一项重磅举措:即日起向全球学生免费开放为期一年的Cursor Pro会员。 这一福利旨在降低学生使用AI编程工具的门槛,助力编程教育与技术创新。 Cursor的免费政策覆盖包括中国在内的多个国家,学生只需通过教育邮箱和SheerID验证身份,即可享受价值192美元的Pro会员服务。
5/7/2025 11:00:53 AM
AI在线

公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族

在大模型飞速发展的今天,推理能力作为衡量模型智能的关键指标,更是各家 AI 企业竞相追逐的焦点。 但近年来,推理效率已成为模型部署和性能的关键限制因素。 基于此,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。
5/7/2025 10:12:52 AM
机器之心

英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!

英伟达提出「描述一切」模型 (DAM),这是一个强大的多模态大型语言模型,可以生成图像或视频中特定区域的详细描述。 用户可以使用点、框、涂鸦或蒙版来指定区域,DAM 将提供这些区域的丰富且符合上下文的描述。 相关链接论文::::详细的本地化图像和视频字幕详细本地化字幕 (DLC)详细局部字幕 (DLC) 的任务是生成图像中特定区域的全面且情境感知的描述。
5/7/2025 10:10:36 AM

掷30亿美元,OpenAI史上最大收购案!

OpenAI史上最大一笔收购即将敲定。 彭博爆料称,OpenAI将豪掷30亿美元,吞并了爆火编码神器Windsurf(前身为Codeium)。 此前,早有外媒曝出了这笔交易,目前离最终达成接近尾声。
5/7/2025 10:09:28 AM
新智元